„Öffentliche Daten nützen, private Daten schützen.“ (CCC hackerethics)
Während sich die Debatten im Internet lange mit dem zweiten Teil dieses alten Satzes beschäftigten, rückt langsam auch der Erste wieder ins Bewußtsein. Open Data oder auch Open Government sind die Schlagworte, unter denen mehr Transparenz und Offenlegung von (vor allem) staatlichen Stellen gefordert werden. Ob statistische Erhebungen, Budgets oder Geoinformationen – wenn Daten öffentlich gemacht werden, ermöglichen sie Information, Kontrolle und Teilhabe von Bürger_innen im Staat.
Also, Daten einfach freigeben und alles wird super? So einfach ist das nicht, wie vor kurzem ComputerWeekly anmerkte. Um wirklich etwas verbessern zu können, müssten einige Voraussetzungen erfüllt werden. Ansonsten droht auch die Open Data-Bewegung, nur bestehende Machtverhältnisse zu festigen und soziale, wie digitale Unterschiede zu vertiefen.
Zum Einen bedürfe es verwertbarer Formate, in denen die Daten ausgegeben werden. Wie man „offene Daten“ ziemlich unbenutzbar machen kannte, hat zuletzt Facebook demonstriert. Als Student Max Schrems seine Daten einforderte, bekam er eine CD mit 1.222 Seiten im PDF-Format zugesandt. Durchzulesen sind soviele Seiten kaum und die Nutzung aus einem PDF heraus ist äußerst aufwendig. In konkreten Fall war ein Programmierer eine Woche beschäftigt, die Daten aufzubereiten, um die Weiterverarbeitung zu ermöglichen.
Hier wird bereits das zweite Problem deutlich: Bisher ist die Nutzung und Verarbeitung von offenen Daten fast ausschließlich Programmierer_innen vorbehalten. Einem gesellschaftlich breit angelegtem Umgang steht nötiges Spezialwissen entgegen. Ändert sich an dieser Stelle nichts, festigt sich der Status der „Informationshüter_innen“ nur weiter. Verloren gehen kreative Ansätze von „außen“, wie auch Umsetzungen in Gemeinschaften – von den Betroffenen selbst.
Über die maschinenlesbare und einfach zu verwendende Formate ist die Diskussion schon eine Weile im Gange. Ebenfalls angekommen sind Überlegungen zum Spannungsfeld, was veröffentlicht werden darf und was nicht. Nur die Frage, wer eigentlich mit den Daten umgehen kann und wie möglichst viele Menschen einbezogen werden können, wird bisher verdrängt. Dabei sind gerade hier neue Ideen und Ansätze nötig, um die Möglichkeiten von Open Data ausnutzen zu können.
Das ist auf jeden Fall sinnvoll, die Daten maschinenlesbar zu veroeffentlichn. Aber die Nutzung der Daten wird dann immernoch bestimmten Leuten vorbehalten sein. Zum einen will die Software auch bedient werden (wenn man mal schaut wieviele Leute schon in SPSS Probleme haben die richtigen Knoepfe zu finden…) zum andern sollten wenigstens noch statistische Grundkenntnisse vorhanden sein. Ich hatte mal einen gesehen, der wollte Kriminalstatistiken von NRW nachrechnen, da die offiziellen Statistiken ja offensichtlich zugunsten von Auslaendern beschoenigt werden (angeblich). Da kann man sich ja schon denken was dabei rauskam. Der hatte wohl auch noch nie was von Scheinkorrelation gehoert.. das Schlimmste dabei war aber noch, dass er das noch veroeffentlicht hat und das viele Leute sehen konnten, von denen einige das noch geglaubt haben. Das ist vielleicht auch ein Problem, dass jeder Chaot potentiell viele Leute erreichen kann, mit dem was er sagt.
Nichtsdestotrotz ist das sinnvoll, die Daten zu veroeffentlichen. Ich finde man kann da durchaus noch einen Schritt weiter gehen und insb bei wissenschaftlichen Veroeffentlichungen den Programmcode zu veroeffentlichen, mit dem die Ergebnisse nachvollzogen werden koennen.
Naja hoffe, das war jetzt nicht zu sehr am Thema vorbei..
@Dominik: Die Gefahr, dass Daten falsch interpretiert wird, besteht natürlich immer. Aber auch jetzt schon, wenn Daten nur von Politiker_innen und vllt noch Journalist_innen verwendet werden. Und genau deshalb sind mehr Bildungsansätze so wichtig: Damit jede_r sich selbst ein Bild machen und die Interpretation beurteilen kann.
Die Lösung des Problems mit den Daten besteht zum Beispiel darin, eine Software zu schaffen, die Daten in Kontext setzen kann:
Wie zum Beispiel Gampminder: http://www.gapminder.org/
Angestossen von Hans Rosling
@BadHairDays
Danke für den Link, den hatte ich irgendwo verloren und das ist wirklich spannend.
Im Kontext dieses Artikels muss ich aber anmerken, dass schon profunde statistische Kenntnisse erforderlich sind, um die Daten (die ja bereits aufbereitet sind) auszuwerten und zu bewerten.
So ist etwa bei Wealth&Health of nations im Standard eine Achse Linear und eine Logarithmisch. Nicht schlimm wenn mensch es weiß und weiß wo man es umstellen kann. Wer über wenig statistische Kenntnisse verfügt, den kann das ganz schön verwirren.