Arme missbrauchte Klickstrecke

WELT ONLINE braucht wohl dringend jemanden, der ihnen Infografiken bastelt. Einen schlechteren “Überblick” über Zahlen als in diesem Artikel hat es seit Menschengedenken noch nicht gegeben.

WELT ONLINE braucht wohl dringend jemanden, der ihnen Infografiken bastelt. Einen schlechteren “Überblick” über Zahlen hat es seit Menschengedenken noch nicht gegeben. Hätten die nur mal was gesagt.. Quelle: http://www.welt.de/politik/deutschland/article11142073/Grossfamilien-sind-die-Verlierer-des-Elterngeldes.html

Dabei wäre es so einfach gewesen. Fünf Minuten Arbeit reichen aus, um mit OpenOffice Calc ein nettes kleines Diagramm aus der Zahlenkolonne zu basteln..


Datavis vs. Infovis – Zwischen Kunst und Journalismus

Die Begriffe Datenvisualisierung und Informationsvisualisierung werden mitunter synonym gebraucht, was mich zwar relativ wenig stört und in der Regel auch niemandem schadet. Allerdings bergen unklare Begriffsdefinitionen auch das Potential für Verwirrungen und Missverständnisse. Allen Interessierten, denen sich der Unterschied zwischen Daten- und und Informationsvisualisierung noch nicht voll erschließt, möchte ich hier mal meinen Beitrag zum besseren Verständnis anbieten.

Beginnen wir zunächst mal mit der formalen wissenschaftlichen Abgrenzung.

Informationsvisualisierung in der Informatik

In der Informatik sind die Begriffe Datenvisualisierung und Informationsvisualisierung recht klar voneinander getrennt. Kurz gesagt sind Daten eigentlich alles, was sich in Bits und Bytes speichern lässt. Datenvisualisierung sind einfach alle möglichen Formen und Techniken der Generierung von Bildern (und Bewegtbildern) aus Daten. Je nach Art der visualisierten Daten ergeben sich dann die unterschiedlichen Teilbereiche. Visualisiert man z.B. Geodaten, landet man im Arbeitsfeld der Geovisualisierung, visualisiert man hingegen medizinische Datensätze (z.B. MRT-Daten) ist man bei dem medizinischen Visualisierungen usw.. Das Feld der Informationsvisualisierung ist in diesem Kontext der Teilbereich der Datenvisualisierung, der sich mit abstrakteren, d.h. von der messbaren Umwelt losgelösten Daten beschäftigt.

Vor diesem Hintergrund ist der Unterschied zwischen Datenvis. und Infovis. relativ unspektakulär und beruht rein auf der strikten wissenschaftlichen Definition.

Daten und Informationen im Kontext der Informationstechnik

Spannender finde ich dann schon eher den folgenden Ansatz: Um Informations- und Datenvisualisierungen zu unterscheiden, schaut man sich zunächst den Unterschied der einzelnen Begriffe Information und Daten an. Im Kontext der Informationstechnik ist eine Information eine “im engeren Sinne eine geordnete Abfolge von Symbolen, deren Bedeutung der Empfänger entschlüsselt1. Die angesprochene geordnete Abfolge von Symbolen würde in diesem Beispiel im wesentlichen die Daten darstellen. Eine Information besteht aus also Daten, die für sich betrachtet aber keinen Informationsgehalt besitzen. Dieser entsteht erst im Zusammentreffen der Daten mit einem Mensch, der den Daten eine Bedeutung beimisst. Das zugrundeliegende Modell lässt sich in etwa wie folgt darstellen:

Übertragung auf Daten- und Informationsvisualisierungen

Daraus kann man nun folgenden Unterschied ableiten: Datenvisualisierungen sind solche Visualisierungen, die zwar einen (großen) Datensatz darstellen, aber dem Betrachter keine oder kaum relevante Informationen offenbaren. Die Visualisierung kann dabei durchaus auf hohem gestalterischem Niveau stattfinden, aber man ist nach dem Betrachten so schlau wie vorher. Dementsprechend wäre eine Informationsvisualisierung ein Sonderfall der Datenvis., bei dem es gelingt, für den Betrachter relevante Informationen sichtbar zu machen.

Natürlich ist diese Definition sehr subjektiv. Was für den einen Betrachter eine relevante Information darstellt kann ein anderer Betrachter als komplett unwichtig einstufen. Daher würde ich die Unterscheidung schon im Gestaltungsprozess ansetzen. Damit landen wir bei der wichtigen Frage der Intention, die hinter einer Visualisierung steht. Wenn z.B. im Vorfeld künstlerisch gestalterische Aspekte im Vordergrund stehen, kommt vermutlich eine Datenvisualisierung heraus. Steht hingegen etwa die Gewinnung von Einsichten in komplexe Sachverhalte im Vordergrund, landen wir eher bei den Informationsvisualisierungen.

Damit wären wir dann bei der folgenden schematischen Einordnung der Begriffe zwischen den Polen Kunst und Journalismus:

Wo sich welche Visualisierung letztlich einordnen lässt, ist in den wenigsten Fällen eindeutig. Es kommt immer darauf an.

Nachtrag:

Gerade habe ich bei FFunction eine schöne Infografik zum Thema “What is Data Visualization” gesehen. Geht ein bisschen in dieselbe Richtung, wobei Information Visualization als Begriff gar nicht auftaucht.

Infografik zu Bundestags­abstimmungen

How does it look like if one would put all votings of a German Bundestag session and the majory stakes of each party on one single screen? What insights will be provided by such visualization? That was what I asked myself on the last weekend – after the Bundestag defeated a bill on country-wides popular votes. Yesterday I created my fist version of the bill votings infographic. The data was kindly provided by abgeordnetenwatch.de.

Please click on the preview images to view the full sized versions.

Namentliche Abstimmungen des 17. deutschen Bundestages

Namentliche Abstimmungen des 16. deutschen Bundestages

Details zu den Grafiken

Die Abstimmungen sind in chronologischer Reihenfolge übereinander angeordnet. Die Parteien werden zu jeder Abstimmung nach ihrer Zustimmungsrate angeordnet, die sich wie folgt berechnet:

z = (Anzahl Ja-Stimmen * 1 + Anzahl Nein-Stimmen * -1) / Gesamtzahl Abgeordneten

Die Größe der Partei-Symbole ist proportional zu der Anzahl der gewählten Abgeordneten, um auch optische die Gewichtung der Partei im Bundestag anzudeuten. Weiterhin lässt sich an dem horizontalen grauen Balken die Gesamtzustimmung des Bundestags zu jeder Abstimmung ablesen. In der rechten Spalte befinden sich noch das Datum und die Anwesenheitsrate der Abstimmung (Anzahl anwesender Abgeordneter / Gesamtzahl der Abgeordneten).

Die aufbereiteten Daten zu den Abstimmungen wurden freundlicherweise von abgeordnetenwatch.de zur Verfügung gestellt. Für Feedback und Flattr-Klicks bin ich wie immer dankbar.

Wie sieht es aus, wenn man alle namentlichen Bundestagsabstimmungen einer Legislatur inklusive der zustande gekommenen Mehrheitsverhältnissen je Partei in einer Grafik unterbringt? Was lässt sich aus solchen Visualisierungen ablesen? Fragen dieser Art haben mich vergangenes Wochenende beschäftigt, nachdem in der 72. Bundestagssitzung erneut ein Gesetztesentwurf zur Einführung bundesweiter Volksentscheide abgelehnt wurde. Gestern habe ich mich dann mal einer Infografik zu diesem Thema versucht. Die aufbereiteten Daten zu den Abstimmungen wurden freundlicherweise von abgeordnetenwatch.de zur Verfügung gestellt.

Bitte auf die Vorschaubilder klicken, um die Infografiken in der vollen Größe zu sehen.

Namentliche Abstimmungen des 17. deutschen Bundestages

Namentliche Abstimmungen des 16. deutschen Bundestages

Details zu den Grafiken

Die Abstimmungen sind in chronologischer Reihenfolge übereinander angeordnet. Die Parteien werden zu jeder Abstimmung nach ihrer Zustimmungsrate angeordnet, die sich wie folgt berechnet:

z = (Anzahl Ja-Stimmen * 1 + Anzahl Nein-Stimmen * -1) / Gesamtzahl Abgeordneten

Die Größe der Partei-Symbole ist proportional zu der Anzahl der gewählten Abgeordneten, um auch optische die Gewichtung der Partei im Bundestag anzudeuten. Weiterhin lässt sich an dem horizontalen grauen Balken die Gesamtzustimmung des Bundestags zu jeder Abstimmung ablesen. In der rechten Spalte befinden sich noch das Datum und die Anwesenheitsrate der Abstimmung (Anzahl anwesender Abgeordneter / Gesamtzahl der Abgeordneten).

Für Feedback und Flattr-Klicks bin ich wie immer dankbar.

Ergänzung:

Wie und warum wir die Tweets für die Live Map archivieren

Für das Twitter Live Map Experiment habe ich mich in der letzten Woche etwas ausführlicher mit der Twitter API auseinandergesetzt. Da Twitter die öffentliche Timeline und insb. die Suchfunktion nur für einen begrenzten Zeitraum zur Verfügung stellt, war es notwendig selbst ein Archiv von relevanten Tweets anzulegen. In unserem Fall gibt es ein PHP-Cronjob der regelmäßig die Twitter-API anfunkt und die Ergebnisse in einer Datenbank speichert.

Continue reading