Veröffentlicht am Schreib einen Kommentar

Neun Geschichten, neun Netzwerke

Daniel Kehlmanns RUHM (2009) besteht aus neun einzelnen Geschichten, Episoden, deren Figuren teils überlappen bzw. in einer Beziehung zueinander stehen – sei es, dass Leo Richter, ein Schriftsteller, in der einen Geschichte von einer seiner Romanfiguren erzählt, es sich bei einer anderen dann um die Geschichte ebendieser Romanfigur handelt, oder dass eine Geschichte das Doppelleben eines Abteilungsleiters einer Telekommunikationsfirma schildert, dessen einer Mitarbeiter dafür verantwortlich ist, dass eine Rufnummer nicht korrekt vergeben wurde, was sich wiederum in anderen Geschichten folgenreich widerspiegelt. Zwanzig Figuren konnte ich bereits 2013 als auf derartige Weisen miteinander verstrickt identifizieren und diese Verstrickung mittels einer Netzwerkvisualisierung anschaulich darlegen.

Was ich nun näher anschauen möchte, sind die jeweiligen Personennetzwerke der einzelnen Geschichten. Hierfür habe ich alle vorkommenden Figuren und ihre Beziehungen innerhalb einer Episode erfasst und mit gephi visualisiert. Die zwanzig als zentral identifizierten Figuren haben Profilbilder erhalten, alle anderen werden durch farbige Kreisflächen dargestellt. Die Farbe der Kreisflächen entspricht den 2013 zugewiesenen Kapitelfarben. Die Art der Beziehungen – Ehe, Liebesbeziehung, Gespräch, Blickkontakt etc. – habe ich (noch) nicht gewichtet, so dass die Verbindungslinien alle gleich dick sind und so nur die Anzahl, nicht aber die Art der Beziehung auf die Größe der Knoten im Gesamtgefüge zurückwirkt. Als Algorithmus für die Anordnung habe ich mich für Fruchtermann-Reingold entschieden, da das entstehende Layout gut vergleichbar ist.

Im Vergleich ermöglichen es diese Visualisierungen einen Überblick über die Dichte der jeweiligen Personennetzwerke und die Verteilung der zentralen Figuren zu gewinnen. So ist z.B. auffällig, dass Miguel Auristos Blancos, Autor moderner Erbauungsliteratur, in fast jeder Geschichte am Rande mitspielt, insofern alle seine Bücher lesen, er in seiner eigenen Geschichte – Antwort an die Äbtissin – jedoch nur ein sehr kleines Netzwerk besitzt, in dem keine anderen zentralen Figuren vorkommen. Ähnlich verhält es sich mit Rosalie in Rosalie geht sterben und Maria Rubinstein in Osten, gegenteilig hingegen in Ein Beitrag zur Debatte, einer Episode des Buches, in der viele Fäden zusammenlaufen.

Stimmen
STIMMEN
In Gefahr
IN GEFAHR
Rosalie geht sterben
ROSALIE GEHT STERBEN
Der Ausweg
DER AUSWEG
Osten
OSTEN
Antwort an die Äbtissin
ANTWORT AN DIE ÄBTISSIN
Ein Beitrag zur Debatte
EIN BEITRAG ZUR DEBATTE
Wie ich log und starb
WIE ICH LOG UND STARB
In Gefahr II
IN GEFAHR II
Veröffentlicht am Schreib einen Kommentar

What makes a helpful visualization?

Today I would like to show that visualizing results with gephi can be helpful but that not every kind of visualization algorithm implemented in gephi matters for gaining more insight. Helpfulness depends on what you would like to show! So let’s have a closer look on my use case for that!

As you may know, I write my PhD thesis about multiscreen installations. One of my favorite examples is THE HOUSE – a work of the finnish artist Eija-Liisa Ahtila that exists in two versions: a single screen version for presentation in the cinema and a multiscreen version with three projections for presentation in the gallery or museum space. Her distribution strategy opens up a lot of questions, all about what’s the difference between the two versions.

Single screen and multiscreen version have the same length (around twenty minutes). That means if you have three instead of one screen you can show three times as much. The question raises: Which of the images used in the single screen version are popping up again in the multiscreen version? And in particular: On which screen they do that?

Kanalvergleich_Übersicht_unten_zugeschnitten

Having extracted the first scene (around one minute: 1742 frames) I came to a unique result with help of Daniel Kurzawe and his application of an automatic image recognition algorithm (that is a topic for itself – paper coming soon): Most images of the single channel version reappear on the middle screen of the multiscreen version!

Using Fruchtermann-Reingold for visualizing our result I got a visualization that shows what I would like to show:

Kanalvergleich_Fruchtermann-ReingoldThe 1742 images of the single screen version (white dots) are either connected with the left, middle or right screen node (reddish dots) or aren’t connected to anything. Left, middle and right screen node grow with the number of connecting lines. The thickness of those edges again depends on how much the images resemble to each other (that’s because of our image recognition algorithm doesn’t say similiar/not similiar but gives a degree of similiartiy).

In another way also YifanHu shows the dispersion but for my flavor it is too remindful of a bacteria culture in a petri dish:
Kanalvergleich_YifanHu2

And last but not least some other visualizations I generated with gephi that are beautiful in a special sense but don’t own explanatory power because details got lost or their alignment seems too random: