Rez: „Ein Bild sagt mehr als tausend Pixel“

Ich hatte am Wochenende schon auf Twitter auf den Aufsatz Ein Bild sagt mehr als tausend Pixel? Über den Einsatz digitaler Methoden in den Bild- und Objektwissenschaften von Ruth Reiche, die auch twittert, und Celia Krause hingewiesen. Da ich aber glaube, dass der Hinweis alleine dem wie ich finde spannenden Text nicht gerecht wird, meine ich jetzt noch ein bisschen rum. Das wird keine wissenschaftliche Auseinandersetzung (dann dürfte ich auch nicht zur Wikipedia linken), sondern mal wieder ein Zusammenführen von Dingen, über die ich unter anderem im bisherigen Studium gestolpert bin. Ihr guckt mir also quasi beim Denken zu. Theoretisch könnte ich über jeden Text, den ich für die Uni lese, einen derartigen Blogbeitrag schreiben, denn für mich ist immer noch alles neu und toll und aufregend, und ich freue mich bei jedem Text über Wissensinseln, die mir bekannt vorkommen und an denen ich andocken kann.

Krause und Reiche wollen mit ihrem Aufsatz „die mit Bildern arbeitenden Wissenschaften in der Landschaft der Digital Humanities verorten“, indem sie „aktuelle Potentiale der Bildverarbeitung ausloten“ und „die Arbeit mit digitalen Bilddaten ansprechen“ (1). Sie beginnen mit einem Vergleich zwischen Text- und Bildwissenschaften. In Texten ließen sich digitale Hilfsmittel besser einsetzen, da Texte „nach standardisierten Regeln erfasst und ausgezeichnet“ (2) sind. Bilder und Objekte wie Statuen hingegen folgten keinen Mustern und seien daher schwerer auszuwerten.

Aber wieso müssen Bilder überhaupt ausgewertet werden? „In Analogie zum Begriff des linguistic turn forderte man damals die Hinwendung zu einer Bildwissenschaft, die sich an den praktizierten Methoden und Fragestellungen der allgemeinen Sprachwissenschaft orientieren und auch interdisziplinäre Ansätze verfolgen sollte. Die Funktionen von Bildern sollten sich nicht darin erschöpfen, in ihnen eine bloße Abbildung der Wirklichkeit oder eine dem Text untergeordnete Illustration zu sehen.“ (3) Auf den linguistic turn folgte der iconic turn, bei dem Bildern ein ähnliches „semantisches System“ (4) wie Worten zugrunde gelegt wurde.

Auf den iconic turn bin ich bei meinem Referat über Felix Thürlemanns Text Nicolas Poussin – „Die Mannalese“. Staunen als Leidenschaft des Sehens gestoßen, an dem ich fast verzeifelt wäre. Thürlemann nutzt einen semiotischen Ansatz für das Bildverständnis – im Gegensatz zu etwa einem soziologischen oder feministischen Ansatz. Semiotik ist allerdings für mich ein Buch mit siebenhundert Siegeln und ihre für mich schwer nachvollziehbaren Erkenntnisse auf ein Bild anzuwenden bzw. überhaupt den Text zu verstehen, hat mich ein paar konzentrierte (aber natürlich lohnende) Nachmittage in der Bibliothek gekostet. (Hier steht eine kürzere Fassung des Textes, in dem Thürlemann auf das titelgebende „Staunen“ eingeht, das aber nicht semiotisch begründet. DEN TEXT hätte ich eher verstanden.) Thürlemann entschlüsselt das Bild aufgrund dreier Erzählebenen, die mit der Figurengruppe am linken Bildrand beginnt: die Caritas Romana, in der eine junge Frau nicht ihr Kind stillt, sondern eine ältere Person, um sie vor dem Hungertod zu retten. Diese Gruppe ist quasi die Anleitung, wie das ganze Bild der Mannalese zu verstehen ist: Gott rettet die Israeliten vor dem Hungertod, indem er Manna regnen lässt. Die dritte Erzählebene ist übergeordnet: Die Mannalese weist auf das Wunder der Eucharistie hin, in der wir als Gläubige ebenfalls durch Nahrung (Abendmahl) gerettet werden. Wir beginnen also mit einem wunderbaren Ereignis (Caritas Romana, eine antike Darstellung), erkennen das Wunder (Mannaregen, Altes Testament) und verstehen schließlich das Mysterium (Eucharistie, Neues Testament). Und wenn sich das in Kurzfassung schon kompliziert anhört, dann lest mal den gesamten Text.

Krause und Reiche weisen darauf hin, dass in der Bildwissenschaft meist das Abbild eines Kunstwerks anstatt das Werk selbst die Grundlage für eine Beschäftigung mit ihm ist (genau wie hier der Link zur Mannalese steht anstatt eine Anleitung zum schnellen Beamen in den Louvre, um das Bild im Original zu sehen). Sie erwähnen Walter Benjamins Aufsatz Das Kunstwerk im Zeitalter seiner technischen Reproduzierbarkeit (♥), der bereits vor 80 Jahren darauf hingewiesen hat, dass einem Abbild stets die Aura des Originals fehle. Digitale Abbilder von Kunstwerken hätten dafür aber andere Vorteile: Sie zerlegten das Ausgangsmaterial in Daten, die mit Metainformationen angereichert werden können. Das heißt, diese Daten können nicht nur betrachtet, sondern weiterverarbeitet und ausgewertet werden. Als positives Beispiel eines digitalen Abbilds verweisen die Autorinnen zum Beispiel auf Digitalisate von mittelalterlichen Handschriften, die man als Datei schonender für das brüchige Ausgangsmaterial und vor allem in ungleich größerer Auflösung betrachten kann. Ein weiteres Beispiel ist das Google Art Project, durch dessen hohe Auflösung und Erreichbarkeit per Mausklick dem Betrachter eine genussvolle Rezeptionserfahrung zur Verfügung stehe, die ihm im Museum nicht möglich wäre.

Um nun Objekte digital erfassbar zu machen, müssten sie, genau wie Wortdateien, in ihre Bestandteile zerlegt werden. Krause und Reiche erwähnen den Kabarettisten und Aktionskünstler Ursus Wehrli, der in seinen Büchern Kunst aufräumen genau das schon erledigt habe. Ich habe sehr über das Zitat zum Buch „Klarheit schaffen, wo es am wenigsten Sinn macht“ gelacht.

Herrn Wehrli kenne ich aus einem anderen Zusammenhang, denn Kunst aufräumen (TED-Talk) ist natürlich viel zu clever als dass die Werbung nicht was daraus macht. Die Kampagne für Bisley-Büromöbel hat so ziemlich alles gewonnen, was es zu gewinnen gibt. Sieht auch hübsch aus, ist aber gnadenlos geklaut.

Die Autorinnen belegen anhand von Kunst aufräumen und einem Baselitz-Porträt die Fehlbarkeit, aber gleichzeitig auch die Nützlichkeit von computererfassten Bilddaten (Abschnitte 18 bis 24 – die solltet ihr euch wirklich durchlesen, das ist sehr clever und nachvollziehbar. Und es gibt was zu Gucken). In Abschnitt 29 wird’s dann noch spannender, denn da werden die Werke von Mondrian und Rothko visualisiert. Krause und Reiche zitieren Lew Manowitsch, der „mit Hilfe von ImagePlot, einem vom Software Studies Lab entwickelten Macro für das frei verfügbare Bildanalyse-Tool ImageJ, die Entwicklung visueller Merkmale innerhalb eines Bilddatensets“ (5) darstellen kann. Wo man auf den ersten Blick glaubt, die beiden Maler würden sich stilistisch ähneln – was wir mal verneinen –, erkennt man beim genaueren Hinsehen eine zeitliche Abfolge, in der sich die Farbigkeit der Werke entwickelt. Ich fand es sehr spannend, eine künstlerische Entwicklung in einem Screenshot erkennen zu können.

In weiteren Abschnitten wird auf Data Driven Art eingegangen, eine für mich gerade sehr attraktive Kunstform. Das angesprochene Beispiel ist Jason Salavon und sein Werk MTV’s 10 Greatest Music Videos of All Time von 2001, das die Farbstimmung der Videos wiedergibt. Was ich faszinierend fand: Ohne ein einziges Bild zu erkennen, hat man die Videos sofort vor Augen.

Der Aufsatz gibt dann eine Übersicht über verschiede Anwendungsmöglichkeiten von digitalen Instrumenten, entweder zur „Erfassung und Erschließung“ oder zur „Analyse und Auswertung“ (6). Eines davon ist zum Beispiel die Emblematica Online, eine Kooperation zwischen der University of Illinois und der Herzog-August-Bibliothek in Wolfenbüttel. Ein Emblem besteht aus einem Motto (Lemma), einem Bild (Icon) und einem Text (Epigramm), und als wir an der Uni über Embleme als Kunstrichtung sprachen, fiel mir mal wieder der Zusammenhang mit der Werbung ein, denn klassische Anzeigen funktionieren genauso: aussagekräftige Headline, starkes Bild, kurze Copy. Wir Werbefuzzis klauen echt alles.

Ein weiteres Beispiel: What Makes Paris Look Like Paris? In der zitierten Arbeit untersuchten Forscher, ob sich Städte anhand visueller Elemente erkennen lassen und nutzten dazu Bilder von Google Street View. Diese Arbeit wäre in Deutschland also nicht möglich gewesen. Keine Ahnung, ob Berlin wirklich wie Berlin aussieht, wenn alles verpixelt ist.

Mein Liebling: FACES – Faces, Art, and Computerized Evaluation Systems, ein Projekt, das Gesichter erfasst, um Muster in Bilddatenbanken zu finden. Logisch. Bereits im ersten Semester übermannte mich die Panik, niemals genug Bilder gesehen haben zu können, um wirklich Vergleiche anzustellen oder Verbindungen zu erkennen. Wie toll wäre es, ein Programm zu haben, das mal eben das ganze Mittelalter nach Ähnlichkeiten durchforstet? Wobei diese Ähnlichkeit gerade den gemalten Damen wieder zum Verhängnis werden könnte, denn die sollten damals – spätestens seit Botticelli – hauptsächlich hübsch sein (und daher sehen sie alle gleich belanglos aus – hey, ganz wie heute mit Photoshop). Eine Frau, die Ghirlandaios Bild eines Großvaters entspricht, wird man vermutlich deutlich schwerer finden, denn gerade in der Renaissance galt die irrwitze Annahme, dass ein guter Mensch auch so aussehe und böse Menschen daran zu erkennen seien, dass sie eben äußerlich nicht ganz so schnuckig sind. Manchmal glaube ich, diese Annahme hat sich bis heute ganz gut gehalten.

Den Schluss des Aufsatzes bildet ein Ausblick bzw. ein Katalog an Wünschen und Erwartungen an die digitale Kunstwissenschaft. Ich zitiere aus Abschnitt 51 und 52:

„Da die digitalen Bildwissenschaften aufgrund der hohen technischen Komplexität im Umgang mit Bilddaten momentan gegenüber den über schriftsprachliche Texte forschenden Wissenschaften noch im Rückstand stehen, sind Fragen nach der Übertragbarkeit digitaler Methoden und Verfahren von hohem Interesse. Zum einen ist danach zu fragen, welche Methoden und Verfahren, die bisher vornehmlich im Bereich der Philologien erarbeitet wurden, auf den Gegenstandsbereich der Kunst- und Objektwissenschaften übertragen werden können, zum anderen, wo die Grenzen dieser Übertragbarkeit liegen und disziplinspezifische Überlegungen geschehen müssen.

Bei der Etablierung der Fächer Digitale Kunstgeschichte und Digitale Archäologie wäre es aus unserer Sicht wünschenswert, wenn die jeweiligen Fachgemeinschaften zumindest in größeren Teilen ähnliche Wege beschreiten und sich zunächst auf ihre speziellen Eigenschaften als Bild-/Objektdisziplinen in Abgrenzung zu den Text-/Sprachdisziplinen besinnen würden. Auch ein Austausch mit der Bibliothekswissenschaft, bei der Fragen der Erschließbarkeit und Aufbereitung im Vordergrund stehen, sollte als ein Bestandteil digitaler Fächer erwogen werden.“

Und als Rausschmeißer der Rausschmeißer:

„Abschließend lässt sich konstatieren, dass im Einsatz digitaler Methoden starke Potentiale für die Bild- und Objektwissenschaften verborgen liegen. Mit ihrer Anwendung unternimmt man bereits einen ersten wichtigen Entwicklungsschritt in Richtung einer digitalen Wissenschaft. Eine transdisziplinäre digitale Bildwissenschaft in dem Sinne wird es unserer Einschätzung nach jedoch kaum geben, denn jede Fachgemeinschaft (Kunstgeschichte oder Archäologie) wird aller Voraussicht nach ihren eigenen Weg finden und computerunterstützte Forschung auf individuelle Fragestellungen hin ausrichten. Dem teils immer noch verbreiteten Vorurteil, dass sich aus digital vorliegenden Bildern keine nennenswerten Informationen über den Bildinhalt extrahieren lassen, sondern allein über händisch von Fachexperten erstellte Metadaten gearbeitet werden muss, kann entgegengesetzt werden, dass man relevante Metadaten heutzutage nicht nur mit Hilfe einer ›Crowd‹, sondern sogar aus den Bildinformationen selbst generieren kann. Ein digitales Bild lässt sich also nicht nur in einzelne Pixel zerlegen, sondern es können über eine Analyse der Anordnung bzw. Verteilung dieser Bildpunkte Informationen über den Bildinhalt gewonnen werden, was weit über die Feststellung, ein digitales Bild sei eine Ansammlung von Bildpunkten, hinausgeht. Wir können also die eingangs aufgeworfene Frage, ob ein (digitales) Bild mehr sagt als tausend Pixel, getrost mit einem ›Ja‹ beantworten.“ (7)

(1) Vgl. zu den ersten drei Zitaten Krause, Celia/Reiche, Ruth: „Ein Bild sagt mehr als tausend Pixel? Über den Einsatz digitaler Methoden in den Bild- und Objektwissenschaften“, in: Kunstgeschichte. Open Peer Reviewed Journal, 2013 (urn:nbn:de:bvb:355-kuge-354-6); http://www.kunstgeschichte-ejournal.net/354/ (abgerufen am 10. Februar 2014), Abschnitt 2.
(2) Ebd., Abschnitt 3.
(3) Ebd., Abschnitt 4.
(4) Ebd.
(5) Ebd., Abschnitt 29.
(6) Ebd., Abschnitt 36.
(7) Ebd., Abschnitt 56.