Telemedicus

, von

Interview: Digital Fingerprinting

Eine der wichtigsten Technologien für die Zukunft des Internets

Die digitale Rechtsordnung entwickelt sich weiter. Mit jeder neuen Reform werden die Gesetze besser an die Herausforderungen des Internets angepasst. In dieser Hinsicht sind „Digital Fingerprinting“ und „Watermarking“ zwei Schlüsseltechnologien: Sie schaffen erst die Vorraussetzungen, an die neue Reformen anknüpfen können. Beide Techniken dienen dazu, Medieninhalte im digitalen Raum zu identifizieren – und sie auf diese Weise katalogisierbar zu machen. So nutzt z.B. Youtube eine Fingerprinting-Technologie, um illegale Videos aus seinem Portal zu entfernen, die Musiklabels erproben Watermarking als Ersatz für DRM. Mittels der „digitalen Wasserzeichen“ sollen Copyright-Verletzer identifiziert werden.
Die neuen Möglichkeiten, die Digital Fingerprinting und Watermarking bieten, können Reformen in vielfältiger Weise aufgreifen: z.B. für neue Verteilschlüssel für urheberrechtliche Pauschalabgaben oder für neue Methoden des Lizenzerwerbs.

Doch wie weit sind solche Technologien? Wann können wir mit einem massentauglichen Produkt rechnen? Und was könnte so ein Produkt effektiv leisten? Die wichtigsten Fragen zu Digital Fingerprinting beantwortet Raphael Wimmer, Dipl. Medieninformatiker und Wissenschaftlicher Mitarbeiter an der Lehr- und Forschungseinheit Medieninformatik an der LMU München.

Was ist der Unterschied zwischen digitalem Fingerprinting und Watermarking?

Beim Fingerprinting geht es darum, zu erkennen, ob zwei Mediendateien den gleichen oder einen ähnlichen Inhalt haben. Das heißt, der Computer soll einen Medienclip wiedererkennen, auch wenn er leicht manipuliert wurde, zum Beispiel wenn Teile abgeschnitten wurden oder nur ein kurzer Ausschnitt zum Vergleich vorliegt.
Bei Watermarking dagegen verstecke ich zusätzliche Daten in einer Mediendatei, um diese eindeutig zu kennzeichnen.

Wie läuft das auf der technischen Ebene ab?
Bei Fingerprinting wird die Herkunft einer Mediendatei ermittelt, indem eine Signatur von ihr erstellt wird. Diese Signatur kann dann mit einer Datenbank verglichen werden. Diese Fingerprinting-Technologien versuchen dabei im Prinzip so ähnlich zu funktionieren wie die menschliche Wahrnehmung. Also, sich an den gleichen Charakteristika zu orientieren wie der Mensch selbst: bei Musik zum Beispiel Tonhöhe, Lautstärke und Rhythmus; bei Videos Bildinhalte, Farbstimmung, Bewegungen und Schnitte.

Bei Watermarks dagegen verändere ich die Mediendatei, um neue Informationen in sie einzubinden. Ein Watermark soll im Normalfall möglichst unsichtbar sein, damit es den Medienkonsum nicht stört. Damit das Watermark möglichst robust gegen Modifikationen der Mediendatei ist, wird es gerne im Frequenzraum versteckt, das heißt in Tonhöhenschwankungen bei Audio, in Hell-Dunkel-Schwankungen bei Bildern.
Außerdem geht es auch darum, das Watermark möglichst untrennbar mit den Ausgangsdaten zu verweben. Am Besten fügt man das Watermark deshalb in Bereiche ein, in denen relative feine Strukturen und wichtige Bildinhalte vorhanden sind, dann kann das Wasserzeichen nicht so leicht verlustfrei entfernt werden.

Welchen Vorteil hat Watermarking gegenüber herkömmlichem Fingerprinting?

Der Vorteil von Watermarking ist, dass ich ein eindeutiges und einzigartiges Wasserzeichen in eine Mediendatei eincodieren kann, z.B., an wen eine bestimmte MP3-Datei verkauft wurde. Das kann ich durch Fingerprinting nicht ermitteln, da ich so ja nur herausfinden kann, zu welchen anderen Mediendateien diese Datei ähnlich ist.

Watermarking hat aber das Problem, dass ein Watermark auch wieder entfernt werden kann. Bei ganz trivialen Watermarks, z.B. bei einem Logo, das in ein Bild integriert wurde, kann man das schon mit Photoshop wieder entfernen. Bei anderen Wasserzeichen reicht auch schon, die Datei anders zu komprimieren. Je ausgereifter aber ein Watermarking-Algorithmus ist, desto schwieriger wird die Entfernung.

Wie lassen sich solche Watermarks denn wieder entfernen?

Das Watermark kann nur sehr schwer wieder entfernt werden, wenn es gut mit der Ursprungsdatei verwoben ist und nur eine einzige Version der Datei zur Verfügung steht. Hat man aber mehrere Versionen der Datei, auf denen auch verschiedene Watermarks liegen, dann lässt sich recht leicht ermitteln, wodurch diese Versionen sich unterscheiden. Das Watermark kann dann leicht entfernt werden, indem statt der verschiedenen Bytes einfach ein Mittelwert eingesetzt wird. Es kommt dabei aber immer auf den Aufwand an, den man treiben will.
Darum geht es allgemein bei solchen Technologien, sowohl bei Content-Fingerprinting als auch bei Watermarking: Man versucht einfach nur, den Aufwand, solche Sperren zu überwinden, möglichst hoch zu treiben. Die perfekte Lösung gibt es nicht.

So viel zu Watermarking. Was sind denn die bekanntesten Beispiele für Fingerprinting?

Bild-Fingerprinting ist ein relativ alter Schuh. Da gibt es schon lange diverse Suchmaschinen, die eine „Ähnlichkeitssuche“ durchführen können, das ist im Prinzip dasselbe. Aber bei unbewegten Bildern braucht man die Technologie auch nicht unbedingt. Das Geld wird eben mit Video- oder Audiodateien verdient.

Für Audio gibt es mehrere kommerzielle Fingerprinting-Dienste, z.B. Audible Magic, die eine sehr große Datenbank unterhalten und ein sehr umfangreiches Angebot haben.
Auch Video-Fingerprinting-Dienste sind schon länger kommerziell verfügbar. Die großen Hollywoodstudios haben sich kürzlich auf VideoDNA festgelegt, um damit Raubkopien zu ermitteln.

Auf welche Weise wird ein „Fingerprint“ von einer Audiodatei ermittelt?

Die meisten Algorithmen zerstückeln das Lied in kleine Fragmente und untersuchen diese dann darauf, wie laut bestimmte Frequenzen in diesen Fragmenten sind. Man untersucht dabei die Frequenzbänder, die möglichst nah am menschlichen Hören dran sind. Die jeweiligen Messergebnisse verrechnet man dann zu einer Handvoll Zahlen, die einen Code ergeben, der direkt mit der Datenbank verglichen werden kann.
Allerdings kann der Aufbau der Datenbank, mit der man vergleicht, sehr arbeitsintensiv sein. Teilweise geht es dabei um einige Millionen Musikstücke.

Ganz neu ist ja jetzt, dass Google auf Youtube eine Fingerprinting-Technologie einsetzt. Weißt du, wie die funktioniert?

Im Moment ist das nur Audio-Fingerprinting von Audible Magic. Sie untersuchen also nur die Tonspur der Videos. Auf gerichtlichen Druck der Filmstudios hin entwickelt Google momentan ein eigenes Video-Fingerprinting-System. Dieses war zwar für September 2007 angekündigt, zu sehen ist allerdings noch nichts davon.
Bis jetzt weiß noch niemand, wie genau das funktionieren soll. Sicherlich werden sie nicht direkt die Videobilder untersuchen (andernfalls ließe sich eine solche Technologie recht leicht täuschen, z.B. durch Spiegeln des Bildes), sondern zum Beispiel die Abfolge der Schnitte und die Farbstimmung des Videos.
Google versucht, sich davor zu drücken, automatisch Copyright-Verletzungen ausfiltern zu müssen. Sie wollen diese Entscheidung lieber den Rechteinhabern überlassen und ihnen dazu die Fingerprinting-Technik zur Verfügung stellen. Sie schieben quasi den schwarzen Peter an die Rechteinhaber weiter.

Bisher sind Host-Provider gleich welcher Art ja nicht dazu verpflichtet, gegen Rechtsverstöße, die mittels ihrer Dienste begangen werden, präventiv vorzugehen. Die Pflicht zur Entfernung von Rechtsverletzungen („Take Down“) ergibt sich erst ab Kenntnis – also z.B. ab dem Zeitpunkt der Benachrichtigung durch den Rechteinhaber („Notice“). Aber wenn jetzt eine Technologie kommt, die es dem Host-Provider relativ einfach ermöglicht, Copyright-Verstöße zu erkennen – bietet sich nicht an, dann dieses Verfahren zu ändern?

Ich sehe da das Problem, dass es nicht so leicht ist zu erkennen, ob eine bestimmte Mediendatei illegal ist oder nicht. Der Einsteller kann ja z.B. die Rechte haben, eine bestimmte Datei zu verbreiten, z.B. über eine Lizenz…

…oder über eine urheberrechtlichen Schranke, z.B. die Privatkopie…

…und auch kleine Samples dürfen unter bestimmten Umständen verwendet werden – alles vom Urheberrecht gedeckt. Eigentlich müsste so eine Fingerprinting-Software, wenn sie störungsfrei funktionieren soll, das Urheberrecht beherrschen.
Das ist wohl auch der Grund, warum Google bei Youtube die Videos nicht selbst entfernen möchte, sondern die Fingerprinting-Software nur den Rechteinhabern als Unterstützung anbietet.

Siehst du denn noch irgendwelche Einsatzfelder?

Die Daten, die über Fingerprinting gewonnen wurden, können für alle möglichen Zwecke eingesetzt werden, z.B. auch für individuell adressierte Werbung.

Außerdem kann ich Digital Fingerprinting zur automatischen Abrechnung von Medienkonsum verwenden. Das heißt, ich lade mir mein Musikstück von irgendwoher, aus welchen Quellen auch immer, und sobald ich es dann abspiele, wird überprüft, welches Lied das überhaupt ist und die entsprechende Lizenz erworben. Ein solches Modell hätte den Vorteil, dass egal wird, auf welchen Wegen ein Medienkonsument seine Inhalte bezieht. Hauptsache, er bezahlt nachher dafür.
Falls so etwas kommt, wird es aber noch eine Weile dauern. Zum einen, weil es dort viele rechtliche Stolpersteine gibt; zum anderen, weil so eine Maßnahme wohl auch nicht auf hohe Akzeptanz bei den Verbrauchern stoßen würde.

Man könnte so etwas ja auch gut dem Gedanken der „Kulturflatrate“ kombinieren.

Ich persönlich fände es sehr angenehm, wenn ich mir Lieder, die ich sonst nirgends bekomme, einfach über Filesharing besorgen könnte und dann erst nachher die Rechte erwerbe. Man müsste das so aufziehen, dass jeder Rechteinhaber, der Rechte an seinen Inhalten geltend machen möchte, sich bei einer zentralen Datenbank registriert und dort einen Fingerprint seines Werkes abgibt. Danach könnte man dann abrechnen.

Siehst du denn da nicht auch Probleme mit dem Datenschutz?

Das hat natürlich schon so einen ‚Big Brother‘-Touch. Medienkonsum ist etwas sehr privates.

Würdest du denn gut finden, wenn Digital Fingerprinting zur Abrechnung von Medienkonsum kommen würde?

Als Informatiker finde ich die Technologie an sich sehr interessant und nützlich. Andererseits sehe ich das Problem, dass mit solchen Daten natürlich auch Missbrauch getrieben werden kann. Gerade Unternehmen wie Google oder Microsoft sammeln schon sehr viele Daten. Da sollte man abwägen, wieviele zusätzliche Einblicksmöglichkeiten in die Privatsphäre unbedingt noch geschaffen werden müssen.

Danke für das Interview.

, Telemedicus v. 27.09.2007, https://tlmd.in/a/422

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Newsletter

In Kooperation mit

Kommunikation & Recht

Hosting

Domainfactory