top of page

Daten in der Plattformökonomie: Primäre Eigenschaften von Daten I

  • Writer: Ralf Dewenter
    Ralf Dewenter
  • Dec 6, 2021
  • 5 min read


Sowohl das Gesetz gegen Wettbewerbsbeschränkung (GWB) als auch der Entwurf des Digital Markets Act (DMA-E) betonen die besondere Rolle, die Daten in Plattformmärkten einnehmen. Und auch wir haben an der einen oder anderen Stelle schon auf die Relevanz von Daten für Plattformen hingewiesen (z. B. hier). Aus wettbewerblicher Sicht, können Daten einen Wettbewerbsvorteil bedeuten, eine Marktzutrittsbarriere darstellen oder sogar so bedeutsam sein, dass ein Marktzutritt unmöglich wird. GWB und DMA-E sehen daher auch verschiedene Maßnahmen (wie z. B. den Zugang zu Daten oder die Datenportabilität) vor, um die negativen Auswirkungen auf den Wettbewerb zu begrenzen.


Um die besondere Relevanz der Daten richtig einschätzen zu können, ist es hilfreich, sich deren primären und sekundären Eigenschaften einmal genauer anzusehen. Daten werden zwar oft als relevante Größe in Plattformmärkten erkannt, aber nicht selten als eine homogene Masse wahrgenommen, aus denen alles Mögliche herausgelesen werden kann. Plattformen müssten nur genug Daten sammeln, um damit wettbewerbsfähig oder sogar marktmächtig zu werden. Tatsächlich sind sie aber durchaus heterogen und weisen eine Reihe von Eigenschaften auf, die es lohnt, sich genauer anzusehen. Alle diese Eigenschaften sind bei der Vielzahl an Daten, die existiert, ebenfalls unterschiedlich stark ausgeprägt, was nicht nur die Heterogenität der Daten selbst aber auch eine Heterogenität der Eigenschaften unterstellt.


In einem ersten Beitrag möchten wir zunächst einen Blick auf vier primäre Eigenschaften von Daten werfen: die Heterogenität, die Vergänglichkeit, die Nichtrivalität und die Ausschließbarkeit. In weiteren Beiträgen diskutieren wir dann die verbleibenden primären und anschließend die sekundären Eigenschaften.




Heterogenität

Wie bereits oben erwähnt, sind Daten kein homogener Rohstoff, der lediglich in ausreichender Menge vorhanden sein muss, um entsprechende Ergebnisse zu erzielen. Daten sind grundsätzlich heterogen. Sie unterschieden sich bezüglich der Herkunft, der Entstehung, des Bezugspunkts, der Frequenz, des Aggregationsgrades usw. und können daher auch nicht beliebig eingesetzt werden. Zwar stellen sie durchaus einen der wichtigsten „Rohstoffe“ der Digitalisierung dar, liegen aber in deutlich unterschiedlichen Formen vor, als das z. B. bei Öl, Erdgas oder andere Rohmaterialien der Fall ist.


Ganz offensichtlich sind Daten nicht beliebig austauschbar. So lassen sich z. B. personenbezogene Daten nicht so einfach durch nicht-personenbezogene Daten ersetzen: Informationen über den Musikkonsum von Jugendlichen lassen sich – unabhängig davon, wie gut der verwendete Algorithmus ist – nicht durch Daten über das Fahrverhalten von Geländewagen substituieren. Aber auch näherliegende (oder andere personenbezogene) Informationen wie das Alter einer Person oder deren Wohnort, lassen noch keine gesicherten Rückschlüsse auf ihre musikalischen Präferenzen zu. Beobachtet man dagegen die individuellen Hörgewohnheiten im Zeitverlauf, lassen sich durchaus Rückschlüsse über Präferenzen ziehen und sich daraus ein entsprechendes Empfehlungssystem aufbauen. Auf ähnliche Weise funktioniert auch das Empfehlungssystem von Spotify, Netflix und ähnlichen Anbietern.


Trotzdem lassen sich manche Informationen wiederum sehr wohl durch andere Daten approximieren: So kann das Einkommen einer Person durchaus anhand des Alters, der Bildung oder auch des jeweiligen Wohnorts geschätzt werden. Informationen über die Kaufkraft von Konsumenten stehen bis auf Ebene einzelner Straßenzüge zur Verfügung, sodass zumindest eine ungefähre Einschätzung über das Einkommen mit dessen Hilfe möglich ist. In Verbindung mit anderen Daten können aber ebenso Rückschlüsse über weitere Eigenschaften und Verhaltensweisen wie z. B. das Konsumverhalten gezogen werden. Daten können also auch und vor allem in Kombination mit anderen Informationen einen größeren Nutzen stiften. Sie werden dann nicht substitutional, sondern vielmehr komplementär genutzt.


Vergänglichkeit

Eine zweite Eigenschaft, die ebenfalls in unterschiedlicher Ausprägung auftritt, ist die Vergänglichkeit der Daten, also der Frage, wie lange die enthaltenen Informationen für die Plattform oder den jeweiligen Nutzer der Daten verwertbar sind. So sind Echtzeitdaten über den Standort autonom fahrender Fahrzeuge nur für eine sehr kurze Zeit von Interesse. Jedenfalls dann, wenn es lediglich um die Verhinderung von Kollisionen geht. Geht es darum, Bewegungsprofile der Nutzer dieser Fahrzeuge zu erstellen, ist diese Zeitspanne schon deutlich größer. Andere Informationen wie der Wohnort einer Person oder deren Beruf, ist solange von Nutzen, wie sich dieser Status ändert. Deutlich seltener sind Daten dagegen dauerhaft verwertbar. Hierzu zählt oftmals der Name einer Person oder ihr Geschlecht.


In aller Regel entscheidet aber auch die Art der Verwendung der Daten über eine wichtige Rolle bei der Bestimmung der entsprechenden Verwertbarkeit. Eine mögliche Monetarisierung der Daten ist in der Regel nur über eine kurze Zeit möglich. Bereits 70 % der Daten sollen nach einer Studie von Tucker und Wellford (2013) angeblich bereits nach drei Monaten nicht mehr nützlich sein.


Nichtrivalität

Eine dritte, besonders interessante Eigenschaft von Daten ist die Nichtrivalität. Anders als andere Faktoren, werden die Informationen bei ihrer Nutzung nicht verbraucht. Rivalität würde dann bestehen, wenn andere Wirtschaftssubjekte durch die Nutzung der Informationen vom Konsum ausgeschlossen werden. Bei Daten ist dies aber in vielen Fällen gerade nicht der Fall: Informationen über das Kaufverhalten bestimmter Nutzer können gleichzeitig von mehreren Plattformen genutzt werden. Sowohl Spotify als auch Deezer und Apple Music können theoretisch gleichzeitig oder auch zeitlich versetzt die gleichen Daten über das Hörverhalten von Individuen analysieren, ohne dass sich dadurch der Erkenntnisgewinn verringern würde. Ein mp3-File eines Musikstücks oder eines Hörspiels verschlechtert sich nicht dadurch, dass es millionenfach kopiert und abgespielt wird.


So lange Daten aber nicht-rival sind, ist es auch sinnvoll sie mehrfach zu nutzen. So ist es zum Beispiel von großem Nutzen, wenn Informationen zu Forschungszwecken kostenlos allen Interessierten zur Verfügung gestellt werden. Gleiches gilt prinzipiell auch für andere, kommerzielle Unternehmen. Stehen zum Beispiel Plattformen dieselben Informationen zum Beispiel durch den Zugang zu Daten zur Verfügung, kann dies positiv zu einer höheren Wettbewerbsintensität beitragen. Allerdings sind dabei auch andere Aspekte wie etwa datenschutzrechtliche Fragen bei personenbezogenen Daten oder wettbewerbsökonomische Probleme beim Informationsaustausch zwischen Wettbewerbern zu bedenken.


Ausschließbarkeit

Daten sind zwar in der Regel nicht-rival, jedoch in den meisten Fällen ausschließbar, d.h. es lassen sich Nutzer – wenn es gewünscht ist – in aller Regel vom Konsum ausschließen. Wäre das nicht der Fall, würden Daten ein öffentliches Gut darstellen, bei dem es einen zu geringen Anreiz zu deren Produktion vorliegen würde. Außerdem müsste man möglicherweise dafür Sorge tragen, dass Daten möglichst vielen Datennutzern zur Verfügung gestellt werden. Bei der unglaublichen Menge an Daten, die tagtäglich produziert wird, wäre es jedoch überraschend, würde man hier ein Marktversagen unterstellen. Dies ist nur dann der Fall, wenn Daten (etwa in digitaler Form) jedem Interessierten zugänglich gemacht werden, da sie z. B. von einer Internetplattform veröffentlicht werden. Nutzer und Plattformen haben aber in der Regel kein Interesse daran, vor allem personenbezogene Daten zu veröffentlichen und können auch das mit unterschiedlichen (z. B. technischen oder rechtlichen) Mitteln verhindern. Dennoch gibt es Situationen, in denen ein (eventuell auch regulierter) Zugang zu Daten sinnvoll sein kann.


Anhand der ersten vier genannten Eigenschaften sollte bereits klargeworden sein, dass Daten zwar einen wichtigen Input der Plattformökonomie darstellen aber gerade nicht mit Öl oder anderen Faktoren vergleichbar ist. Sie sind deutlich heterogener als andere Inputs, haben oftmals eine sehr kurze Halbwertzeit, sind aber gleichzeitig nicht-rival im Konsum und in der Regel ausschließbar. Obwohl sie also von verschiedenen Nutzern und Plattformen gleichzeitig genutzt werden können - und damit einen deutlich höheren Mehrwert erzielen, als bei einfacher Nutzung -, stellen sie dennoch kein öffentliches Gut dar. Zumindest bei personenbezogenen Daten stellt das Datenschutzrecht eine Beschränkung der Verbreitung von Daten dar. Aber auch die Eigenschaften wie Nicht-Exklusivität, Erschwinglichkeit und Verfügbarkeit sind ein Grund, warum es keinen Sinn macht, immer alle Daten allen potenziellen Nutzern zur Verfügung zu stellen, wie der nächste Beitrag zeigen wird.


Literatur

Dewenter, R. & Bernhardt, L. (2022), III. Ökonomische Grundlagen, erscheint in: Louven, S., Künstner, K.M. & Otto, C. (Hrsg.): Rechtshandbuch KI und Plattform-Governance, Erich Schmidt Verlag, Berlin.

Tucker, D. S. and H. B. Wellford (2014). Big mistakes regarding big data. Antitrust Source, American Bar Association.

 
 
 

Comentarios


bottom of page