Vom Öl zur Intelligenz: Warum Compute, Talent und Datenqualität die wahren Engpässe sind

# Vom Öl zur Intelligenz: Compute, KI-Talent und Datenqualität als wahre Engpässe Es gibt Sätze, die in ihrer Eingängigkeit Karriere machen und dabei mehr verdecken als sie erklären. 'Data is the new oil' ist ein solcher Satz. Er hat sich in den letzten Jahren in Vorstandspräsentationen, Strategiepapieren und politischen Reden so tief eingeschrieben, dass seine analytische Substanz selten noch geprüft wird. Und doch, so argumentiere ich in meinem Buch ALGORITHMUS. Wer die KI kontrolliert, kontrolliert die Zukunft, ist diese Formel in einer Weise irreführend, die strategisch teuer werden kann. Wer Daten mit Öl verwechselt, rechnet in den falschen Größen, priorisiert die falschen Investitionen und erkennt die eigentlichen Engpässe des KI-Zeitalters nicht. Diese Engpässe sind Compute, Talent und Datenqualität. Sie erklären mehr über die Machtverteilung der kommenden Dekade als jede Diskussion über Datenmengen. ## Die Ölmetapher und ihr stiller Denkfehler Öl ist eine knappe, physisch begrenzte Ressource, deren bloßer Besitz Produktionsmacht verleiht. Wer eine Quelle kontrolliert, kontrolliert einen Teil der industriellen Wertschöpfung, weil das Material selbst selten, transportabel und in seiner energetischen Dichte schwer substituierbar ist. Diese Eigenschaften hat Öl seit mehr als einem Jahrhundert zu einem geopolitischen Faktor gemacht, der Kriege ausgelöst, Bündnisse geformt und nationale Entwicklungspfade bestimmt hat. Daten teilen keine dieser Eigenschaften. Sie sind nicht knapp, sondern im Gegenteil so überreichlich vorhanden, dass ihre schiere Menge zum eigentlichen Problem geworden ist. Im Jahr 2023 wurden weltweit täglich rund 2,5 Quintillionen Bytes generiert, mit einer jährlichen Wachstumsrate von mehr als dreiundzwanzig Prozent. Der überwiegende Teil dieser Menge ist in jeder strategisch sinnvollen Hinsicht wertlos: redundantes Rauschen, veraltete Fragmente, technische Metadaten ohne inhaltliche Substanz. Daten sind nicht das neue Öl. Sie sind, wenn man in der Metapher bleiben möchte, das neue Rohabwasser, in dem gelegentlich Gold enthalten ist. Der Denkfehler der Ölmetapher besteht darin, dass sie den Wert in der Ressource lokalisiert statt im Prozess ihrer Veredelung. Google besaß im Jahr 2010 mehr Daten als jedes andere Unternehmen der Welt, und dennoch haben Microsoft, Amazon, Meta und eine ganze Generation spezialisierter Herausforderer seitdem erfolgreich digitale Märkte aufgebaut. Netflix verfügte über mehr Viewingdaten als alle Filmstudios zusammen, und die Studios behaupteten dennoch relevante Marktpositionen. Bloomberg hatte mehr Finanzdaten als alle Hedgefonds der Welt, und die Hedgefonds erzielten dennoch Alpha. Der Wert entsteht nicht im Reservoir, sondern in der Raffinerie. ## Compute: Der härteste Engpass Wenn Daten nicht der wahre Engpass sind, was ist es dann? Die erste Antwort lautet: Rechenkapazität. Das Training von GPT-4 kostete nach Schätzungen der Stanford University zwischen 63 und 100 Millionen Dollar allein für die Rechenzeit, verteilt auf rund 21.000 Rechenstunden auf NVIDIAs A100-Chips, die einzeln zwischen 10.000 und 15.000 Dollar kosten. Das Training der nachfolgenden Generation von Frontier-Modellen wird nach Prognosen des Forschungsinstituts Epoch AI eine Investition von über einer Milliarde Dollar pro Trainingslauf erfordern. Diese Zahlen sind mehr als betriebswirtschaftliche Kuriositäten. Sie definieren eine Eintrittsbarriere, die den Wettbewerb in der Foundation-Model-Schicht auf eine Handvoll global agierender Akteure beschränkt. Wer eine Milliarde Dollar in einen einzigen Rechenvorgang investieren kann, muss entweder zu den fünf größten Technologieunternehmen der Welt gehören, über staatliche Rückendeckung verfügen oder einen Kapitalzugang haben, wie ihn sich in der Geschichte der Industriefinanzierung nur wenige Akteure leisten konnten. Die physische Infrastruktur hinter diesen Rechenkapazitäten ist in einer Weise konzentriert, die beispiellos ist. NVIDIA designt die Chips, TSMC fertigt sie, ASML liefert die Lithographiemaschinen, ohne die keine Fertigung denkbar wäre. Drei Unternehmen in drei geopolitisch exponierten Regionen kontrollieren die gesamte Spitzenkapazität der KI-Hardwareproduktion. Wer über Compute spricht, spricht deshalb nicht nur über Kosten, sondern über eine der sensibelsten Abhängigkeitsstrukturen der globalen Wirtschaft. ## Talent: Der am schwersten skalierbare Engpass Der zweite Engpass ist Talent, und er ist am schwierigsten zu skalieren. Die Zahl der Menschen weltweit, die in der Lage sind, Frontier-Modelle zu konzipieren, zu trainieren und strukturell zu verbessern, liegt nach Schätzungen von Branchenanalysten im niedrigen vierstelligen Bereich. Es sind vermutlich weniger als fünftausend Personen auf dem ganzen Planeten, die die volle Tiefe dieser Disziplin beherrschen. Diese Menschen sind in einem globalen Wettbewerb um ihre Arbeitskraft, der in Gehaltspaketen zwischen einer halben und zwei Millionen Dollar jährlich seinen marktlichen Ausdruck findet. Das MacroPolo-Institut hat dokumentiert, dass siebzig Prozent der weltweit führenden KI-Forscher in den Vereinigten Staaten arbeiten, während neunundvierzig Prozent von ihnen außerhalb der USA geboren wurden. Amerika importiert Talent und transformiert es in nationale Kompetenz. Europa und andere Regionen verlieren dieses Talent regelmäßig an amerikanische Arbeitgeber, oft über Universitätspfade, die strukturell auf den Export kognitiver Hochqualifikation hinauslaufen. Anders als bei Compute lässt sich Talent nicht durch Investitionen in Fabriken oder Rechenzentren kurzfristig replizieren. Es braucht eine Generation akademischer Ausbildung, berufliche Erfahrung in den wenigen Institutionen, in denen Frontier-Forschung tatsächlich stattfindet, und eine kulturelle Umgebung, die ambitionierte Forschung stützt. Wer heute mit dem Aufbau dieser Strukturen beginnt, wird ihre Früchte in zehn Jahren ernten. Wer jetzt nicht beginnt, wird sie in zwanzig Jahren nicht haben. ## Datenqualität: Der am stärksten unterschätzte Engpass Der dritte Engpass ist Datenqualität, und er ist derjenige, den ich in ALGORITHMUS. Wer die KI kontrolliert, kontrolliert die Zukunft für den strategisch am stärksten unterschätzten halte. Der Unterschied zwischen einem nützlichen und einem transformativen KI-System liegt selten in der Modellarchitektur, die inzwischen in großen Teilen standardisiert und öffentlich dokumentiert ist. Er liegt in der spezifischen Qualität, Tiefe und Kontextualität der Trainingsdaten. Synthetisch generierte Daten, die zunehmend eingesetzt werden, um Knappheit in spezifischen Domänen zu überwinden, können das Qualitätsproblem nicht vollständig lösen. Ihnen fehlt das charakteristische Rauschen, die Imperfektionen und die historischen Brüche realer Daten. Ein Modell, das auf synthetischen Patientendaten trainiert wird, verhält sich anders als eines, das auf echten Patientendaten trainiert wird, weil echte Daten Muster enthalten, die keine Simulation vollständig repliziert. Qualität, nicht Quantität, ist die eigentliche Währung. Und Qualität ist nicht das Nebenprodukt großer Mengen, sondern das Resultat jahrzehntelanger sorgfältiger Akkumulation in einer klar definierten Domäne. Das ist keine technische Aussage, sondern eine institutionelle. ## Die europäische Konsequenz: Domänendaten als strukturelle Position Aus der Analyse der drei Engpässe ergibt sich eine Perspektive, die für den europäischen Mittelstand und für spezialisierte Industrieunternehmen erheblich ist. Europa wird im Compute-Wettbewerb absehbar nicht aufholen. Es wird im allgemeinen Talentwettbewerb gegen Silicon Valley und die großen chinesischen Zentren strukturell im Nachteil bleiben. Aber es verfügt in der Dimension der Datenqualität über eine Position, die weder durch Kapital noch durch generische Rechenkapazität einfach einholbar ist. Ein mittelständisches Pharmaunternehmen, das seit dreißig Jahren klinische Versuchsdaten akkumuliert hat, verfügt über einen Datenschatz, den kein amerikanisches KI-Labor kaufen oder synthetisch replizieren kann. Ein Maschinenbauer, der seit vier Jahrzehnten Sensordaten aus weltweit installierten Anlagen sammelt, hat eine Domänen-Datenbasis, die jeden allgemeinen Industriedatensatz übertrifft. Ein Logistikunternehmen, das seit zwanzig Jahren Routenoptimierungsdaten für seinen spezifischen geographischen Markt akkumuliert hat, kann damit Modelle bauen, die allgemeinen Navigationsalgorithmen für diese Anwendung überlegen sind. Siemens hat mit Siemens Xcelerator genau dieses Prinzip realisiert. Jahrzehntelange Maschinenbetriebsdaten aus Hunderttausenden installierten Anlagen werden genutzt, um KI-Modelle für prädiktive Instandhaltung, Prozessoptimierung und Fehlerdiagnose zu trainieren, die kein allgemeines Industriemodell replizieren kann. Das Ergebnis ist ein Wettbewerbsvorteil, der nicht durch größere Rechenkapazität oder mehr allgemeine Trainingsdaten einfach überholt werden kann. Es ist ein Vorteil, der in Domänenwissen wurzelt und deshalb gegen die Skalierungslogik der Hyperscaler relativ robust ist. Die strategische Konsequenz für europäische Entscheider lautet deshalb nicht, die Foundation-Model-Schicht zu rekonstruieren, was unter den gegebenen Kapitalbedingungen eine aussichtslose Strategie wäre. Sie lautet, proprietäre Domänendaten von höchster Qualität mit algorithmischer Kompetenz zu verbinden und auf dieser Basis spezialisierte Anwendungen zu bauen, die über allgemeine Plattformmodelle strukturell nicht erreichbar sind. ## Die Raffinerie ist wichtiger als das Reservoir Wer die drei Engpässe nebeneinanderstellt, erkennt das Muster. Compute ist der kapitalintensivste Engpass und entscheidet über die Teilnahme am Frontier-Wettbewerb. Talent ist der zeitintensivste Engpass und entscheidet über die Fähigkeit, Frontier-Systeme überhaupt zu konzipieren. Datenqualität ist der domänenspezifischste Engpass und entscheidet darüber, ob ein KI-System in einem konkreten Anwendungsfeld tatsächlich besser ist als seine Alternativen. Die drei Engpässe sind nicht substituierbar. Kein Akteur kann Compute durch Talent ersetzen oder Talent durch Datenqualität. Die Ölmetapher bleibt trotzdem zu verführerisch, um sie ganz zu verwerfen. Vielleicht lässt sich ihr Kern retten, wenn man die Formel präziser formuliert. Daten sind nicht das neue Öl. Domänendaten mit strategischer Qualität sind es möglicherweise, aber nur, wenn man die Raffinerie besitzt. Und die Raffinerie ist die algorithmische Kompetenz, aus diesen Daten Entscheidungsintelligenz zu destillieren, kombiniert mit der Rechenkapazität, dies im industriellen Maßstab zu tun. Wer beides hat, proprietäre Domänendaten hoher Qualität und die algorithmische Kompetenz zu ihrer Nutzung, verfügt über eine strategische Position, die weder durch Kapital noch durch allgemeine Rechenkapazität einfach replizierbar ist. Wer nur eines von beiden besitzt, hat einen Rohstoff oder eine Fähigkeit, aber keinen strukturellen Wettbewerbsvorteil. Das KI-Zeitalter, so habe ich in ALGORITHMUS. Wer die KI kontrolliert, kontrolliert die Zukunft zu zeigen versucht, belohnt nicht die Datenreichsten. Es belohnt die Klügsten im Umgang mit Daten. Dieser Unterschied ist semantisch klein und strategisch enorm. Für europäische Unternehmen, insbesondere für den industriellen Mittelstand mit seinen jahrzehntelang akkumulierten Domänendaten, ist er die Grundlage einer strategischen Position, die nicht auf der Nachahmung amerikanischer Hyperscaler beruht, sondern auf der Veredelung dessen, was ohnehin vorhanden ist. Die Frage ist nicht, ob Europa den Kampf um Frontier-Compute gewinnen kann. Diese Frage ist in den allermeisten Szenarien negativ beantwortet. Die Frage ist, ob Europa die Raffinerien baut, in denen seine eigenen Datenreservoirs zu Entscheidungsintelligenz veredelt werden, oder ob es diesen Schritt an außereuropäische Akteure delegiert. Wer ihn delegiert, delegiert die Wertschöpfung. Wer ihn gestaltet, behält die Kontrolle über die eigene industrielle Zukunft. Dr. Raphael Nagel (LL.M.) betrachtet diese Wahl als die strategisch bedeutendste Entscheidung, vor der europäische Unternehmen und Politik in dieser Dekade stehen, und die Antwort darauf fällt nicht in Konferenzreden, sondern in Investitionsentscheidungen, Ausbildungsprogrammen und Dateninfrastrukturen, die heute begonnen werden müssen, um morgen Wirkung zu entfalten.

Für wöchentliche Analysen zu Kapital, Führung und Geopolitik: Dr. Raphael Nagel (LL.M.) auf LinkedIn folgen →