Die große KI-Bremse, Teil 2: Was die Revolution tatsächlich kostet

Eine Recherche über Stromrechnungen, ausverkaufte Chips und die Frage, ob sich das Geschäft mit künstlicher Intelligenz jemals rechnen wird

Im ersten Teil dieser Artikelserie ging es um die politische Dimension der KI-Debatte: Bernie Sanders‘ Forderung nach einem Moratorium für Rechenzentren, die Erfahrungen aus Amsterdam und Dublin und die Frage, was das für Unternehmen im DACH-Raum bedeutet. [1] Dieser zweite Teil dreht die Perspektive. Er fragt nicht: Wer entscheidet über KI? Er fragt: Kann die Infrastruktur überhaupt liefern, was die Versprechen verlangen? Und wenn ja, zu welchem Preis?

Zur Methodik: Die Recherche für diesen Artikel basiert auf einer parallelen Analyse mit mehreren KI-Systemen (Claude, Gemini, Perplexity, DeepSeek, ChatGPT). Jedes System hat unabhängig Quellen recherchiert, Zitate verifiziert und Daten zusammengetragen. Die Einordnung, Analyse und Bewertung der Ergebnisse ist meine eigene Arbeit. Alle Quellenangaben im Anhang verweisen auf die Primärquellen, nicht auf die KI-Ausgaben. Dieses Vorgehen ist Teil meiner Überzeugung: KI ist ein Recherche-Werkzeug. Die Perspektive kommt vom Menschen.

Was eine einzelne KI-Anfrage an Strom verbraucht

Die Frage klingt technisch. Die Antwort ist es auch, aber sie hat direkte Konsequenzen für jeden, der KI-Dienste nutzt oder anbietet.

Eine klassische Google-Suche verbraucht rund 0,3 Wattstunden. Dieser Wert stammt aus Googles eigenen Angaben und wird von der Internationalen Energieagentur (IEA) als Referenz verwendet. [2] Eine generative KI-Anfrage liegt je nach Modell, Komplexität und Hardware bei 0,3 bis 3 Wattstunden. [3] Das Electric Power Research Institute (EPRI) und Goldman Sachs nannten 2024 noch 2,9 Wattstunden pro ChatGPT-Anfrage. Epoch AI rechnete 2025 mit aktueller Hardware nach und kam auf 0,3 Wattstunden. Google veröffentlichte im August 2025 erstmals offizielle Zahlen: Der mediane Textprompt an Gemini verbraucht 0,24 Wattstunden. [4] Derselbe Prompt hatte im Mai 2024 noch 33-mal mehr Energie verbraucht als im Mai 2025.

Die Effizienz steigt. Aber das Gesamtvolumen steigt schneller. Die Zahl der KI-Anfragen wächst laut Microsoft und Google um das 31-Fache innerhalb von zwölf Monaten. [5] Komplexe Reasoning-Modelle und Bildgenerierung erreichen 2 bis 10 Wattstunden pro Anfrage. Das ist der Kern des sogenannten Jevons-Paradoxons: Sinkende Kosten pro Einheit treiben die Gesamtnutzung in die Höhe.

Wo die Netze an ihre Grenzen stoßen

In Virginia, dem weltweit größten Rechenzentrumsmarkt, verbrauchen Rechenzentren bereits 25 bis 26 Prozent des gesamten Landesstrombedarfs. [6] Der Netzbetreiber PJM Interconnection, zuständig für 67 Millionen Menschen in 13 US-Bundesstaaten, hat über 30 Gigawatt an Rechenzentrumsanschlüssen in der Warteschlange. Das reicht, um mehr als 20 Millionen Haushalte zu versorgen. [7]

Im Dezember 2025 verfehlte PJM erstmals seine Zuverlässigkeitsziele und warnte: Bis Juni 2027 könnten die Reservemargen unter die Mindeststandards fallen. Ein konkreter Vorfall in Fairfax County verdeutlicht das Risiko: Eine Netzstörung zwang 60 Rechenzentren gleichzeitig auf Notstromgeneratoren. 1.500 Megawatt fielen schlagartig aus dem Netz. Das entspricht dem gesamten Strombedarf einer Großstadt wie Boston. [8]

Die Kapazitätsauktionspreise bei PJM explodierten von 2,2 Milliarden Dollar (2023) auf 16,1 Milliarden Dollar (2025). Der unabhängige Marktmonitor identifizierte Rechenzentren als primären Grund. [7] Eine Carnegie-Mellon-Studie bezifferte die Folge für Privathaushalte: Stromrechnungen in Virginia könnten bis 2030 um bis zu 25 Prozent steigen. [9]

Irland zeigt dasselbe Muster auf europäischer Ebene. Rechenzentren verbrauchen dort 22 bis 24 Prozent des nationalen Stroms. Mehr als alle städtischen Haushalte zusammen. [10] In Frankfurt am Main, dem größten deutschen Rechenzentrumsstandort, entfallen bis zu 40 Prozent des gesamten Stadtstrombedarfs auf Rechenzentren. Der Netzbetreiber NetzDienste RheinMain hat alle verfügbaren Kapazitäten vergeben. [11] In Berlin liegen Netzanschlussanträge über 2,8 Gigawatt vor. Mehr als die gesamte bestehende Netzkapazität der Stadt. [12]

Was dabei oft vergessen wird: Ein durchschnittliches Rechenzentrum verbraucht täglich rund 1,1 Millionen Liter Wasser für die Kühlung. Große Hyperscale-Anlagen erreichen bis zu 19 Millionen Liter pro Tag. [13] Google verbrauchte 2023 global über 19 Milliarden Liter, Microsoft 6,4 Milliarden. [14]

Chips: ausverkauft bis Mitte 2026

Die physischen Grenzen der KI-Revolution liegen nicht nur im Stromnetz. Sie liegen in der Fertigung. NVIDIAs Blackwell-GPUs (B200/GB200) sind bis Mitte 2026 ausverkauft. Der Auftragsrückstand liegt bei 3,6 Millionen Einheiten. [15] Der Engpass ist nicht die Chipfertigung selbst, sondern TSMCs Advanced Packaging (CoWoS). NVIDIA hat sich über 70 Prozent der CoWoS-Kapazität gesichert. [16]

Beim Hochbandbreitenspeicher (HBM) ist die Lage ähnlich. SK Hynix, Samsung und Micron haben ihre gesamte Produktion bis 2026 verkauft. [17] Die Lagerbestände der Speicherhersteller fielen von 13 bis 17 Wochen auf 2 bis 4 Wochen. Samsung erhöhte Server-Speicherpreise um 30 bis 60 Prozent. [18]

Die Konsequenzen treffen andere Branchen messbar. IDC warnt, der PC-Markt könne 2026 um 5 bis 9 Prozent schrumpfen, weil die Speicherpreise explodieren. [19] DRAM macht inzwischen 35 Prozent der PC-Herstellungskosten aus, zuvor waren es 15 bis 18 Prozent. [20] Smartphone-Hersteller berichten von Preissteigerungen um 20 bis 30 Prozent bei Endgeräten. [21] Micron hat den Konsumentenmarkt komplett verlassen, um sich auf KI und Enterprise zu konzentrieren. [22]

Dazu kommt der Rohstoffhunger. S&P Global prognostiziert einen Kupferbedarf für Rechenzentren von 1,1 Millionen Tonnen (2025) auf 2,5 Millionen Tonnen bis 2040. [23] Pro Megawatt Rechenzentrumskapazität werden 27 bis 33 Tonnen Kupfer verbaut. Die Bank of America erwartet ein globales Kupferdefizit von 1,84 Millionen Tonnen bis 2030. [24]

Die Rechnung geht nicht auf

Die vielleicht unbequemste Frage in der gesamten KI-Debatte ist keine technologische. Es ist eine kaufmännische: Verdient irgendjemand damit Geld?

Sam Altman gab offen zu, dass der Preis von 20 Dollar pro Monat für ChatGPT Plus ohne ernsthafte Analyse festgelegt wurde. [25] Noch bemerkenswerter: Selbst das Pro-Abo bei 200 Dollar pro Monat ist defizitär. Altman schrieb im Januar 2025 auf X: Wir verlieren derzeit Geld mit OpenAI-Pro-Abonnements. Die Leute nutzen es viel mehr als erwartet. [26]

OpenAI erzielte 2024 rund 3,7 Milliarden Dollar Umsatz bei rund 5 Milliarden Dollar Verlust. Die Prognose für 2025: 12 bis 13 Milliarden Umsatz bei 8 bis 9 Milliarden Verlust. Der kumulierte negative Cashflow von 2024 bis 2029 wird auf 115 bis 143 Milliarden Dollar geschätzt. [27] Die Bruttomarge liegt bei rund 40 Prozent. Für ein Softwareunternehmen sind 70 bis 80 Prozent üblich.

Anthropic verbraucht laut internen Analysen rund 2,7 Millionen Dollar pro Tag an Cloud-Kosten. [28] Google werden für Gemini Infrastrukturkosten von über 5 Milliarden Dollar pro Jahr zugeschrieben. [29] Keiner der großen KI-Anbieter operiert profitabel.

Die 500-Milliarden-Dollar-Lücke

Zwei Analysen aus dem Jahr 2024 haben die Finanzierungslogik der KI-Branche quantitativ infrage gestellt.

Goldman Sachs veröffentlichte im Juni 2024 den Bericht Gen AI: Too much spend, too little benefit? Jim Covello, Leiter der globalen Aktienanalyse, argumentierte: Die geschätzten Kosten von einer Billion Dollar für Entwicklung und Betrieb von KI-Technologie erforderten die Lösung komplexer Probleme, wozu generative KI nicht gebaut sei. Nach 18 Monaten sei keine einzige wirklich transformative, kosteneffiziente Anwendung gefunden worden. [30]

David Cahn von Sequoia Capital rechnete in AI’s $600B Question vor: NVIDIAs Umsatzprognose mal zwei (GPUs machen 50 Prozent der Gesamtbetriebskosten aus) mal zwei (50 Prozent Bruttomarge für Endnutzer) ergibt 600 Milliarden Dollar an erforderlichen jährlichen KI-Endkundeneinnahmen. Selbst bei großzügiger Annahme, dass Google, Microsoft, Apple und Meta jeweils 10 Milliarden Dollar an neuen KI-Einnahmen generieren, verbleibt eine Lücke von 500 Milliarden Dollar. [31]

Die kombinierten Investitionsausgaben von Microsoft, Alphabet, Amazon und Meta für KI-Infrastruktur lagen 2024 bei 230 bis 246 Milliarden Dollar. Für 2025 sind 320 bis 400 Milliarden geplant. Goldman Sachs projiziert für 2025 bis 2027 insgesamt 1,15 Billionen Dollar. [32] Fortune berichtete im September 2025, dass die fünf größten Tech-Konzerne zusammen rund 560 Milliarden Dollar in KI-Infrastruktur investiert, aber nur 35 Milliarden an KI-bezogenen Einnahmen generiert hatten. Ein Verhältnis von 6 Prozent. [33]

Dotcom-Parallelen und was diesmal anders ist

NVIDIA stieg in fünf Jahren um 4.300 Prozent. Cisco stieg vor dem Dotcom-Crash um 4.500 Prozent. [34] 54 Prozent der globalen Fondsmanager sehen KI-Aktien laut Bank of America in Blasen-Territorium. Sam Altman räumte im August 2025 ein: Sind Investoren insgesamt zu aufgeregt wegen KI? Meiner Meinung nach ja. [35]

Die Unterschiede sind allerdings relevant. In der Dotcom-Zeit waren nur 14 Prozent der Unternehmen profitabel. Die heutigen KI-Infrastrukturanbieter, NVIDIA, Microsoft, Google, Meta, Amazon, sind hochprofitable Konzerne, die ihr CapEx überwiegend aus laufenden Cashflows finanzieren. [34] Die Bewertungsmultiples liegen mit einem S&P-500-KGV von rund 23 unter den Dotcom-Extremen von 60. Und die Unternehmensadoption ist real: 78 Prozent der Organisationen nutzen bereits KI. [36]

Der wahrscheinlichste Ausgang ist weder ein Totalzusammenbruch noch eine reibungslose Skalierung. Analysten identifizieren 2026 bis 2028 als Fenster des höchsten Korrekturrisikos, vor allem für unprofitable KI-Startups und überdimensionierte Infrastrukturprojekte. [37]

Was das für den Mittelstand bedeutet

Die Zahlen in diesem Artikel beschreiben eine globale Dynamik. Milliarden-Investitionen, Gigawatt-Engpässe, Billionen-Prognosen. Für Unternehmen mit 50 oder 200 Mitarbeitenden klingt das weit weg. Es ist es nicht.

Drei Punkte, die direkt durchschlagen:

Erstens: Die Kosten werden steigen. Wer heute KI-Dienste für 20 Dollar pro Monat nutzt, nutzt ein subventioniertes Produkt. OpenAI verliert Geld mit jedem Pro-Abonnenten. Microsoft erhöht ab Juli 2026 die M365-Preise global. [38] Cloud-Analysten rechnen mit 5 bis 10 Prozent jährlicher Preissteigerung bei KI-Diensten. [39] Wer KI heute in Prozesse einbaut, ohne die Kostenentwicklung mitzudenken, baut auf einem Fundament, das sich bewegt.

Zweitens: Hardware wird knapper und teurer. Die Verdrängung aus dem Consumer-Markt in den KI-Markt trifft auch den Mittelstand. PCs, Laptops, Smartphones werden teurer. Wer IT-Budgets plant, muss mit 20 bis 40 Prozent höheren Hardwarekosten rechnen. [20] Wer eigene Server betreibt, steht in direkter Konkurrenz mit Hyperscalern um Speicher und Rechenleistung.

Drittens: Strompreise werden zum Standortfaktor. In Regionen mit hoher Rechenzentrumdichte steigen die Netzentgelte. Das betrifft nicht nur Virginia oder Dublin. In Frankfurt und Berlin zeichnet sich dasselbe Muster ab. [11] Für produzierende Unternehmen mit hohem Energiebedarf wird der Standort in der Nähe von KI-Infrastruktur zum Kostenrisiko.

Was bleibt

Die KI-Revolution hat ein Versorgungsproblem. Nicht in der Software. In der Physik. Strom, Wasser, Kupfer, Chips. Jeder dieser Engpässe wird die Geschwindigkeit und die Kosten der Technologie beeinflussen.

Gleichzeitig sinken die Kosten pro Token. Die Effizienz steigt. Die Modelle werden kleiner und leistungsfähiger. Das ist kein Widerspruch. Es ist das Muster, das Sequoia Capital als Jevons-Paradoxon beschreibt: Mehr Effizienz führt zu mehr Nutzung führt zu mehr Gesamtkosten.

Für Unternehmen im DACH-Raum heißt das: Die Frage ist nicht mehr, ob KI sich lohnt. Sie ist, ob die Kostenstruktur dahinter verstanden und eingeplant wird. Wer KI einführt, ohne die Energie-, Hardware- und Lizenzkosten auf Sicht von drei Jahren zu kalkulieren, trifft keine strategische Entscheidung. Er trifft eine Wette.

Drei Fragen, die sich stellen lassen: Was kostet dich dein aktueller KI-Einsatz pro Mitarbeitendem und Monat, wenn du nicht nur das Abo, sondern die gesamte Infrastruktur mitzählst? Hast du eine Prognose, wie sich diese Kosten in 24 Monaten entwickeln? Und was passiert mit deinem Geschäftsmodell, wenn die Subventionsphase der KI-Anbieter endet?

Quellenverzeichnis

[1] Passioneers Newsletter Teil 1 (2026): Die große KI-Bremse: Wenn Tech-Milliardäre vor ihrer eigenen Technologie warnen.

[2] IEA (2024/2025): Energy and AI Report. Verbrauch einer Google-Suche: 0,3 Wh.

[3] De Vries, A. (2023): Joule. EPRI / Goldman Sachs (2024): 2,9 Wh pro ChatGPT-Anfrage. Epoch AI (2025): 0,3 Wh mit H100-Hardware.

[4] MIT Technology Review (21.08.2025): In a first, Google has released data on how much energy an AI prompt uses. Median Gemini-Prompt: 0,24 Wh.

[5] Microsoft / Google Earnings Calls (2025): 31-faches Wachstum der KI-Workloads in 12 Monaten. Jevons-Paradoxon: NPR (04.02.2025).

[6] EPRI / JLARC (2023): 32 TWh Rechenzentrumsverbrauch bei 128 TWh gesamt in Virginia. 25-26% Anteil.

[7] NRDC / Utility Dive (2025): PJM Interconnection, 30+ GW Warteschlange. Kapazitätsauktionspreise 2,2 auf 16,1 Mrd. Dollar.

[8] Reuters / NERC (2024/2025): Fairfax County Vorfall, 60 RZ auf Notstrom, 1.500 MW Ausfall. Perplexity-Analyse KW15.

[9] Carnegie Mellon University (Juli 2025): Stromrechnungen USA national +8%, Virginia bis +25%. Jack Kemp Foundation Prognose.

[10] CSO Ireland (2024): Rechenzentren 22-24% des nationalen Stromverbrauchs. Mehr als alle städtischen Haushalte (18%).

[11] AlgorithmWatch / TechPolicy.Press (2025): Germany’s Data Center Boom is Pushing the Power Grid to its Limits. Frankfurt 40% Stadtstrom.

[12] DLA Piper (2024): Neue Entwicklungen bei der Stromversorgung von Rechenzentren in Deutschland. Berlin 2,8 GW Anschlussanträge.

[13] EESI / Lincoln Institute: Data Centers and Water Consumption. 1,1 Mio. Liter/Tag Durchschnitt, bis 19 Mio. Liter/Tag Hyperscale.

[14] UC Riverside (2023): AI programs consume large volumes of scarce water. Google 19 Mrd. Liter, Microsoft 6,4 Mrd. Liter (2023).

[15] FinancialContent / TokenRing (12/2025): NVIDIA Blackwell B200/GB200 ausverkauft bis Mitte 2026. 3,6 Mio. Einheiten Rückstand.

[16] FusionWW (2025): Inside the AI Bottleneck: CoWoS, HBM, and 2-3nm Capacity Constraints. NVIDIA 70%+ CoWoS-Kapazität.

[17] SK Hynix, Samsung, Micron: HBM-Produktion bis 2026 ausverkauft. Tom’s Hardware / Perplexity-Analyse KW15.

[18] Tom’s Hardware (2025): AI memory crunch forces DRAM market into hourly pricing model. Samsung +30-60% Serverpreise.

[19] IDC via Tom’s Hardware (2025): PC-Markt könnte 2026 um 5-9% schrumpfen durch Speicherpreise.

[20] HP / Deseret News (2025): DRAM 35% der PC-Herstellungskosten (zuvor 15-18%).

[21] Realme-CMO Francis Wong (2025): Preisanstiege 20-30% bei Handys bis Juni 2026. Deseret News / Tom’s Hardware.

[22] Micron: Rückzug aus Konsumentenmarkt zugunsten KI/Enterprise. Deloitte Semiconductor Outlook 2026.

[23] S&P Global (2025): Kupferbedarf Rechenzentren 1,1 Mio. t (2025) auf 2,5 Mio. t (2040). SDxCentral.

[24] Bank of America (2025): Globales Kupferdefizit 1,84 Mio. t bis 2030. Tom’s Hardware.

[25] Altman, S. in Bloomberg Businessweek (2025): Preisfindung ChatGPT Plus bei 20 Dollar ohne ernsthafte Analyse.

[26] Altman, S. auf X (Januar 2025): Verlust bei ChatGPT Pro 200 Dollar/Monat. Fortune / TechCrunch (05.-07.01.2025).

[27] eMarketer / Fortune (11/2025): OpenAI kumulativer negativer Cashflow 115-143 Mrd. Dollar (2024-2029). Deutsche Bank Analyse. Bruttomarge ca. 40%.

[28] Perplexity-Analyse KW15: Anthropic ca. 2,7 Mio. Dollar/Tag Cloud-Kosten.

[29] Perplexity-Analyse KW15: Google Gemini Infrastrukturkosten über 5 Mrd. Dollar/Jahr.

[30] Goldman Sachs Global Investment Research (Juni 2024): Gen AI: Too much spend, too little benefit? Jim Covello, Head of Global Equity Research.

[31] Cahn, D. / Sequoia Capital (Juni 2024): AI’s $600B Question. sequoiacap.com.

[32] IO Fund / Yahoo Finance (2025): Hyperscaler CapEx 230-246 Mrd. (2024), 320-400 Mrd. (2025). Goldman Sachs: 1,15 Bio. Dollar (2025-2027).

[33] Fortune (09/2025): 560 Mrd. Dollar Infrastrukturinvestitionen vs. 35 Mrd. Dollar KI-Einnahmen. Verhältnis 6%.

[34] IntuitionLabs (2025): AI Bubble vs. Dot-com Bubble: A Data-Driven Comparison. NVIDIA +4.300%, Cisco +4.500%.

[35] Bank of America (10/2025): 54% der Fondsmanager sehen Blasen-Territorium. Altman, S. (08/2025): Investoren zu aufgeregt.

[36] Stanford HAI AI Index Report (2025): 78% der Organisationen nutzen KI. S&P 500 KGV ca. 23 vs. Dotcom ca. 60.

[37] Morgan Stanley (2026): AI Market Trends. 2026-2028 als Fenster höchsten Korrekturrisikos.

[38] Directions on Microsoft (2026): M365-Preiserhöhungen ab Juli 2026 global. E3: 36 auf 39 Dollar/Nutzer/Monat.

[39] OVH Cloud CEO Octave Klaba (2026): 5-10% Cloud-Preissteigerung 2026. ChatGPT-Analyse KW15.