← Alle Artikel | KI in der Praxis

Proof of Concept für KI: Vom Experiment zur fundierten Entscheidung

Dr. Lukas Kawerau ·
Proof of ConceptKI-EinführungPilotprojektROIMittelstand

Das Wichtigste in Kürze: 42 % der Unternehmen haben 2025 den Großteil ihrer KI-Initiativen eingestellt — ein Anstieg von 17 % im Vorjahr. Der häufigste Grund: Projekte ohne Validierung, ohne Baseline, ohne klare Erfolgskriterien. Ein Proof of Concept (PoC) in vier bis sechs Wochen zeigt, ob ein KI-Ansatz für Ihren konkreten Fall funktioniert. Kosten: 5.000–25.000 Euro. Kosten eines gescheiterten Vollprojekts ohne PoC: ein Vielfaches.

Warum scheitern so viele KI-Pilotprojekte?

Gartner prognostiziert, dass 30 % der generativen KI-Projekte nach dem Proof of Concept eingestellt werden.[1] Eine MIT-Studie sieht es drastischer: 95 % der GenKI-Pilotprojekte in Unternehmen scheitern.[2] 42 % der befragten Unternehmen haben 2025 den Großteil ihrer KI-Initiativen aufgegeben, gegenüber 17 % im Vorjahr.[3]

Die Technik ist selten das Problem.

Was schiefgeht, passiert vorher. In der Planung. Im Scope. Bei den Daten. Die drei häufigsten Ursachen laut aktuellen Studien: mangelnde Datenqualität und -bereitschaft (43 %), fehlende technische Reife (43 %) und Fachkräftemangel (35 %).[3]

Das Muster sehe ich in Beratungsgesprächen ständig: Ein Geschäftsführer hat ein KI-Projekt genehmigt. Sechs Monate, sechsstelliges Budget. Nach drei Monaten stellt sich heraus, dass die Daten nicht das hergeben, was der Anbieter versprochen hat. Abbruch. Geld weg. Vertrauen beschädigt.

Ein PoC hätte das in vier Wochen gezeigt. Für einen Bruchteil der Kosten.

Aber — und das ist der Punkt — nur wenn der PoC richtig aufgesetzt ist. Die meisten PoCs scheitern nicht, weil die KI schlecht funktioniert. Sie scheitern, weil niemand vorher definiert hat, was „funktionieren" eigentlich bedeutet.

Was unterscheidet ein gutes PoC von einem teuren Experiment?

Ein guter PoC hat drei Eigenschaften: einen eng definierten Scope, messbare Erfolgskriterien vor dem Start und echte Daten statt synthetischer Testfälle. Ohne alle drei produziert er bestenfalls eine beeindruckende Demo, aber keine Entscheidungsgrundlage.

Merkmal Teures Experiment Fundierter PoC
Scope „Wir schauen mal, was KI bei uns kann" Ein Prozess, ein Dokumenttyp, eine Frage
Erfolgskriterien Nachher definiert oder gar nicht Vorher festgelegt, quantifiziert
Daten Synthetisch oder Testdaten Echte Unternehmensdaten
Zeitrahmen Offen, „bis es funktioniert" 4–6 Wochen, fest
Ergebnis Demo für die Geschäftsführung Go/No-Go-Entscheidung mit Zahlen
Budget Unklar, wächst mit dem Projekt Fixiert, 5.000–25.000 €

Der Unterschied klingt offensichtlich. In der Praxis sehe ich trotzdem neun von zehn PoC-Anfragen ohne klare Erfolgskriterien. „Wir wollen sehen, ob KI bei der Rechnungsverarbeitung hilft." Ja — aber was heißt „hilft"? 90 % Erkennungsrate? 95 %? 99 %? Bei welchem Dokumenttyp? Mit welcher Fehlertoleranz?

Ohne diese Festlegung produziert jeder PoC ein Ergebnis, das man beliebig interpretieren kann. Die KI-Befürworter sehen den Erfolg. Die Skeptiker sehen die Lücken. Niemand hat eine Entscheidungsgrundlage.

Der PoC-Prozess in fünf Phasen

Ein KI-PoC folgt fünf Phasen in vier bis sechs Wochen. Die erste Phase — Scope und Erfolgskriterien — bestimmt, ob der Rest Ergebnisse liefert oder nur Beschäftigung.

Phase 1: Scope-Definition und Erfolgskriterien (Woche 1)

Die wichtigste Phase. Alles, was hier schiefgeht, lässt sich danach nicht mehr reparieren.

Und hier passiert der häufigste Strukturfehler: Der PoC wird als IT-Projekt aufgesetzt. Ein zentrales KI-Team oder ein externer Dienstleister wählt einen Use Case, der technisch interessant ist. Sechs Wochen später gibt es eine Demo, die niemand nutzt — weil sie ein Problem löst, das die Fachabteilung nicht hat.

KI ist kein IT-Thema. Das gilt auch für den PoC. Der Use Case muss von den Menschen kommen, die den Prozess täglich ausführen. Die Sachbearbeiterin im Einkauf weiß, welche Lieferantendokumente sie drei Stunden pro Tag kosten. Der Vertriebsleiter weiß, wo Angebotserstellung hängt. Die IT weiß das nicht — und ein externer Berater schon gar nicht.

Konkret heißt das: Setzen Sie die Fachabteilung an den Tisch. Nicht als Zulieferer von Anforderungen, sondern als Eigentümer des Use Case. Die IT liefert die Infrastruktur. Die Fachabteilung definiert das Problem.

Vier Fragen, die beantwortet sein müssen:

Wer hat das Problem? Die Fachabteilung, die den Prozess verantwortet. Nicht das KI-Lab, nicht die IT. Wenn kein konkreter Anwender hinter dem PoC steht, der den Nutzen im eigenen Arbeitsalltag sieht, fehlt der wichtigste Erfolgsfaktor.

Welchen Prozess validieren wir? Einen. Nicht drei. Nicht „KI im Kundenservice", sondern „automatische Klassifikation von Kundenanfragen per E-Mail in vier Kategorien". Je enger der Scope, desto belastbarer das Ergebnis.

Was messen wir? Quantifizierbare Metriken. Extraktionsgenauigkeit bei Rechnungen: >95 %. Klassifikationsgenauigkeit bei E-Mails: >90 %. Zeitersparnis pro Vorgang: >60 %. Diese Zahlen legen Sie vor dem Start fest.

Welche Daten nutzen wir? Echte Daten aus Ihrem Unternehmen. Keine synthetischen Testfälle. Das ist nicht verhandelbar. Ein PoC mit Testdaten beweist, dass die Technologie funktioniert. Ein PoC mit echten Daten beweist, dass sie für Sie funktioniert.

Phase 2: Datenaufbereitung (Woche 1–2)

50–70 % des PoC-Budgets und der PoC-Zeit fließen in die Daten.[3] Das ist kein Problem, sondern Normalzustand. KI-Projekte stehen und fallen mit der Datenqualität.

Was in dieser Phase passiert: Daten sammeln, bereinigen, annotieren. Repräsentative Stichproben zusammenstellen. Grenzfälle identifizieren. Wenn die Daten nicht reichen oder nicht sauber sind, zeigt sich das hier — bevor Sie Geld für die Implementierung ausgeben.

Phase 3: Implementierung (Woche 2–4)

Jetzt kommt die Technik. Modellauswahl, Pipeline-Aufbau, erste Ergebnisse. Dieser Schritt dauert bei erfahrenen Teams zwei Wochen. Die Versuchung: hier zu lange optimieren. Der PoC muss nicht perfekt sein. Er muss zeigen, ob der Ansatz grundsätzlich funktioniert und wo die Grenzen liegen.

Phase 4: Evaluation (Woche 4–5)

Die Ergebnisse gegen die Erfolgskriterien aus Phase 1 messen. Nicht interpretieren. Messen.

Genauigkeit erreicht? Zeitersparnis belegt? Grenzfälle identifiziert? Was sind die Fehlerklassen — wo liegt das System daneben, und wie oft? Diese Analyse entscheidet über Go oder No-Go.

Ein negativer PoC ist kein Scheitern. Für 5.000–15.000 Euro wissen Sie, dass ein Ansatz nicht funktioniert. Das ist billiger als die Alternative: sechs Monate Vollprojekt, bevor dieselbe Erkenntnis eintrifft.

Phase 5: Entscheidungsvorlage (Woche 5–6)

Das Ergebnis des PoC ist ein Dokument, das eine Investitionsentscheidung ermöglicht. Nicht eine Demo. Ein Dokument.

Inhalte: Zusammenfassung der Ergebnisse, Vergleich mit den Erfolgskriterien, identifizierte Risiken, geschätzter Aufwand für Produktivsetzung, erwarteter ROI. Damit kann ein Geschäftsführer entscheiden. Nicht auf Basis von Versprechen, sondern auf Basis von Daten.

In meinem PoC-Service liefere ich genau dieses Ergebnis: eine belastbare Entscheidungsgrundlage in vier bis sechs Wochen.

Erfolgskriterien definieren — vor dem Start

Die richtige Definition von Erfolgskriterien ist der Unterschied zwischen einem PoC, der Entscheidungen ermöglicht, und einem, der PowerPoint-Folien produziert. Drei Kategorien decken die meisten KI-Anwendungsfälle ab.

Technische Metriken

Wie gut funktioniert das System?

Metrik Typische Schwellenwerte Wann relevant
Genauigkeit (Accuracy) >90 % (Klassifikation), >95 % (Extraktion) Dokumentenverarbeitung, E-Mail-Routing
Precision / Recall Je nach Fehlerkosten gewichten Wenn False Positives teurer sind als False Negatives (oder umgekehrt)
Verarbeitungszeit <5 Sek. pro Dokument, <1 Sek. pro E-Mail Echtzeit-Anforderungen
Ausnahmenquote <10 % manuelle Nachbearbeitung Prozesskritische Anwendungen

Wirtschaftliche Metriken

Was bringt es in Euro?

Bearbeitungszeit vorher vs. nachher. Fehlerkosten vorher vs. nachher. Personalaufwand für Ausnahmen. Diese Baseline müssen Sie vor dem PoC messen. Ich kann das nicht oft genug betonen: Ohne Baseline kein belastbarer ROI.

In meinem KI-Anwendungs-Guide beschreibe ich konkrete Beispiele, wo sich der ROI innerhalb von Wochen einstellt — und wo nicht.

Organisatorische Metriken

Kann das Team damit arbeiten? Akzeptanz bei den Anwendern, Aufwand für Schulung, Integration in den bestehenden Workflow. Ein System mit 99 % Genauigkeit, das niemand nutzt, hat einen ROI von null.

Genau deshalb muss die Fachabteilung den PoC mitgestalten — nicht nur abnehmen. In der MIT-Studie zu gescheiterten KI-Projekten ist fehlendes Ownership der Anwender ein wiederkehrendes Muster.[2] Wer den PoC von Anfang an mit den späteren Nutzern aufbaut, misst Akzeptanz nicht im Nachhinein. Er baut sie ein.

Was kostet ein KI-PoC — und was spart er?

Ein KI-PoC im Mittelstand kostet 5.000 bis 25.000 Euro. Ein gescheitertes Vollprojekt ohne vorherige Validierung kostet 50.000 bis 200.000 Euro. Die Rechnung ist einfach.

Kostenblock Bandbreite Anteil am Budget
Scope-Definition und Planung 1.000–3.000 € 10–15 %
Datenaufbereitung 2.000–10.000 € 40–50 %
Implementierung 1.500–8.000 € 25–35 %
Evaluation und Bericht 500–4.000 € 10–15 %

Was dabei auffällt: Datenaufbereitung ist der größte Posten. Das ist kein Overhead. Es ist der Kern. Unternehmen, die 50–70 % ihres PoC-Budgets in Datenbereitschaft investieren, haben signifikant höhere Erfolgsquoten.[3]

Die Gegenrechnung: Unternehmen, die KI früh und strukturiert einführen, berichten von 3,70 Dollar Wertschöpfung pro investiertem Dollar. Top-Performer erreichen 10,30 Dollar.[4] Die Voraussetzung für diese Zahlen: vorherige Validierung statt Blindflug.

Was ein PoC nicht kostet: Ihre strategische Handlungsfähigkeit. Wer nach einem negativen PoC den Ansatz verwirft, hat 10.000 Euro investiert und eine fundierte Entscheidung getroffen. Wer ohne PoC ein Vollprojekt startet und nach sechs Monaten abbricht, hat 100.000 Euro investiert und trotzdem keine Lösung.

Im Leitfaden zu KI im Mittelstand beschreibe ich fünf typische Fehler bei der KI-Einführung. Einer davon: zu schnell zu groß denken. Ein PoC ist das strukturierte Gegenmittel.

Fazit: Validieren ist billiger als Raten

42 % der Unternehmen haben ihre KI-Initiativen 2025 eingestellt. Die meisten davon hätten mit einem PoC in vier Wochen gewusst, ob der Ansatz trägt.

Vier Regeln, die ich aus jedem PoC-Projekt mitnehme:

Die Fachabteilung bestimmt den Use Case. Nicht die IT, nicht das Management, nicht der externe Berater. Wer den Prozess täglich ausführt, versteht am besten, wo KI helfen kann — und wo nicht. Ein PoC ohne Fachabteilungs-Ownership produziert Demos, keine Lösungen.

Scope radikal einengen. Ein Prozess, ein Dokumenttyp, eine Frage. Je breiter der PoC, desto wertloser das Ergebnis.

Erfolgskriterien vor dem Start definieren. Zahlen, nicht Gefühle. Wenn Sie nach dem PoC diskutieren müssen, ob es „funktioniert hat", war die Definition zu vage.

Echte Daten. Keine Ausnahme. Testdaten beweisen, dass die Technologie existiert. Echte Daten beweisen, dass sie für Ihr Unternehmen funktioniert.

Wenn Sie einen konkreten Use Case validieren wollen, lassen Sie uns sprechen. In meinem Proof-of-Concept-Service liefere ich in vier bis sechs Wochen die Entscheidungsgrundlage, die Sie brauchen.



Fußnoten

  1. Gartner, „30% of Generative AI Projects Will Be Abandoned After Proof of Concept By End of 2025", Juli 2024.

  2. MIT Sloan / Fortune, „95% of Generative AI Pilots at Companies Are Failing", August 2025. 2

  3. Beam.ai / Fullview, „AI Implementation Failure Rate and Pilot Success Statistics", 2025. 2 3 4

  4. McKinsey & Company, „The State of AI in 2025", November 2025. Durchschnittlich 3,70 USD Wertschöpfung pro investiertem Dollar bei frühen KI-Adoptern.

Häufige Fragen

Wie lange dauert ein KI-Proof-of-Concept?

Ein fokussierter PoC dauert vier bis sechs Wochen. Eine Woche Scope-Definition und Datenaufbereitung, zwei bis drei Wochen Implementierung und Test, eine Woche Evaluation und Entscheidungsvorlage. Aufwändiger wird es nur, wenn die Daten erst beschafft oder bereinigt werden müssen — das kann den Zeitrahmen auf acht bis zehn Wochen strecken.

Was kostet ein KI-PoC im Mittelstand?

Zwischen 5.000 und 25.000 Euro, abhängig von Komplexität und Datenaufwand. Das klingt nach viel — bis man es mit den Kosten eines gescheiterten Vollprojekts vergleicht. Ein mittelgroßes KI-Implementierungsprojekt kostet 50.000 bis 200.000 Euro. Ein PoC, der rechtzeitig zeigt, dass der Ansatz nicht funktioniert, spart ein Vielfaches seiner Kosten.

Was passiert, wenn der PoC negativ ausfällt?

Dann hat er seinen Zweck erfüllt. Ein negatives PoC-Ergebnis ist kein Scheitern, sondern eine fundierte Entscheidung gegen eine Fehlinvestition. Die Erkenntnisse sind trotzdem wertvoll: Sie wissen jetzt, warum es nicht funktioniert — an den Daten, am Prozess, an der Genauigkeit. Das hilft bei der Bewertung alternativer Ansätze.

Kann ich einen PoC intern durchführen oder brauche ich externe Unterstützung?

Beides funktioniert. Wenn Sie ein Team mit KI-Erfahrung haben, können Sie intern starten. Externe Begleitung bringt zwei Vorteile: Erfahrung mit KI-PoCs in ähnlichen Kontexten und einen unvoreingenommenen Blick auf die Machbarkeit. Die meisten Mittelständler, die ich begleite, haben die fachliche Expertise intern — aber nicht die KI-Projekterfahrung.

Fragen zum Thema?

Lassen Sie uns besprechen, wie diese Erkenntnisse in Ihrem Unternehmen anwendbar sind.

EmpiriAInsight

KI-Beratung für den Mittelstand in Baden-Württemberg.

Kontakt

kontakt@empiriainsight.com

© 2026 Empiria Insight UG (haftungsbeschränkt). Alle Rechte vorbehalten.