9 MinDatenstrategie

Warum Sie Ihre Daten reparieren müssen, bevor Sie KI einsetzen

87% der KI-Projekte im Mittelstand scheitern — nicht an der Technologie, sondern an der Datengrundlage. Warum Unternehmen zuerst ihre Datenarchitektur in Ordnung bringen müssen, bevor KI einen echten Hebel hat. Und warum deterministische Systeme oft mehr liefern als probabilistische.

Die KI-Illusion: Technologie als Abkürzung

Jede Woche erreicht ein neues KI-Tool den Mittelstand. Die Versprechen klingen verlockend: automatische Analyse, intelligente Prognosen, KI-gestützte Entscheidungen. Berater verkaufen KI-Strategien. Software-Anbieter versprechen KI-Dashboards. Alle sind sich einig: KI ist die Zukunft.

Niemand spricht darüber, warum die meisten dieser Projekte scheitern.

Nicht an der Technologie — die ist inzwischen erstaunlich gut. Sondern an dem, was darunter liegt: an der Datengrundlage. Wenn Ihre CRM-Daten unvollständig sind, Ihre Buchhaltungskategorien nicht zum Geschäftsmodell passen und Ihre Projektdaten in drei verschiedenen Systemen ohne gemeinsame IDs liegen — dann kann keine KI der Welt daraus zuverlässige Ergebnisse produzieren.

Das ist kein technisches Problem. Das ist ein strukturelles Problem. Und es lässt sich nicht mit KI lösen — es muss vor KI gelöst werden.

60%
Der KI-Projekte werden bis 2026 aufgegeben — wegen fehlender Datengrundlage
Gartner 2025
42%
Der Unternehmen haben KI-Initiativen bereits abgebrochen
S&P Global 2025
6%
Der Unternehmen erzielen messbaren EBIT-Impact durch KI
McKinsey State of AI 2025

Was 'schlechte Daten' im Mittelstand tatsächlich bedeutet

Wenn Berater über Datenqualität sprechen, klingt das abstrakt. Im Mittelstand sieht das Problem konkret so aus:

Silos ohne Verbindung: CRM, Buchhaltung, HR und Projektmanagement existieren als isolierte Systeme. Ein Kunde heißt im CRM 'Müller GmbH', in der Buchhaltung 'Müller GmbH & Co. KG' und im Projektmanagement 'Mueller'. Ohne eine einheitliche ID gibt es keine systemübergreifende Wahrheit.

Fehlende Granularität: Die Buchhaltung erfasst Umsatz nach Kontenrahmen, nicht nach Profit Center. Projektzeiten werden pauschal gebucht, nicht nach Aktivitätstyp. Personalkosten werden als Gesamtblock ausgewiesen, nicht nach Wertschöpfungsstrom zugeordnet.

Historische Inkonsistenz: Kontenpläne ändern sich. Kategorien werden umbenannt. Fusionen erzeugen Datenbrüche. Was vor 2 Jahren ein Kostencenter war, ist heute aufgeteilt. Keine KI kann darüber hinwegsehen, wenn die Grundstruktur nicht bereinigt ist.

Das Ergebnis: Wenn Sie eine KI auf diese Datenlage ansetzen, bekommen Sie keine Erkenntnisse — Sie bekommen plausibel klingende Halluzinationen.

Deterministische Wahrheit vs. Probabilistische Schätzung

Hier liegt die zentrale Unterscheidung, die in der aktuellen KI-Debatte untergeht:

Deterministische Systeme berechnen Ergebnisse aus definierten Regeln und vollständigen Daten. 2 + 2 = 4. Immer. Deckungsbeitrag = Umsatz minus zurechenbare Kosten. Jede Zahl nachvollziehbar.

Probabilistische Systeme schätzen Ergebnisse auf Basis von Mustern. Sie sind leistungsstark, wenn die Datenbasis solide ist. Aber sie sind gefährlich, wenn die Datenbasis lückenhaft ist — weil sie trotzdem eine Antwort liefern. Eine, die plausibel klingt, aber falsch sein kann.

Für operative Unternehmenssteuerung im Mittelstand brauchen Sie zuerst deterministische Wahrheit. Sie müssen wissen, welche Zahlen korrekt sind, bevor Sie einem System erlauben, auf Basis dieser Zahlen Muster zu erkennen.

Das bedeutet nicht, dass KI keinen Platz hat. KI hat einen enormen Platz — aber auf einer sauberen, strukturierten Datengrundlage. Die Reihenfolge ist entscheidend: Erst Struktur, dann Intelligenz.

 KI auf schlechten DatenKI auf sauberer Datenschicht
InputFragmentiert, inkonsistent, unvollständigVereinheitlicht, strukturiert, nachvollziehbar
OutputPlausible HalluzinationenVerlässliche Muster und Prognosen
VertrauenKann nicht verifiziert werdenJede Zahl bis zur Quelle nachvollziehbar
ROINegativ (Kosten ohne Ergebnis)Messbar und steigernd
RisikoFehlentscheidungen auf Basis falscher MusterEntscheidungen auf Basis validierter Grundlage

Der Daten-Reifegrad-Test: Wo steht Ihr Unternehmen?

Bevor Sie in KI investieren, beantworten Sie diese fünf Fragen ehrlich:

  1. 1

    Haben Sie eine einheitliche Kunden-ID, die in allen Systemen (CRM, Buchhaltung, Projektmanagement) funktioniert?

  2. 2

    Können Sie den Umsatz der letzten 24 Monate nach Profit Center aufschlüsseln — nicht nach Kontenrahmen?

  3. 3

    Wissen Sie, wie viele Tage zwischen Projektabschluss und Zahlungseingang vergehen — für jedes Kundensegment?

  4. 4

    Können Sie die Personalkosten nach Wertschöpfungsstrom zuordnen, nicht nur nach Abteilung?

  5. 5

    Gibt es ein einziges System, in dem alle operativen und finanziellen Daten zusammenfließen?

Der richtige Weg: Erst Datenarchitektur, dann Intelligenz

Die gute Nachricht: Den Daten-Grundstein zu legen ist weder mysteriös noch jahrelange Arbeit. Für ein typisches Mittelstandsunternehmen mit 5-8 Kernsystemen sieht der Weg so aus:

Woche 1-2: Audit aller Datenquellen. Was existiert wo? Welche Qualität? Welche Lücken?

Woche 3-4: Vereinheitlichung in einer zentralen Datenschicht. Einheitliche IDs, konsistente Kategorien, nachvollziehbare Zuordnungen.

Woche 5-6: Management-P&L nach Geschäftsmodell bauen. Deterministische Berechnung aller Kern-KPIs.

Woche 7-8: Erste Erkenntnisse liefern. Evidenzbasierte Empfehlungen, was als nächstes verbessert werden sollte.

Danach haben Sie zwei Dinge: Erstens, sofortige Management-Wahrheit — Erkenntnisse, die ohne jede KI bereits Wert liefern. Zweitens, eine saubere Datenschicht, auf der KI-Anwendungen tatsächlich funktionieren.

Das ist keine Anti-KI-Position. Das ist die Pro-Ergebnis-Position. Erst wenn die Daten stimmen, kann KI liefern, was sie verspricht.