Viele Unternehmen befinden sich mit ihren KI-Projekten noch immer in einer frühen Phase, treten scheinbar permanent auf der Stelle und erzielen so gut wie keinen echten Mehrwert. Diese Situation betrifft jedes dritte Unternehmen weltweit. Denn laut Schätzungen von Gartner scheitern 30 Prozent aller KI- und Generative-AI-Projekte noch in der Pilotphase. Dabei stoßen sie vor allem beim Versuch, ihre Use Cases über das gesamte Unternehmen zu skalieren, an ihre Grenzen.
Das kann verschiedene Gründe haben – zum Beispiel fehlendes Fachpersonal, welches sich mit KI-Technologien auskennt. In den meisten Fällen ist jedoch eine mangelhafte Datengrundlage der Übeltäter. Daten sind laut McKinsey für die Mehrheit der Unternehmen (72 Prozent) sogar die Hauptherausforderung bei dem unternehmensweiten Einsatz von KI.
Die zentrale Frage lautet daher: Hemmen Daten auch den Fortschritt des eigenen KI-Projekts? Wie kommt es dazu und welche Maßnahmen können dagegen helfen?
- Infrastrukturen sind zu komplex und Wissen zu verteilt
Mit jeder neuen Technologie, Systeminstanz und Anwendung wird die gesamte IT-Landschaft komplexer. Überall entstehen Daten in unterschiedlichen Formaten, die verarbeitet und gespeichert werden müssen. Dadurch verteilt sich das gesamte Wissen – all die geschäftsrelevanten Informationen – über sämtliche Umgebungen wie Cloud und On-Prem hinweg. So entstehen voneinander getrennte Informationssilos, die für KI-Modelle nur schwer zugänglich sind.
- Daten sind veraltet und unbrauchbar
Viele KI-Modelle werden einmalig mit einem bestimmten Datenkontingent verknüpft. Danach erfolgt häufig keine kontinuierliche Datenzufuhr. Aus Sicherheitsgründen wird zudem oft auf eine Anbindung an das öffentliche Internet verzichtet. Das bedeutet allerdings, dass ein Modell nur auf die anfänglich bereitgestellte Datengrundlage zugreifen kann. Dieser mangelt es an Aktualität; die neuesten Kunden-, Produkt- und Betriebsdaten fehlen. Alle Anfragen, die Informationen benötigen, die darüber hinausgehen, bergen das Risiko unpräziser, veralteter sowie lücken- und fehlerhafter Antworten.
- Ein Großteil des Budgets fließt in kostspieliges Nachtrainieren
Ist das Problem der veralteten Daten einmal erkannt, fällt die Wahl häufig auf regelmäßiges Nachtrainieren um die Informationsgrundlage aktuell zu halten. Doch schon nach wenigen Durchläufen zeigt sich, dass dieser Prozess extrem aufwendig ist – sowohl personell, zeitlich als auch finanziell.
Damit KI-Anwendung genaue, hochwertige und geschäftsrelevante Antworten geben können, müssen folgende Voraussetzungen gegeben sein:
- Daten aus allen relevanten Quellen sind zentral und in Echtzeit zugänglich, um Vollständigkeit und Qualität zu gewährleisten.
- Der Zugriff entspricht höchsten Sicherheits- und Governance-Anforderungen.
- Die Datengrundlage bildet das tagesaktuelle Unternehmensgeschehen ab.
Mithilfe einer Plattform für zentrales Datenmanagement ist all das möglich. Hierfür kommt Datenvirtualisierung zum Einsatz. Anders als bei der klassischen Datenintegration werden die Zugänge zu zahlreichen Quellen entkoppelt, abstrahiert und zentral zusammengeführt. Konsumenten, darunter auch KI-Modelle, greifen über einen virtuellen Layer in Echtzeit auf die Unternehmensdaten zu – ganz unabhängig davon, wo sie liegen. Die Daten müssen nicht in aufwendigen Prozessen dupliziert, verändert oder in ein weiteres Repository bewegt werden. Innovative Funktionen wie zum Beispiel Deep Research helfen zusätzlich dabei, komplexe Zusammenhänge zu analysieren, Daten zu verknüpfen und Ergebnisse verständlich zu erklären.
In Kombination mit einer Retrieval-Augmented-Generation-Architektur lässt sich zudem die Aktualität der Daten sicherstellen. Dabei handelt es sich um eine Methode, bei der eine KI-Anwendung auf zusätzliche Datenquellen wie beispielsweise Datenbanken zurückgreift, um weiteres notwendiges Wissen einzubinden. Die Aktualität, Genauigkeit, Relevanz und Transparenz der Antworten steigen, das Risiko fehlerhafter Inhalte sinkt und kostspieliges Nachtrainieren ist nicht mehr erforderlich, da Informationen kontinuierlich und automatisch ins Modell fließen.
Zentrales Datenmanagement hilft somit, KI-Projekte aus der Pilotphase zu befreien und ihr volles Potenzial unternehmensweit zu entfalten.