Bewertung der Kosten generativer KI für eine effektive Implementierung in Ihrem Unternehmen

Veröffentlicht: 2024-01-23

Einige wichtige Punkte zu den Kosten der Implementierung generativer künstlicher Intelligenz (KI).

  • Die Kosten für die Implementierung generativer KI in Unternehmen können zwischen einigen hundert Dollar pro Monat und 190.000 Dollar (und mehr) für eine maßgeschneiderte generative KI-Lösung auf der Grundlage eines fein abgestimmten Open-Source-Modells liegen.
  • Dieser Kostenunterschied bei der generativen KI wird durch mehrere Faktoren bestimmt, darunter die Aufgaben, die Sie verbessern möchten, das Modell, das am besten zu diesen Aufgaben passt, und der gewählte Implementierungsansatz.
  • Um die damit verbundenen Kosten zu optimieren, müssen Sie Ihre Projektanforderungen sorgfältig prüfen, die Kosten für die Infrastruktur vor Ort und in der Cloud bewerten und sich zwischen der Einstellung interner KI-Talente und der Auslagerung des Projekts an einen Dritten entscheiden.

Wir haben Ihnen bereits erklärt, wie generative KI (Gen AI) im Vergleich zu traditioneller KI abschneidet. Wir haben auch die Vor- und Nachteile der Technologie dargelegt. Das ITRex-Beratungsteam für generative KI hat sich auch mit den Anwendungsfällen der generativen KI in verschiedenen Branchen befasst, darunter Gesundheitswesen, Einzelhandel und Lieferketten.

Darüber hinaus haben wir die Kosten für den Aufbau von KI-Systemen und der Infrastruktur bewertet und uns auf die Kosten für maschinelles Lernen (ML) konzentriert, indem wir die Kosten berechnet haben, die mit der Vorbereitung von Trainingsdaten, der Feinabstimmung von Modellen und der Bereitstellung ML-gestützter Lösungen verbunden sind.

Jetzt ist es an der Zeit, die Kosten für die Implementierung von Gen-KI in Unternehmen zu ermitteln. Diese Analyse kann eine Herausforderung sein, da uns die Besonderheiten Ihres Projekts noch nicht bekannt sind. Wir können jedoch unsere Beratungskompetenz im Bereich Gen-KI nutzen, um die Preisgestaltung für seine Dienstleistungen zu untersuchen und die Schlüsselfaktoren für die Kosten von Gen-KI-Projekten aufzuzählen. Auf diese Weise statten wir Sie mit dem Wissen aus, das Sie benötigen, um fundierte Entscheidungen zu treffen, was Ihrem Unternehmen in dieser sich schnell entwickelnden Technologielandschaft potenziell erhebliche Zeit- und Ressourceneinsparungen bescheren kann.

Interessiert? Dann lasst uns gleich eintauchen!

Faktoren, die die Kosten der Gen-KI beeinflussen: Die Wahl eines Modells und des Implementierungsansatzes

Wenn Sie darüber nachdenken, Gen-KI in den Technologie-Stack Ihres Unternehmens zu integrieren, ist es wichtig, Folgendes zu berücksichtigen:

  • Welche Geschäftsaufgaben werden Sie mit generativer KI verbessern?
  • Welches Modell würde für diese Aufgaben ausreichen?

Das Herzstück generativer KI-Lösungen sind Basismodelle – also große Modelle, die auf riesigen Datenmengen trainiert werden. Im Wesentlichen dienen Grundlagenmodelle als Grundlage für die Erstellung maßgeschneiderter Gen-KI-Lösungen, die Vereinfachung des Entwicklungsprozesses und die Senkung der Gen-KI-Kosten. Zu ihren Fähigkeiten gehören typischerweise die Verarbeitung natürlicher Sprache (NLP), Computer Vision (CV) und die Generierung von Inhalten.

Die kognitiven Fähigkeiten von Foundation-Modellen hängen weitgehend von der Anzahl der Parameter ab, auf die sie trainiert wurden. Parameter beziehen sich in diesem Zusammenhang auf Modellelemente, die aus Trainingsdaten gelernt werden, beispielsweise Gewichte in einem neuronalen Netzwerk. Diese Parameter helfen dem Modell, Entscheidungen und Vorhersagen zu treffen. Die folgende Tabelle veranschaulicht die Korrelation zwischen der Anzahl der Parameter – im Wesentlichen dem Umfang dieser Entscheidungselemente – und den kognitiven Fähigkeiten des Modells.

Die Anzahl der Parameter ist jedoch nicht der einzige Faktor, der die Leistungsfähigkeit von Grundlagenmodellen beeinflusst. Ebenso wichtig ist die Qualität und Vielfalt der Trainingsdaten. Trainingsdaten sind die in das Modell eingespeisten Informationen, aus denen es lernt. Solche Daten umfassen eine breite Palette von Beispielen, die dem Modell helfen, neue Daten zu verstehen und zu interpretieren. Darüber hinaus spielen die Architektur des Modells – also das strukturelle Design der Interaktion der Parameter und Daten – und die Effizienz der Lernalgorithmen, die bestimmen, wie effektiv das Modell aus Daten lernt, eine entscheidende Rolle. Dadurch kann bei manchen Aufgaben ein Modell mit weniger Parametern, aber besseren Trainingsdaten oder einer effizienteren Architektur ein größeres Modell übertreffen.

Auswahl eines Basismodells, das Ihren Erwartungen hinsichtlich der Kosten der Gen-KI entspricht

Alle existierenden Gen-KI-Modelle können grob in zwei Typen eingeteilt werden.

  • Closed-Source-Modelle werden von großen Technologieunternehmen wie Google, Meta, Microsoft und OpenAI entwickelt. Ihr Quellcode, ihre Architektur und ihre Anwendungsprogrammierschnittstellen (APIs) können vollständig proprietär sein oder Dritten zur Verfügung gestellt werden (normalerweise gegen eine Gebühr, die im Wesentlichen den Kosten der Gen-KI-Lösung entspricht). In einigen Fällen können Sie die Leistung von Closed-Source-Modellen mithilfe Ihrer Daten optimieren. In diesem Artikel beziehen wir uns auf Closed-Source-Modelle als kommerziell verfügbare Gen-KI-Lösungen. Der große Vorteil solcher Modelle besteht darin, dass sie über eine Cloud-Infrastruktur verfügen und vollständig vom ursprünglichen Entwickler gepflegt werden.
  • Bei Open-Source-Modellen stehen der Quellcode, die Trainingstechniken und manchmal sogar die Trainingsdaten zur öffentlichen Nutzung und Änderung zur Verfügung. Ihr Unternehmen kann solche Modelle „wie sie sind“ verwenden oder sie anhand seiner eigenen Daten neu trainieren, um eine bessere Genauigkeit und Leistung zu erzielen. Sie müssen jedoch eine lokale oder Cloud-Infrastruktur einrichten, damit das Modell ausgeführt werden kann. Die Kosten für solche Gen-KI-Modelle umfassen daher die Rechenkosten und, wenn Sie sich für die Erweiterung der Gen-KI-Lösung entscheiden, die mit der Modellschulung verbundenen Kosten.

Fassen wir zusammen. Wenn Ihr Unternehmen über die Implementierung von Gen-KI nachdenkt, gibt es dafür im Wesentlichen vier Möglichkeiten.

  1. Verwendung von Closed-Source-Modellen ohne Anpassung: Pioniere der KI der Generation können mithilfe von APIs Standardprodukte wie ChatGPT, Google Bard, Claude und Synthesia von OpenAI in ihre Anwendungen integrieren. Der Integrationsprozess ist ziemlich unkompliziert, ebenso wie die generative KI-Preisgestaltung (dazu später mehr). Im Handel erhältliche Produkte werden regelmäßig aktualisiert und bieten eine umfangreiche Dokumentation für KI-Entwickler. Der Nachteil? Ihre Anpassungsmöglichkeiten sind begrenzt und Sie sind bei wichtigen Geschäftsaufgaben, wie der Bearbeitung von Kundensupportanfragen oder der Erstellung visueller Inhalte, stark auf ein externes Unternehmen angewiesen.
  2. Umschulung kommerziell verfügbarer Lösungen anhand Ihrer Unternehmensdaten: In diesem Szenario wählt Ihr internes KI-Team ein vorhandenes Gen-KI-Produkt aus, das von einem bestimmten Anbieter wie OpenAI entwickelt wurde, und optimiert es mithilfe Ihrer eigenen Daten. Maßgeschneiderte Gen-KI-Lösungen werden Benutzerfragen besser verstehen und genauere Antworten geben. Der Anbieter erhebt jedoch weiterhin eine geringe Gebühr für die Ausführung Ihrer Abfragen, sodass die Kosten für die endgültige KI-Generation sowohl Betriebs- als auch Anpassungskosten umfassen.
  3. Verwendung von Open-Source-Grundmodellen „wie sie sind“: Übertrieben gesagt könnte Ihr Unternehmen RoBERTa, GPT-2, GPT-Neo oder jedes andere Open-Source-Modell wählen und es ohne weitere Schulung auf Geschäftsaufgaben wie die Beantwortung von Kunden-E-Mails anwenden. Die Kosten der Gen-KI werden jedoch durch die vom Modell verbrauchten Rechenressourcen bestimmt. Wenn Sie mit unbekannten Daten und Aufgaben konfrontiert werden, ist Ihre Gen-KI-Lösung möglicherweise leistungsschwach.
  4. Umschulung von Open-Source-Modellen auf Ihren Daten: In diesem Fall müssen Sie spezifische Daten für das Gen-KI-Modelltraining abrufen und vorbereiten, lokale oder Cloud-Server für Modelltraining und -betrieb bereitstellen und weiterhin Feinabstimmungen und Aktualisierungen vornehmen Passen Sie das Modell an, während sich Ihre Aufgaben weiterentwickeln. Dieser maßgeschneiderte Ansatz garantiert zwar eine überlegene Modellleistung, bringt aber auch höhere KI-Kosten mit sich.

Nachdem Sie nun Ihre Implementierungsoptionen kennen, werfen wir einen genaueren Blick auf die Kosten, die diese Optionen für Gen-KI mit sich bringen.

Einblick in die Gen-KI-Preisgestaltung basierend auf dem Implementierungsszenario

Die Kosten kommerziell erhältlicher Gen-KI-Tools

Standarddienste, die die Textverarbeitung und -generierung erleichtern, berechnen Unternehmen in der Regel basierend auf der Anzahl der Zeichen oder Token – d. h. Grundeinheiten des Textes, die von Satzzeichen bis hin zu Wörtern und anderen Elementen der Syntax reichen können – im Eingabe- oder Ausgabetext .

So funktioniert das in der Praxis.

  1. Zeichenbasierte Abrechnung: Einige Lösungen, wie z. B. gen AI-Tools, die von Googles Vertex AI gesteuert werden, berechnen Benutzern basierend auf der Anzahl der Zeichen im Eingabe- und Ausgabetext. Sie zählen jeden Buchstaben, jede Zahl, jedes Leerzeichen und jedes Satzzeichen als Zeichen. Die generative KI-Preisgestaltung für das von Vertex unterstützte PaLM 2 for Text-Modell beginnt beispielsweise bei 0,0005 USD pro 1.000 Zeichen für Eingabe- und Ausgabetext (separate Abrechnung).
  2. Tokenbasierte Abrechnung: Fortgeschrittenere KI-Tools neigen dazu, Text in Token statt in Zeichen zu zerlegen. Abhängig von den Trainings- und Verarbeitungsmethoden eines Modells kann ein Token ein Satzzeichen, ein Wort oder ein Teil eines Wortes sein. OpenAI definiert beispielsweise einen Token als eine Gruppe von etwa vier Zeichen. Ein einfacher Satz wie „Tom hat Jill Blumen mitgebracht.“ würde also aus acht Token bestehen, da die Wörter „gebracht“ und „Blumen“ die Vier-Zeichen-Grenze leicht überschreiten. Was die Kosten für solche generativen KI-Lösungen betrifft, hängt dies maßgeblich vom gewählten Sprachmodell ab. GPT-4 Turbo von OpenAI, eines der fortschrittlichsten Tools auf dem Markt, berechnet 0,01 US-Dollar pro 1.000 Token für Eingabetext und 0,03 US-Dollar pro 1.000 Token für Ausgabetext. Für GPT-3.5 Turbo, die ältere Version, sind die Preise deutlich niedriger und reichen von 0,001 $ pro 1.000 Token für Eingabetext bis zu 0,002 $ pro 1.000 Token für Ausgabetext. Es ist zu beachten, dass verschiedene KI-Anbieter unterschiedliche Vorstellungen von Zeichen und Token haben . Um die kostengünstigste Option auszuwählen, sollten Sie deren Dokumentation und Pläne studieren und überlegen, welches Produkt am besten zu Ihren individuellen Geschäftsanforderungen passt. Wenn es bei Ihren Aufgaben beispielsweise eher um die Generierung von Texten als um die Analyse geht, ist ein generativer KI-Dienst mit geringeren Ausgaberaten besser geeignet.

Bei Gen-KI-Diensten für die Erstellung visueller Inhalte werden den Benutzern tendenziell Gebühren pro generiertem Bild berechnet, wobei die Gebühren an die Bildgröße und -qualität gebunden sind. Ein einzelnes Bild mit 1024 x 1024 Pixeln, das von DALL·E 3 in Standardqualität erstellt wurde, würde Sie 0,04 $ kosten. Für größere Bilder (1024 x 1792 Pixel) sowie hochauflösende Bilder könnte der Preis auf 0,08 bis 0,12 US-Dollar pro Stück steigen.

Und vergessen Sie nicht die schlüsselfertigen KI-Plattformen der Generation wie Synthesia.io, die bei der Preisgestaltung einen traditionelleren Ansatz verfolgen. Wenn Ihr Marketingteam den Prozess der Videoerstellung beschleunigen möchte, können Sie das Tool für nur 804 US-Dollar pro Jahr testen.

Die Kosten für die Anpassung kommerziell erhältlicher Gen-KI-Produkte

Wie Sie im vorherigen Abschnitt sehen können, nutzen die meisten vorgefertigten Gen-KI-Produkte die Pay-as-you-go-Monetarisierungsstrategie.

Während ihre Preismodelle auf den ersten Blick recht einfach erscheinen, kann es schwierig sein, vorherzusagen, wie viele Abfragen Ihre Mitarbeiter ausführen werden, insbesondere wenn Sie Anwendungsfälle für KI mehrerer Generationen in verschiedenen Abteilungen untersuchen möchten.

Dies führt wie in den Anfängen des Cloud Computing zu Verwirrung hinsichtlich der Preise und Gesamtbetriebskosten von KI-Tools der Generation.

Ein weiterer Nachteil der Verwendung kommerzieller KI-Lösungen besteht darin, dass es Allzweckprodukten wie ChatGPT an Kontextwissen mangelt, beispielsweise an der Vertrautheit mit der Struktur, den Produkten und Dienstleistungen Ihres Unternehmens. Dies macht es schwierig, Vorgänge wie Kundensupport und Berichtserstellung mit KI-Funktionen zu erweitern, selbst wenn Sie Prompt Engineering beherrschen.

Laut Eric Lamarre, Senior Partner bei McKinsey, müssen Unternehmen zur Lösung dieses Problems „eine Datenumgebung schaffen, die vom Modell genutzt werden kann“. Mit anderen Worten: Sie müssen kommerziell erhältliche Gen-KI-Tools auf Ihre Unternehmensdaten sowie auf Informationen, die über APIs aus externen Quellen bezogen werden, umschulen.

Es gibt zwei Möglichkeiten, das Ziel zu erreichen – und mehrere Faktoren, die sich in jedem Szenario auf die Kosten generativer KI auswirken.

Nutzung von Software-as-a-Service (SaaS)-Plattformen mit Gen AI-Funktionen

Viele bekannte SaaS-Anbieter, darunter SAP, TIBCO Spotfire und Salesforce, führen generative KI-Dienste ein, die anhand von Kundendaten feinabgestimmt werden können. Salesforce hat beispielsweise Einstein Copilot auf den Markt gebracht, einen dialogorientierten KI-Assistenten, der proprietäre Daten aus der Salesforce Data Cloud abruft, um personalisierte Antworten auf Kundenfragen zu erstellen. Zu den vom intelligenten Assistenten verwendeten Informationen gehören Slack-Konversationen, Telemetrie, Unternehmensinhalte und andere strukturierte und unstrukturierte Daten.

Salesforce-Kunden können auch benutzerdefinierte KI-Modelle, Fertigkeiten und Eingabeaufforderungen erstellen, indem sie den Prompt Builder und Model Builder von Einstein Copilot Studio ohne Code verwenden. Letzteres Instrument unterstützt derzeit die großen Sprachmodelle (LLMs) von OpenAI, es gibt jedoch Pläne, das Produkt in andere Lösungen von Drittanbietern zu integrieren, darunter Amazon Bedrock und Vertex AI. Da sich Einstein Copilot noch in der Pilotphase befindet (kein Wortspiel beabsichtigt), wurden die Preisinformationen für generative KI noch nicht veröffentlicht. Die Kosten für den generativen AI Sales GPT-Assistenten, die sich derzeit auf insgesamt 50 US-Dollar pro Benutzer und Monat belaufen, könnten Ihnen jedoch eine allgemeine Vorstellung davon geben, was Sie erwartet.

Integrieren Sie Ihre Unternehmenssoftware mit Gen AI-Lösungen über APIs und trainieren Sie Modelle für Ihre Daten neu

Um die Kosten für die Gen-KI-Implementierung zu senken, könnten Sie die zwischengeschalteten SaaS-Tools eliminieren und Ihre Apps direkt mit kommerziellen Gen-KI-Lösungen auf API-Ebene zusammenführen. Wenn Sie beispielsweise Ihren Kundensupport-Chatbot mit Gen-KI-Funktionen aufrüsten möchten, können Sie ihn mithilfe der OpenAI-API mit einem der OpenAI-Modelle – z. B. GPT-3.5 oder GPT-4 – synchronisieren. Als Nächstes müssen Sie Ihre Daten für maschinelles Lernen vorbereiten, die Daten auf OpenAI hochladen und den Feinabstimmungsprozess mithilfe des OpenAI CLI-Tools und der Open AI Python Library verwalten. Während der Feinabstimmung des Modells werden Ihnen 0,008 US-Dollar pro 1.000 Token (GPT-3.5) berechnet. Sobald Ihr Modell in Produktion geht, betragen die Eingabe- und Ausgaberaten 0,003 USD pro 1.000 Token bzw. 0,006 USD pro tausend Token. Die Gesamtkosten für Gen-KI umfassen auch Speicherkosten, sofern Sie sich dafür entscheiden, Ihre Daten auf OpenAI-Servern zu hosten. Die Kosten für die Datenspeicherung könnten die endgültige Schätzung um 0,2 US-Dollar pro 1 GB Daten pro Tag erhöhen. Und vergessen Sie nicht die Datenaufbereitung und die Feinabstimmung des Modells. Sofern Ihre IT-Abteilung nicht über die erforderlichen Fähigkeiten verfügt, müssen Sie mit einem zuverlässigen Unternehmen für KI-Entwicklungsdienstleistungen zusammenarbeiten.

Die Kosten für die Verwendung von Open-Source-Gen-KI-Modellen „wie sie sind“

Haftungsausschluss: Wir schlagen nicht vor, dass Sie von Grund auf ein benutzerdefiniertes Basismodell wie ChatGPT entwickeln – das ist ein Unterfangen, das man am besten denjenigen überlassen sollte, die über erhebliche Unterstützung verfügen, wie zum Beispiel die Unterstützung von OpenAI durch Microsoft, um ihre Verluste in Höhe von 540 Millionen US-Dollar auszugleichen.

Selbst einfachere Basismodelle wie GPT-3 können anfängliche Schulungs- und Bereitstellungskosten von über 4 Millionen US-Dollar verursachen. Darüber hinaus ist die Komplexität dieser Stiftungsmodelle in den letzten Jahren erstaunlich schnell gestiegen.

ITRex: Benutzerdefiniert

Der Bedarf an Rechenressourcen für das Training großer KI-Modelle verdoppelt sich alle 3,5 Monate. Auch die Komplexität der Grundlagenmodelle verändert sich. Beispielsweise wurde Bert-Large im Jahr 2016 mit 340 Millionen Parametern trainiert. Im Vergleich dazu wurde das GPT-3-Modell von OpenAI mit rund 175 Milliarden Parametern trainiert.

Die gute Nachricht ist, dass es bereits grundlegende Modelle gibt, was es für Unternehmen relativ einfach macht, mit ihnen zu experimentieren und gleichzeitig die Implementierungskosten für Gen-KI zu optimieren. Grundsätzlich könnten wir Grundlagenmodelle als Toolkit für KI-Softwareentwickler betrachten, da sie einen Ausgangspunkt für die Lösung komplexer Probleme bieten und gleichzeitig Raum für individuelle Anpassungen lassen.

ITRex: Benutzerdefiniert

Wir könnten bestehende Stiftungsmodelle grob in drei Kategorien einteilen.

  • Sprachmodelle sind für die Aufgaben der Textübersetzung, -generierung und -beantwortung konzipiert
  • Computer-Vision-Modelle zeichnen sich durch Bildklassifizierung, Objekterkennung und Gesichtserkennung aus
  • Die dritte Kategorie, generative KI-Modelle, erstellt Inhalte, die den Daten ähneln, die ein Modell verbraucht hat. Dieser Inhalt kann neue Bilder, Simulationen oder in einigen Fällen Textinformationen enthalten.

Sobald Sie ein Open-Source-Modell ausgewählt haben, das Ihren Anforderungen am besten entspricht, können Sie es mithilfe von APIs in Ihre Software integrieren und Ihre eigene Serverinfrastruktur nutzen.

Dieser Ansatz bringt die folgenden generativen KI-Kosten mit sich.

  1. Hardwarekosten: Die Ausführung von KI-Modellen, insbesondere von großen, erfordert erhebliche Rechenressourcen. Wenn Ihrem Unternehmen die entsprechende Hardware fehlt, müssen Sie möglicherweise in leistungsstarke GPUs oder CPUs investieren, was teuer sein kann. Wenn Ihr Modell relativ klein ist, könnte eine High-End-GPU wie eine NVIDIA RTX 3080 oder ähnliches ausreichen. Die Kosten für eine solche GPU können zwischen 700 und 1.500 US-Dollar liegen. Für große Modelle wie GPT-2 oder ähnliches benötigen Sie mehrere High-End-GPUs oder sogar spezielle KI-Beschleuniger. Eine einzelne NVIDIA A100-GPU kann beispielsweise zwischen 10.000 und 20.000 US-Dollar kosten. Ein Setup mit mehreren GPUs kann daher zwischen 30.000 und 50.000 US-Dollar kosten.
  2. Cloud-Computing-Kosten: Alternativ zum Kauf von Hardware können Sie Cloud-Computing-Ressourcen von Anbietern wie Amazon Web Services (AWS), Google Cloud Platform (GCP) oder Microsoft Azure mieten. Die Kosten für diese Dienste richten sich nach der Nutzung, sodass die Kosten davon abhängen, wie viel Sie ihre Ressourcen in Bezug auf Rechenzeit und Speicherplatz nutzen. Beispielsweise können GPU-Instanzen auf AWS (wie P3 oder P4) je nach Instanztyp zwischen 3 und 24 US-Dollar pro Stunde kosten.
  3. Strom und Wartung: Wenn Sie Ihre eigene Hardware verwenden, fallen Stromkosten für den Betrieb der Maschinen und möglicherweise zusätzliche Kühlsysteme an. Auch die Wartungskosten für die Hardware können sich summieren.
  4. Integration und Bereitstellung: Die Integration des KI-Modells in Ihre vorhandenen Systeme und deren Bereitstellung (insbesondere in einer Produktionsumgebung) erfordern möglicherweise zusätzlichen Softwareentwicklungsaufwand, der Arbeitskosten verursachen kann. Die Kosten für die Auslagerung der KI-Entwicklung an ein Softwareentwicklungsunternehmen können zwischen 50 und 200 US-Dollar pro Stunde liegen, wobei die Gesamtkosten zwischen einigen Tausend und Zehntausenden US-Dollar liegen.
  5. Datenspeicherung und -verwaltung: Das Speichern und Verwalten der vom Modell verwendeten Daten kann kostspielig sein, insbesondere wenn es um große Datensätze oder die Verwendung von Cloud-Speicherlösungen geht. Bei Installationen vor Ort können die Kosten für die Speicherung generativer KI-Daten zwischen 1.000 und 10.000 US-Dollar liegen, abhängig von der Größe des Trainingsdatensatzes und den Redundanzanforderungen. Die Gebühren für cloudbasierte Datenspeicherlösungen wie AWS S3 können zwischen 0,021 und 0,023 US-Dollar pro GB und Monat variieren, wobei zusätzliche Kosten für Betrieb und Datenübertragung anfallen.

Wie viel könnte es Ihr Unternehmen letztendlich kosten, ein generatives KI-Grundlagenmodell „so wie es ist“ zu übernehmen und es auf Ihrer eigenen Infrastruktur bereitzustellen? Für ein mittelständisches Unternehmen, das ein mittelgroßes Modell wie GPT-2 vor Ort verwenden möchte, ist das damit verbunden Die Kosten für generative KI könnten Folgendes umfassen.

  • Hardware: 20.000–50.000 US-Dollar (für ein paar High-End-GPUs oder ein einfaches Multi-GPU-Setup)
  • Strom und Wartung: Etwa 2.000 bis 5.000 US-Dollar pro Jahr
  • Integration und Bereitstellung: 10.000–30.000 US-Dollar (bei moderater Integrationskomplexität)
  • Datenspeicherung und -verwaltung: 5.000–15.000 US-Dollar (variiert je nach Datengröße)

Die Gesamtkosten für die Einrichtung und den Betrieb einer generativen KI-Lösung würden Folgendes umfassen:

  • Kosten für die Erstbereitstellung: Ungefähr 37.000 bis 100.000 US-Dollar (Hardware + Erstintegration und Speichereinrichtung)
  • Wiederkehrende Ausgaben: 7.000 bis 20.000 US-Dollar (einschließlich Kosten für Strom, Wartung, laufende Integration und Datenverwaltung)

Diese groben Schätzungen können je nach spezifischen Anforderungen, Standort und Marktbedingungen erheblich variieren. Für einen individuelleren und genaueren Kostenvoranschlag ist es immer am besten, einen Fachmann zu konsultieren. Darüber hinaus empfiehlt es sich, die aktuellen Marktpreise für Hardware und Cloud-Dienste zu prüfen, um die aktuellsten Preise zu ermitteln.

Die Kosten für die Umschulung von Open-Source-KI-Lösungen der Generation unter Verwendung Ihrer Daten

Wenn Ihr Unternehmen darüber nachdenkt, ein Open-Source-Grundlagenmodell anzupassen, ist es wichtig, die Faktoren zu berücksichtigen, die sich auf die Kosten der Implementierung generativer KI auswirken können.

Zu diesen Faktoren gehören die folgenden.

  1. Modellgröße: Größere Modelle wie GPT-3 erfordern mehr Ressourcen für die Feinabstimmung und Bereitstellung. Infolgedessen steigen die Kosten generativer KI mit der Größe und Komplexität des Modells. Einfachere Open-Source-Grundlagenmodelle wie GPT-2, XLNet und StyleGAN2 können hingegen keine Inhalte mit dem gleichen Maß an Kohärenz und Relevanz generieren.
  2. Rechenressourcen: Die Neuschulung eines Basismodells mithilfe der Daten Ihres Unternehmens erfordert erhebliche Rechenleistung. Die Kosten einer Gen-KI-Lösung hängen daher davon ab, ob Sie Ihre eigene Hardware oder Cloud-Dienste nutzen, wobei der Preis für letztere je nach Cloud-Anbieter und Umfang Ihres Betriebs variiert. Wenn Sie sich für ein einfacheres Modell entscheiden und es vor Ort bereitstellen, werden Sie voraussichtlich 10.000 bis 30.000 US-Dollar an GPU-Kosten für die Feinabstimmung der generativen KI-Lösung ausgeben. Beim Cloud Computing können die Kosten je nach Instanztyp zwischen 1 und 10 US-Dollar pro Stunde liegen. GPT-3-ähnliche Open-Source-Modelle erfordern ein erweitertes GPU-Setup, das zwischen 50.000 und 100.000 US-Dollar übersteigt. Die damit verbundenen Cloud-Computing-Kosten können für High-End-GPU-Instanzen zwischen 10 und 24 US-Dollar pro Stunde liegen.
  3. Datenvorbereitung: Der Prozess des Sammelns, Bereinigens und Vorbereitens Ihrer Daten zur Feinabstimmung von Basismodellen kann ressourcenintensiv sein. Die Kosten für die Implementierung generativer KI umfassen daher die Kosten für die Datenspeicherung, -verarbeitung und möglicherweise den Kauf von Trainingsdatensätzen, wenn Ihrem Unternehmen keine eigenen Daten zur Verfügung stehen oder diese aus Sicherheits- und Datenschutzgründen nicht verwendet werden können.
  4. Entwicklungszeit und Fachwissen: KI-Talente sind nicht billig. Ein in den USA ansässiger interner KI-Ingenieur kostet Ihr Unternehmen jährlich 70.000 bis 200.000 US-Dollar, zuzüglich der Einstellungs-, Gehalts-, Sozialversicherungs- und anderen Verwaltungskosten. Sie können die Kosten für generative KI senken, indem Sie mit einem Offshore-Softwareentwicklungsunternehmen mit KI-Entwicklungskompetenz zusammenarbeiten. Abhängig vom Standort können die Stundensätze solcher Unternehmen für leitende Entwicklungstalente an wichtigen Outsourcing-Standorten wie Mitteleuropa und Lateinamerika zwischen 62 und 95 US-Dollar liegen.
  5. Wartungskosten: Sie sind allein für die Wartung, Aktualisierung und Fehlerbehebung des Modells verantwortlich, was fortlaufenden Aufwand und Fachwissen im Bereich Machine Learning Engineering and Operations (MLOps) erfordert.

Wie hoch sind unter Berücksichtigung der oben genannten Faktoren die realistischen Kosten für die Erstellung einer maßgeschneiderten generativen KI-Lösung auf der Grundlage eines leicht verfügbaren Basismodells? Für ein mittelständisches Unternehmen, das ein mittelgroßes Modell wie GPT-2 verfeinern möchte, könnten die damit verbundenen Kosten für die generative KI-Implementierung Folgendes umfassen:

  • Hardware: 20.000–30.000 US-Dollar (für ein moderates GPU-Setup)
  • Entwicklung: Unter der Annahme einer Entwicklungszeit von 6 Monaten mit einer Mischung aus internen und ausgelagerten Talenten:

Intern: 35.000–100.000 US-Dollar (Halbjahresgehalt)

Outsourcing: 20.000–40.000 US-Dollar (unter der Annahme von 400 Stunden bei einem durchschnittlichen Stundensatz von 75 US-Dollar)

  • Datenvorbereitung: 5.000–20.000 US-Dollar (variiert je nach Datengröße und -komplexität)
  • Wartung: 5.000–15.000 $ pro Jahr (laufende Kosten)

Die Gesamtkosten für die Einrichtung und den Betrieb einer generativen KI-Lösung würden Folgendes umfassen:

  • Kosten für die anfängliche Bereitstellung: Ungefähr 80.000 bis 190.000 US-Dollar (einschließlich Kosten für Hardware, Entwicklung und Datenvorbereitung)
  • Wiederkehrende Ausgaben: 5.000 bis 15.000 US-Dollar (Wartung und laufende Kosten)

Die tatsächlichen Kosten für die Entwicklung und Implementierung von KI der Generation können je nach spezifischen Projektanforderungen, der Verfügbarkeit von Schulungsdaten und internen KI-Talenten sowie dem Standort Ihres Outsourcing-Partners variieren. Für eine genaue und aktuelle Preisgestaltung ist es ratsam, sich direkt an Fachleute oder Dienstleister zu wenden.

Während 190.000 US-Dollar für ein Gen-KI-System unangemessen teuer erscheinen mögen, könnten die Kosten für den Aufbau einer Gen-KI-Lösung unter Verwendung von Open-Source-Basismodellen niedriger sein als die Entscheidung für ein kommerziell erhältliches Tool.

Bevor ChatGPT Aufmerksamkeit erregte, nutzte Latitude, ein bahnbrechendes Startup, das für das KI-basierte Abenteuerspiel namens AI Dungeon verantwortlich ist, das GPT-Modell von OpenAI zur Textgenerierung.

Mit dem Wachstum ihrer Nutzerbasis wuchsen auch die Rechnungen von OpenAI und die Infrastrukturkosten von Amazon. Irgendwann zahlte das Unternehmen 200.000 US-Dollar pro Monat an damit verbundenen Kosten, um die steigende Zahl von Benutzeranfragen zu bearbeiten.

Nach dem Wechsel zu einem neuen Anbieter generativer KI senkte das Unternehmen die Betriebskosten auf 100.000 US-Dollar pro Monat und passte seine Monetarisierungsstrategie an, indem es ein monatliches Abonnement für erweiterte KI-gestützte Funktionen einführte.

Um den richtigen Implementierungsansatz auszuwählen und gleichzeitig die Preisgestaltung für generative KI zu optimieren, ist es daher wichtig, Ihre Projektanforderungen im Vorfeld gründlich zu analysieren. Und deshalb ermutigen wir unsere Kunden immer, ihre KI-Entwicklungsinitiativen mit einer Entdeckungsphase zu beginnen.

Dinge, die bei der Implementierung von Gen AI in Unternehmen zu beachten sind

Nachdem Sie nun wissen, was Sie kostenmäßig von generativer KI erwarten können, ist es an der Zeit, über die Fallstricke und Überlegungen bei der Implementierung der Technologie zu sprechen.

  • Foundation-Modelle, insbesondere große Sprachmodelle, könnten halluzinieren und scheinbar legitime, aber völlig falsche Antworten auf Benutzerfragen liefern. Ihr Unternehmen könnte dieses Szenario vermeiden, indem es die Trainingsdaten verbessert, mit verschiedenen Modellarchitekturen experimentiert und effektive Benutzer-Feedbackschleifen einführt.
  • Gen-KI-Lösungen werden mit riesigen Datenmengen trainiert, die schnell veraltet sind. Infolgedessen müssen Sie Ihr Modell regelmäßig neu trainieren, was die Kosten für die Implementierung generativer KI erhöht.
  • Foundation-Modelle, die auf bestimmte Daten, wie z. B. Einträge in elektronischen Gesundheitsakten (EHR), trainiert wurden, könnten außerhalb ihres unmittelbaren Fachwissens Schwierigkeiten haben, gültige Inhalte zu erstellen. Allzweckmodelle hingegen haben Probleme mit domänenspezifischen Benutzerabfragen. Zu den Möglichkeiten, dieses Problem anzugehen, gehören die Erstellung hybrider Modelle, die Nutzung von Transferlerntechniken und die Feinabstimmung der Modelle durch Benutzerfeedback.
  • Gen-KI-Lösungen sind von Natur aus Black-Box-Lösungen, was bedeutet, dass selten klar ist, warum sie bestimmte Ergebnisse liefern und wie ihre Genauigkeit zu bewerten ist. Dieses mangelnde Verständnis könnte Entwickler davon abhalten, die Modelle zu optimieren. Durch die Befolgung erklärbarer KI-Prinzipien während des Gen-KI-Modelltrainings, wie z. B. die Einführung von Modellinterpretierbarkeitstechniken, Aufmerksamkeitsmechanismen und Audit-Trails, können Sie Einblicke in den Entscheidungsprozess des Modells gewinnen und seine Leistung optimieren.

Darüber hinaus muss Ihr Unternehmen mehrere Fragen beantworten, bevor es mit der Implementierung generativer KI beginnt.

  • Gibt es eine solide Buy-vs-Build-Strategie, um sicherzustellen, dass Ihr Unternehmen Gen-KI nur in Funktionen einsetzt, in denen die Technologie ein Unterscheidungsmerkmal darstellt und gleichzeitig eine Anbieterbindung verhindert? Diese Strategie sollte durch eine detaillierte Roadmap für das Änderungsmanagement und die Gen-KI-Skalierung sowie durch Bestimmungen zur Neugestaltung ganzer Geschäftsprozesse bei Bedarf ergänzt werden.
  • Verfügt Ihre interne IT-Abteilung über ausreichende MLOps-Fähigkeiten, um die Qualität komplexer ML-Modelle und ihrer Trainingsdaten zu testen, zu optimieren und aufrechtzuerhalten? Wenn nicht, haben Sie bereits ein zuverlässiges KI-Entwicklungsunternehmen ausgewählt, das sich um diese Aufgaben kümmert?
  • Verfügen Sie über eine beträchtliche Menge an Rechenressourcen, sowohl in der Cloud als auch am Edge? Außerdem ist es wichtig, die Skalierbarkeit Ihrer IT-Infrastruktur sowie die Möglichkeit der Wiederverwendung von Gen-AI-Modellen für verschiedene Aufgaben, Prozesse und Einheiten zu bewerten.
  • Verfügt Ihr Unternehmen oder Ihr KI-Entwicklungspartner über die Fähigkeiten, die Machbarkeit von Gen-KI durch Proof of Concept (PoC) zu testen und Ihre Experimente außerhalb der kontrollierten Sandbox-Umgebung zu skalieren?
  • Und nicht zuletzt: Verfügt Ihr Unternehmen über wirksame Datenschutz- und Sicherheitsmechanismen, um sensible Informationen zu schützen und die Einhaltung branchen- und regionalspezifischer Vorschriften sicherzustellen?

Ein gut durchdachter Implementierungsplan hilft Ihnen nicht nur dabei, die Technologie risikofrei einzuführen und schneller von den Vorteilen zu profitieren, sondern senkt auch die Kosten der Gen-KI.

Nutzen Sie die ITRex Gen AI-Beratungsdienste, um herauszufinden, ob Gen AI Ihnen bei der Neugestaltung von Geschäftsprozessen, der Auswahl des richtigen Gen AI-Implementierungsansatzes und der Optimierung der Gen AI-Kosten helfen wird. Schreiben Sie uns, um den Stein ins Rollen zu bringen!

Dieser Artikel wurde ursprünglich auf der ITRex-Website veröffentlicht.