Évaluation du coût de l'IA générative pour une mise en œuvre efficace dans votre organisation

Publié: 2024-01-23

Quelques points clés sur les coûts de mise en œuvre de l’intelligence artificielle (IA) générative.

  • Le coût de mise en œuvre de l’IA générative en entreprise peut varier de quelques centaines de dollars par mois à 190 000 $ (et plus) pour une solution d’IA générative sur mesure basée sur un modèle open source affiné.
  • Cette différence de coût de l'IA générative est due à plusieurs facteurs, notamment les tâches que vous souhaitez améliorer, le modèle qui convient le mieux à ces tâches et l'approche de mise en œuvre sélectionnée.
  • Pour optimiser les dépenses associées, vous devez examiner attentivement les exigences de votre projet, évaluer les dépenses d'infrastructure sur site et cloud, et choisir entre l'embauche de talents en IA en interne et l'externalisation du projet à un tiers.

Nous vous avons déjà expliqué comment l'IA générative (gen AI) se compare à l'IA traditionnelle. Nous avons également présenté les avantages et les inconvénients de la technologie. L'équipe de consultants en IA générative d'ITRex s'est également penchée sur les cas d'utilisation de la gen AI dans plusieurs secteurs, notamment la santé, la vente au détail et les chaînes d'approvisionnement.

De plus, nous avons évalué le coût de création de systèmes et d'infrastructures d'IA, et nous nous sommes concentrés sur les coûts d'apprentissage automatique (ML), en calculant les dépenses associées à la préparation des données de formation, au réglage fin des modèles et au déploiement de solutions basées sur le ML.

Il est désormais temps de décrypter le coût de la mise en œuvre de la génération IA en entreprise. Cette analyse peut être difficile, car les spécificités de votre projet nous sont encore inconnues. Cependant, nous pouvons tirer parti de notre expertise en conseil en gen AI pour explorer la tarification de ses services et énumérer les facteurs clés à l’origine des coûts des projets gen AI. De cette façon, nous vous fournirons les connaissances nécessaires pour prendre des décisions éclairées, ce qui pourrait permettre à votre entreprise d'économiser beaucoup de temps et de ressources dans ce paysage technologique en évolution rapide.

Intéressé? Allons-y alors !

Facteurs affectant le coût de la génération IA : le choix d’un modèle et l’approche de mise en œuvre

Lorsque vous envisagez d'intégrer la génération AI dans la pile technologique de votre entreprise, il est essentiel de prendre en compte les éléments suivants :

  • Quelles tâches commerciales allez-vous améliorer grâce à l’IA générative ?
  • Quel modèle suffirait pour ces tâches ?

Au cœur des solutions d'IA générative se trouvent les modèles de base, c'est-à-dire de grands modèles formés sur d'énormes quantités de données. Essentiellement, les modèles de base servent de base à la création de solutions d’IA de génération sur mesure, simplifiant le processus de développement et réduisant les coûts de l’IA de génération. Leurs capacités incluent généralement le traitement du langage naturel (NLP), la vision par ordinateur (CV) et la génération de contenu.

Les capacités cognitives des modèles Foundation dépendent en grande partie du nombre de paramètres sur lesquels ils ont été formés. Dans ce contexte, les paramètres font référence à des éléments de modèle appris à partir des données d'entraînement, tels que les poids dans un réseau neuronal. Ces paramètres aident le modèle à prendre des décisions et des prédictions. Le tableau suivant illustre la corrélation entre le nombre de paramètres — essentiellement le volume de ces éléments décisionnels — et les capacités cognitives du modèle.

Le nombre de paramètres n’est cependant pas le seul facteur qui influence les capacités des modèles de fondation. La qualité et la diversité des données de formation sont tout aussi importantes. Les données de formation sont les informations introduites dans le modèle, dont il apprend. Ces données englobent un large éventail d'exemples qui aident le modèle à comprendre et à interpréter de nouvelles données. De plus, l'architecture du modèle (c'est-à-dire la conception structurelle de la manière dont les paramètres et les données interagissent) et l'efficacité des algorithmes d'apprentissage, qui déterminent l'efficacité avec laquelle le modèle apprend à partir des données, jouent un rôle essentiel. Par conséquent, dans certaines tâches, un modèle avec moins de paramètres mais de meilleures données d'entraînement ou une architecture plus efficace peut surpasser un modèle plus grand.

Sélection d'un modèle de base qui répond à vos attentes concernant le coût de la génération AI

Tous les modèles de génération IA existants peuvent être grossièrement classés en deux types.

  • Les modèles fermés sont développés par de grandes entreprises technologiques, telles que Google, Meta, Microsoft et OpenAI. Leur code source, leur architecture et leurs interfaces de programmation d'applications (API) peuvent être entièrement propriétaires ou mis à la disposition de tiers (généralement moyennant des frais, qui correspondent essentiellement au coût de la solution gen AI). Dans certains cas, vous pouvez affiner les performances des modèles fermés à l'aide de vos données. Pour les besoins de cet article, nous ferons référence aux modèles à source fermée en tant que solutions d'IA de génération disponibles dans le commerce. Le principal avantage de ces modèles est qu’ils sont dotés d’une infrastructure cloud et qu’ils sont entièrement maintenus par le développeur d’origine.
  • Les modèles open source ont leur code source, leurs techniques de formation et parfois même les données de formation disponibles pour une utilisation et une modification publiques. Votre entreprise peut utiliser ces modèles « tels quels » ou les recycler sur ses propres données pour obtenir une meilleure précision et de meilleures performances. Cependant, vous devrez configurer une infrastructure sur site ou cloud sur laquelle le modèle pourra s'exécuter. Le coût de tels modèles Gen AI comprendra ainsi les coûts de calcul et, si vous choisissez d’enrichir la solution Gen AI, les dépenses associées à la formation des modèles.

Résumons. Si votre entreprise envisage de mettre en œuvre la génération AI, il existe quatre façons principales de le faire.

  1. Utilisation de modèles fermés sans personnalisation : les pionniers de la génération AI peuvent intégrer des produits prêts à l'emploi tels que ChatGPT d'OpenAI, Google Bard, Claude et Synthesia à leurs applications à l'aide d'API. Le processus d'intégration est assez simple, tout comme la tarification générative de l'IA (nous y reviendrons plus tard). Les produits disponibles dans le commerce sont fréquemment mis à jour et fournissent une documentation complète aux développeurs d'IA. Le mauvais côté? Vos options de personnalisation seront limitées et vous dépendrez fortement d'une société externe pour les tâches commerciales vitales, comme le traitement des requêtes d'assistance client ou la production de contenu visuel.
  2. Recyclage des solutions disponibles dans le commerce sur vos données d'entreprise : dans ce scénario, votre équipe d'IA interne sélectionnera un produit d'IA de génération existant développé par un fournisseur spécifique, tel qu'OpenAI, et l'ajustera en utilisant vos propres données. Les solutions personnalisées d’IA de génération comprendront mieux les questions des utilisateurs et fourniront des réponses plus précises. Cependant, le fournisseur facturera toujours des frais minimes pour l'exécution de vos requêtes, de sorte que le coût final de l'IA de génération comprendra à la fois les dépenses opérationnelles et de personnalisation.
  3. Utiliser des modèles de base open source « tels quels » : de manière exagérée, votre entreprise pourrait choisir RoBERTa, GPT-2, GPT-Neo ou tout autre modèle open source et l'appliquer à des tâches commerciales telles que répondre aux e-mails des clients sans formation supplémentaire. Cependant, le coût de la génération AI sera déterminé par les ressources informatiques consommées par le modèle. Votre solution gen AI peut sous-performer lorsqu’elle est confrontée à des données et à des tâches inconnues.
  4. Recyclage des modèles open source sur vos données : dans ce cas, vous devrez obtenir et préparer des données spécifiques pour la formation des modèles gen AI, fournir des serveurs sur site ou cloud pour la formation et les opérations des modèles, et continuer à affiner et à mettre à jour. le modèle à mesure que vos tâches évoluent. Si cette approche sur mesure garantit des performances supérieures du modèle, elle entraîne également des coûts d’IA de génération plus élevés.

Maintenant que vous connaissez vos options de mise en œuvre, zoomons sur le coût de la génération AI que ces options impliquent.

Aperçu de la tarification de la génération AI basée sur le scénario de mise en œuvre

Le coût des outils Gen AI disponibles dans le commerce

Les services prêts à l'emploi qui facilitent le traitement et la génération de texte facturent généralement aux entreprises en fonction du nombre de caractères ou de jetons (c'est-à-dire d'unités de base du texte, qui peuvent aller des signes de ponctuation aux mots et autres éléments de syntaxe) dans le texte d'entrée ou de sortie. .

Voici comment cela fonctionne en pratique.

  1. Facturation basée sur les caractères : certaines solutions, telles que les outils gen AI pilotés par Vertex AI de Google, facturent les utilisateurs en fonction du nombre de caractères dans le texte d'entrée et de sortie. Ils comptent chaque lettre, chiffre, espace et signe de ponctuation comme un caractère. La tarification de l'IA générative pour le modèle PaLM 2 for Text pris en charge par Vertex, par exemple, commence à partir de 0,0005 $ pour 1 000 caractères pour le texte d'entrée et de sortie (facturé séparément).
  2. Facturation basée sur les jetons : les outils d'IA de génération plus avancés ont tendance à décomposer le texte en jetons plutôt qu'en caractères. Selon les méthodes de formation et de traitement d'un modèle, un jeton peut être un signe de ponctuation, un mot ou une partie de mot. Par exemple, OpenAI définit un jeton comme un groupe d'environ quatre caractères. Une phrase simple comme « Tom a apporté des fleurs à Jill ». serait donc composé de huit jetons, puisque les mots « apporté » et « fleurs » dépassent légèrement le seuil de quatre caractères. En ce qui concerne le coût de telles solutions d'IA générative, cela dépend en grande partie du modèle de langage choisi. GPT-4 Turbo d'OpenAI, l'un des outils les plus sophistiqués du marché, facture 0,01 $ pour 1 000 jetons pour le texte saisi et 0,03 $ pour 1 000 jetons pour le texte de sortie. Pour GPT-3.5 Turbo, son ancienne version, les prix sont nettement inférieurs, allant de 0,001 $ pour 1 000 jetons pour le texte saisi à 0,002 $ pour 1 000 jetons pour le texte de sortie. Il convient de noter que les différents fournisseurs d'IA de génération ont des notions différentes de caractères et de jetons. . Pour sélectionner l'option la plus rentable, vous devez étudier leur documentation et leurs plans et déterminer quel produit correspond le mieux aux besoins uniques de votre entreprise. Par exemple, si vos tâches tournent autour de la génération de texte plutôt que de l’analyse, un service d’IA générative avec des taux de sortie inférieurs sera plus adapté.

Les services Gen AI pour la création de contenu visuel, quant à eux, ont tendance à facturer aux utilisateurs par image générée, avec des frais liés à la taille et à la qualité de l’image. Une seule image de 1 024 x 1 024 pixels produite par DALL·E 3 en qualité standard vous coûterait 0,04 $. Pour les images plus grandes (1 024 × 1 792 pixels), ainsi que pour les images haute définition, le prix peut aller jusqu'à 0,08 à 0,12 $ pièce.

Et n’oubliez pas les plateformes d’IA de génération clés en main, telles que Synthesia.io, qui adoptent une approche plus traditionnelle en matière de tarification. Si votre équipe marketing cherche à accélérer le processus de création vidéo, vous pouvez essayer l'outil pour aussi peu que 804 $ par an.

Le coût de la personnalisation des produits Gen AI disponibles dans le commerce

Comme vous pouvez le voir dans la section précédente, la majorité des produits Gen AI prêts à l'emploi tirent parti de la stratégie de monétisation par répartition.

Bien que leurs modèles de tarification semblent assez simples à première vue, il peut être difficile de prédire le nombre de requêtes que vos employés exécuteront, surtout si vous cherchez à explorer plusieurs cas d'utilisation de l'IA de génération dans différents départements.

Cela crée une confusion concernant la tarification des outils de génération AI et le coût total de possession, comme c'était le cas aux débuts du cloud computing.

Un autre inconvénient de l'utilisation de solutions commerciales d'IA de génération est que les produits à usage général comme ChatGPT manquent de connaissances contextuelles, telles que la familiarité avec la structure, les produits et les services de votre entreprise. Cela rend difficile l'augmentation des opérations telles que le support client et la génération de rapports avec des capacités d'IA, même si vous maîtrisez l'ingénierie rapide.

Selon Eric Lamarre, associé principal chez McKinsey, pour résoudre ce problème, les organisations « doivent créer un environnement de données pouvant être consommé par le modèle ». En d’autres termes, vous devrez recycler les outils gen AI disponibles dans le commerce sur vos données d’entreprise, ainsi que sur les informations extraites de sources externes via des API.

Il existe deux manières d’atteindre cet objectif et plusieurs facteurs qui auront un impact sur le coût de l’IA générative dans chaque scénario.

Utilisation de plates-formes Software-as-a-Service (SaaS) avec des capacités Gen AI

De nombreux fournisseurs SaaS de premier plan, notamment SAP, TIBCO Spotfire et Salesforce, déploient des services d'IA générative qui peuvent être affinés à l'aide des données clients. Salesforce, par exemple, a lancé Einstein Copilot, un assistant conversationnel d'IA qui extrait des données propriétaires de Salesforce Data Cloud pour élaborer des réponses personnalisées aux questions des clients. Les informations utilisées par l'assistant intelligent comprennent les conversations Slack, la télémétrie, le contenu d'entreprise et d'autres données structurées et non structurées.

Les clients Salesforce peuvent également créer des modèles, des compétences et des invites d'IA personnalisés à l'aide du générateur d'invites et du générateur de modèles sans code d'Einstein Copilot Studio. À l'heure actuelle, ce dernier instrument prend en charge les grands modèles de langage (LLM) d'OpenAI, mais il est prévu d'intégrer le produit à d'autres solutions tierces, notamment Amazon Bedrock et Vertex AI. Comme Einstein Copilot est encore dans sa phase pilote (sans jeu de mots), les informations sur les prix de l'IA générative n'ont pas encore été dévoilées. Cependant, le coût de l'assistant génératif AI Sales GPT, qui s'élève actuellement à 50 $ par utilisateur et par mois, pourrait vous donner une idée générale de ce à quoi vous attendre.

Intégration de vos logiciels d'entreprise avec les solutions Gen AI via des API et des modèles de recyclage sur vos données

Pour réduire le coût de mise en œuvre de la génération AI, vous pouvez éliminer les outils SaaS intermédiaires, en fusionnant vos applications directement avec des solutions commerciales de génération AI au niveau de l'API. Par exemple, si vous souhaitez doter votre chatbot de support client de capacités gen AI, vous pouvez le synchroniser avec l'un des modèles d'OpenAI, par exemple GPT-3.5 ou GPT-4, à l'aide de l'API OpenAI. Ensuite, vous devez préparer vos données pour l'apprentissage automatique, télécharger les données sur OpenAI et gérer le processus de réglage fin à l'aide de l'outil OpenAI CLI et de la bibliothèque Open AI Python. Lors du réglage fin du modèle, vous serez facturé 0,008 $ pour 1 000 jetons (GPT-3.5). Une fois votre modèle mis en production, les taux d'entrée et de sortie s'élèveront respectivement à 0,003 $ pour 1 000 jetons et à 0,006 $ pour mille jetons. Le coût global de la génération AI comprendra également les coûts de stockage, à condition que vous choisissiez d'héberger vos données sur des serveurs OpenAI. Les dépenses de stockage de données pourraient ajouter 0,2 $ par 1 Go de données par jour à l'estimation finale. Et n’oubliez pas les efforts de préparation des données et de réglage fin du modèle. À moins que votre service informatique ne possède les compétences requises, vous devrez vous associer à une société de services de développement d'IA fiable.

Le coût d’utilisation des modèles Open Source Gen AI « tels quels »

Avis de non-responsabilité : nous ne vous suggérons pas de créer un modèle de base personnalisé semblable à ChatGPT à partir de zéro : c'est une entreprise qu'il vaut mieux laisser à ceux qui bénéficient d'un soutien substantiel, comme le soutien d'OpenAI de Microsoft pour compenser leurs pertes de 540 millions de dollars.

Des modèles de base encore plus basiques, comme GPT-3, peuvent générer des coûts de formation initiale et de déploiement dépassant 4 millions de dollars. En outre, la complexité de ces modèles de fondation a grimpé en flèche à un rythme étonnant ces dernières années.

ITRex : personnalisé

La quantité de ressources informatiques nécessaires à la formation de grands modèles d’IA double tous les 3,5 mois. La complexité des modèles de fondation évolue également. Par exemple, en 2016, Bert-Large a été formé avec 340 millions de paramètres. En comparaison, le modèle GPT-3 d'OpenAI a été formé avec environ 175 milliards de paramètres.

La bonne nouvelle est que des modèles de base existent déjà, ce qui permet aux entreprises de commencer relativement facilement à les expérimenter tout en optimisant les coûts de mise en œuvre de la génération IA. Essentiellement, nous pourrions considérer les modèles de base comme une boîte à outils pour les ingénieurs logiciels d’IA, car ils fournissent un point de départ pour résoudre des problèmes complexes tout en laissant place à la personnalisation.

ITRex : personnalisé

Nous pourrions grossièrement diviser les modèles de fondations existants en trois catégories.

  • Les modèles de langage sont conçus pour gérer les tâches de traduction de texte, de génération et de réponse aux questions.
  • Les modèles de vision par ordinateur excellent dans la classification d'images, la détection d'objets et la reconnaissance faciale
  • La troisième catégorie, les modèles d'IA génératifs, crée un contenu qui ressemble aux données qu'un modèle a consommées. Ce contenu peut inclure de nouvelles images, des simulations ou, dans certains cas, des informations textuelles.

Une fois que vous avez sélectionné un modèle open source qui répond le mieux à vos besoins, vous pouvez l'intégrer à votre logiciel à l'aide d'API et utiliser votre propre infrastructure de serveur.

Cette approche implique les coûts d’IA génératifs suivants.

  1. Coûts matériels : l'exécution de modèles d'IA, en particulier les plus volumineux, nécessite des ressources de calcul importantes. Si votre entreprise ne dispose pas du matériel approprié, vous devrez peut-être investir dans des GPU ou des CPU puissants, ce qui peut s'avérer coûteux. Si votre modèle est relativement petit, un GPU haut de gamme comme un NVIDIA RTX 3080 ou similaire pourrait suffire. Le coût d'un tel GPU peut varier de 700 à 1 500 dollars. Pour les grands modèles comme GPT-2 ou similaire, vous avez besoin de plusieurs GPU haut de gamme ou même d'accélérateurs d'IA spécialisés. Un seul GPU NVIDIA A100, par exemple, peut coûter entre 10 000 et 20 000 dollars. Une configuration avec plusieurs GPU peut ainsi coûter entre 30 000 et 50 000 dollars.
  2. Coûts du cloud computing : au lieu d'acheter du matériel, vous pouvez louer des ressources de cloud computing auprès de fournisseurs tels qu'Amazon Web Services (AWS), Google Cloud Platform (GCP) ou Microsoft Azure. Ces services sont facturés en fonction de l'utilisation, les coûts dépendront donc de la quantité que vous utilisez leurs ressources en termes de temps de calcul et de stockage. Par exemple, les instances GPU sur AWS (comme P3 ou P4) peuvent coûter entre 3 $ et 24 $ par heure, selon le type d'instance.
  3. Électricité et maintenance : si vous utilisez votre propre matériel, vous devrez payer des frais d'électricité pour le fonctionnement des machines et éventuellement des systèmes de refroidissement supplémentaires. Les coûts de maintenance du matériel peuvent également s’additionner.
  4. Intégration et déploiement : l'intégration du modèle d'IA dans vos systèmes existants et son déploiement (en particulier dans un environnement de production) peuvent nécessiter des efforts de développement logiciel supplémentaires, ce qui peut entraîner des coûts de main d'œuvre. Le coût de l'externalisation du développement de l'IA vers une société de développement de logiciels peut varier de 50 à 200 dollars de l'heure, avec des dépenses totales allant de quelques milliers à des dizaines de milliers de dollars.
  5. Stockage et gestion des données : le stockage et la gestion des données utilisées par le modèle peuvent être coûteux, en particulier lorsqu'il s'agit de grands ensembles de données ou lorsque vous utilisez des solutions de stockage cloud. Pour les installations sur site, le coût de stockage des données d'IA génératives pourrait varier entre 1 000 $ et 10 000 $, selon la taille de l'ensemble de données de formation et les besoins de redondance. Les frais des solutions de stockage de données basées sur le cloud, comme AWS S3, peuvent varier de 0,021 USD à 0,023 USD par Go et par mois, avec des coûts supplémentaires pour les opérations et le transfert de données.

En fin de compte, combien cela pourrait coûter à votre entreprise d'adopter un modèle de base d'IA générative « tel quel », en le déployant sur votre propre infrastructure. Pour une entreprise de taille moyenne souhaitant utiliser un modèle de taille moyenne comme GPT-2 sur site, les coûts associés les coûts de l’IA générative pourraient couvrir les éléments suivants.

  • Matériel : 20 000 $ à 50 000 $ (pour quelques GPU haut de gamme ou une configuration multi-GPU de base)
  • Électricité et entretien : environ 2 000 à 5 000 $ par an
  • Intégration et déploiement : 10 000 $ à 30 000 $ (en supposant une complexité d'intégration modérée)
  • Stockage et gestion des données : 5 000 $ à 15 000 $ (variable en fonction de la taille des données)

Le coût total de mise en place et d’exploitation d’une solution d’IA générative comprendrait les éléments suivants.

  • Dépenses de déploiement initial : environ 37 000 $ à 100 000 $ (matériel + intégration initiale et configuration du stockage)
  • Dépenses récurrentes : 7 000 $ à 20 000 $ (y compris les coûts d'électricité, de maintenance, d'intégration continue et de gestion des données)

Ces estimations approximatives peuvent varier considérablement en fonction des exigences spécifiques, de l’emplacement et des conditions du marché. Il est toujours préférable de consulter un professionnel pour une estimation plus personnalisée et plus précise. De plus, c'est une bonne idée de vérifier les tarifs actuels du marché pour le matériel et les services cloud pour connaître les prix les plus récents.

Le coût du recyclage des solutions Open Source Gen AI utilisant vos données

Si votre entreprise envisage d'ajuster un modèle de base open source, il est important de prendre en compte les facteurs qui peuvent affecter le coût de mise en œuvre de l'IA générative.

Ces facteurs comprennent les éléments suivants.

  1. Taille du modèle : les modèles plus grands, tels que GPT-3, nécessitent plus de ressources pour être ajustés et déployés. En conséquence, le coût de l’IA générative augmente avec la taille et la complexité du modèle. Les modèles de base open source plus simples comme GPT-2, XLNet et StyleGAN2, quant à eux, ne peuvent pas générer de contenu avec le même niveau de cohérence et de pertinence.
  2. Ressources informatiques : recycler un modèle de base à l'aide des données de votre entreprise nécessite une puissance de calcul importante. Le coût d'une solution gen AI dépend donc de si vous utilisez votre propre matériel ou des services cloud, le prix de ces derniers variant en fonction du fournisseur cloud et de l'échelle de vos opérations. Si vous optez pour un modèle plus simple et le déployez sur site, vous devrez dépenser entre 10 000 et 30 000 $ en coûts GPU pour affiner la solution d'IA générative. Avec le cloud computing, les dépenses peuvent varier entre 1 $ et 10 $ par heure, selon le type d'instance. Les modèles open source de type GPT-3 nécessitent une configuration GPU plus avancée, allant de 50 000 à 100 000 $. Les dépenses de cloud computing associées peuvent varier de 10 $ à 24 $ par heure pour les instances GPU haut de gamme.
  3. Préparation des données : le processus de collecte, de nettoyage et de préparation de vos données pour affiner les modèles de base peut être gourmand en ressources. Le coût de mise en œuvre de l’IA générative comprendra donc les dépenses associées au stockage des données, au traitement et éventuellement à l’achat d’ensembles de données de formation si votre entreprise ne dispose pas de vos propres données ou ne peut pas les utiliser pour des raisons de sécurité et de confidentialité.
  4. Temps de développement et expertise : les talents en IA coûtent cher. Un ingénieur interne en IA basé aux États-Unis coûtera à votre entreprise entre 70 000 et 200 000 dollars par an, plus les frais d'embauche, de paie, de sécurité sociale et autres dépenses administratives. Vous pouvez réduire les coûts de l’IA générative en vous associant à une société d’ingénierie logicielle offshore possédant une expertise en développement d’IA. Selon l'emplacement, les taux horaires de ces entreprises peuvent varier de 62 $ à 95 $ pour les talents de développement senior dans des sites d'externalisation clés, tels que l'Europe centrale et l'Amérique latine.
  5. Coûts de maintenance : vous serez seul responsable de la maintenance, de la mise à jour et du dépannage du modèle, ce qui nécessite des efforts continus et une expertise en ingénierie et opérations d'apprentissage automatique (MLOps).

Compte tenu des facteurs mentionnés ci-dessus, quel est le coût réaliste de la création d’une solution d’IA générative personnalisée basée sur un modèle de base facilement disponible ? Pour une entreprise de taille moyenne cherchant à affiner un modèle de taille moyenne comme GPT-2, les coûts de mise en œuvre de l'IA générative associés pourraient s'étendre aux éléments suivants.

  • Matériel : 20 000 $ à 30 000 $ (pour une configuration GPU modérée)
  • Développement : en supposant 6 mois de développement avec un mélange de talents internes et externalisés :

En interne : 35 000 $ à 100 000 $ (salaire semestriel)

Externalisation : 20 000 $ à 40 000 $ (en supposant 400 heures à un taux moyen de 75 $/heure)

  • Préparation des données : 5 000 $ à 20 000 $ (variable en fonction de la taille et de la complexité des données)
  • Entretien : 5 000 $ à 15 000 $ par an (dépenses courantes)

Le coût total de mise en place et d’exploitation d’une solution d’IA générative comprendrait les éléments suivants.

  • Dépenses de déploiement initiales : environ 80 000 $ à 190 000 $ (y compris les coûts de matériel, de développement et de préparation des données)
  • Dépenses récurrentes : 5 000 $ à 15 000 $ (entretien et frais courants)

Les coûts réels de développement et de mise en œuvre de Gen AI peuvent varier en fonction des exigences spécifiques du projet, de la disponibilité des données de formation et des talents internes en IA, ainsi que de l'emplacement de votre partenaire d'externalisation. Pour obtenir les prix les plus précis et les plus actuels, il est conseillé de consulter directement des professionnels ou des prestataires de services.

Même si 190 000 $ pour un système d’IA de génération peuvent sembler déraisonnablement chers, le coût de création d’une solution d’IA de génération à l’aide de modèles de base open source pourrait être inférieur à celui d’opter pour un outil disponible dans le commerce.

Avant que ChatGPT n'attire l'attention, Latitude, une startup pionnière responsable du jeu d'aventure basé sur l'IA appelé AI Dungeon, utilisait le modèle GPT d'OpenAI pour la génération de texte.

À mesure que leur base d'utilisateurs augmentait, les factures d'OpenAI et les dépenses d'infrastructure d'Amazon augmentaient également. À un moment donné, l'entreprise payait 200 000 $ par mois en coûts associés pour gérer le nombre croissant de requêtes des utilisateurs.

Après avoir opté pour un nouveau fournisseur d'IA générative, l'entreprise a réduit ses coûts d'exploitation à 100 000 $ par mois et a ajusté sa stratégie de monétisation, en introduisant un abonnement mensuel pour des fonctionnalités avancées basées sur l'IA.

Pour sélectionner la bonne approche de mise en œuvre tout en optimisant la tarification de l’IA générative, il est donc important d’analyser minutieusement les exigences de votre projet au préalable. Et c'est pourquoi nous encourageons toujours nos clients à lancer leurs initiatives de développement d'IA par une phase de découverte.

Éléments à prendre en compte lors de la mise en œuvre de la génération IA en entreprise

Maintenant que vous savez à quoi s'attendre de l'IA générative en termes de coût, il est temps de parler des pièges et des considérations liées à la mise en œuvre de la technologie.

  • Les modèles de base, en particulier les grands modèles de langage, peuvent halluciner, produisant des réponses apparemment légitimes mais totalement fausses aux questions des utilisateurs. Votre entreprise pourrait éviter ce scénario en améliorant les données de formation, en expérimentant différentes architectures de modèles et en introduisant des boucles de rétroaction efficaces des utilisateurs.
  • Les solutions Gen AI sont formées à partir de grandes quantités de données qui deviennent rapidement obsolètes. En conséquence, vous devrez régulièrement recycler votre modèle, ce qui augmente le coût de mise en œuvre de l'IA générative.
  • Les modèles de base formés sur des données spécifiques, telles que les entrées des dossiers de santé électroniques (DSE), pourraient avoir du mal à produire un contenu valide en dehors de leur expertise immédiate. Les modèles à usage général, en revanche, ont du mal à répondre aux requêtes des utilisateurs spécifiques à un domaine. Certaines façons de résoudre ce problème incluent la création de modèles hybrides, l’exploitation des techniques d’apprentissage par transfert et l’ajustement des modèles grâce aux commentaires des utilisateurs.
  • Les solutions Gen AI sont par nature des boîtes noires, ce qui signifie qu’il est rarement clair pourquoi elles produisent certains résultats et comment évaluer leur exactitude. Ce manque de compréhension pourrait empêcher les développeurs de peaufiner les modèles. En suivant les principes d'IA explicables lors de la formation du modèle gen AI, tels que l'introduction de techniques d'interprétabilité du modèle, de mécanismes d'attention et de pistes d'audit, vous pouvez obtenir un aperçu du processus de prise de décision du modèle et optimiser ses performances.

En outre, votre entreprise doit répondre à plusieurs questions avant de se lancer dans la mise en œuvre de l’IA générative.

  • Existe-t-il une solide stratégie d'achat ou de construction pour valider que votre entreprise n'adopte la génération IA que dans des fonctions où la technologie deviendrait un différenciateur tout en évitant le verrouillage du fournisseur ? Cette stratégie devrait être complétée par une feuille de route détaillée pour la gestion du changement et la mise à l’échelle de la génération IA – et des dispositions pour la refonte de l’ensemble des processus métier, si le besoin s’en fait sentir.
  • Votre service informatique interne possède-t-il les compétences MLOps adéquates pour tester, affiner et maintenir la qualité des modèles ML complexes et de leurs données de formation ? Sinon, avez-vous déjà sélectionné une société de développement d’IA fiable pour s’occuper de ces tâches ?
  • Disposez-vous d'une quantité importante de ressources informatiques, à la fois dans le cloud et en périphérie ? En outre, il est important d'évaluer l'évolutivité de votre infrastructure informatique ainsi que la possibilité de réutiliser les modèles Gen AI dans différentes tâches, processus et unités.
  • Votre entreprise ou votre partenaire de développement d'IA possède-t-il les compétences nécessaires pour tester la faisabilité de la génération IA grâce à une preuve de concept (PoC) et faire évoluer vos expériences en dehors de l'environnement sandbox contrôlé ?
  • Enfin et surtout, votre organisation dispose-t-elle de mécanismes de confidentialité et de sécurité efficaces pour protéger les informations sensibles et garantir la conformité aux réglementations spécifiques au secteur et à la région ?

Avoir un plan de mise en œuvre bien pensé vous aidera non seulement à adopter la technologie sans risque et à en récolter les bénéfices plus rapidement, mais également à réduire le coût de la génération IA.

Profitez des services de conseil ITRex gen AI pour déterminer si la gen AI vous aidera à réorganiser les processus métier, à sélectionner la bonne approche de mise en œuvre de la gen AI et à optimiser les coûts de la gen AI. Écrivez-nous pour lancer le bal !

Cet article a été initialement publié sur le site ITRex.