組織への効果的な導入のための生成 AI のコストの評価
公開: 2024-01-23生成人工知能 (AI) の実装コストに関する重要なポイント。
- ビジネスで生成 AI を実装するコストは、月額数百ドルから、微調整されたオープンソース モデルに基づくオーダーメイドの生成 AI ソリューションの場合は 190,000 ドル (さらに増加中) までの範囲になります。
- この生成的な AI コストの違いは、強化したいタスク、それらのタスクに最適なモデル、選択した実装アプローチなど、いくつかの要因によって決まります。
- 関連する費用を最適化するには、プロジェクトの要件を慎重に検討し、オンプレミスとクラウドのインフラストラクチャの費用を評価し、社内の AI 人材を雇用するか、プロジェクトをサードパーティにアウトソーシングするかを選択する必要があります。
生成 AI (gen AI) と従来の AI の比較についてはすでに説明しました。 このテクノロジーの長所と短所についても概説しました。 ITRex の生成 AI コンサルティング チームは、ヘルスケア、小売、サプライ チェーンなど、いくつかの業界にわたる生成 AI のユースケースも詳しく調査してきました。
さらに、AI システムとインフラストラクチャの構築コストを評価し、機械学習 (ML) コストに焦点を当て、トレーニング データの準備、モデルの微調整、ML を活用したソリューションの展開に関連する費用を計算しました。
今度は、ビジネスにおける次世代 AI の導入コストを解読するときです。 プロジェクトの詳細がまだ不明であるため、この分析は困難な場合があります。 ただし、Gen AI コンサルティングの専門知識を活用して、そのサービスの価格設定を調査し、Gen AI プロジェクトのコストの背後にある重要な要素を列挙することができます。 このようにして、情報に基づいた意思決定を行うための知識を提供し、この急速に進化するテクノロジー環境においてビジネスの時間とリソースを大幅に節約できる可能性があります。
興味がある? それでは早速飛び込んでみましょう!
Gen AI のコストに影響を与える要因: モデルの選択と実装アプローチ
企業のテクノロジー スタックに gen AI を組み込むことを考えるときは、次の点を考慮することが重要です。
- 生成 AI を使用してどのようなビジネス タスクを強化する予定ですか?
- これらのタスクにはどのモデルが適していますか?
生成 AI ソリューションの中心には、基礎モデル、つまり膨大な量のデータでトレーニングされた大規模なモデルがあります。 基本的に、基盤モデルは、オーダーメイドの生成 AI ソリューションを作成し、開発プロセスを簡素化し、生成 AI のコストを削減するための基礎として機能します。 通常、その機能には、自然言語処理 (NLP)、コンピューター ビジョン (CV)、コンテンツ生成が含まれます。
基礎モデルの認知能力は、トレーニングされたパラメータの数に大きく依存します。 この文脈では、パラメーターとは、ニューラル ネットワークの重みなど、トレーニング データから学習されるモデル要素を指します。 これらのパラメーターは、モデルが意思決定と予測を行うのに役立ちます。 次の表は、パラメーターの数 (本質的にはこれらの意思決定要素の量) とモデルの認知能力の間の相関関係を示しています。
ただし、基礎モデルの機能に影響を与えるのはパラメーターの数だけではありません。 トレーニング データの品質と多様性も同様に重要です。 トレーニング データはモデルに入力される情報であり、モデルはそこから学習します。 このようなデータには、モデルが新しいデータを理解して解釈するのに役立つ幅広い例が含まれています。 さらに、モデルのアーキテクチャ (つまり、パラメーターとデータがどのように相互作用するかの構造設計) と、モデルがデータからどれだけ効果的に学習するかを決定する学習アルゴリズムの効率が重要な役割を果たします。 その結果、一部のタスクでは、パラメーターが少なくても、より優れたトレーニング データやより効率的なアーキテクチャを備えたモデルが、大規模なモデルよりも優れたパフォーマンスを発揮する可能性があります。
Gen AI のコストに関する期待を満たす基盤モデルの選択
既存のすべての世代 AI モデルは、大まかに 2 つのタイプに分類できます。
- クローズドソース モデルは、 Google、Meta、Microsoft、OpenAI などの大手テクノロジー企業によって開発されています。 それらのソース コード、アーキテクチャ、およびアプリケーション プログラミング インターフェイス (API) は、完全に独自のものにすることも、サードパーティが利用できるようにすることもできます (通常は有料で、基本的に gen AI ソリューションの費用となります)。 場合によっては、データを使用してクローズドソース モデルのパフォーマンスを微調整できます。 この記事では、クローズドソース モデルを市販の Gen AI ソリューションと呼びます。 このようなモデルの主な利点は、クラウド インフラストラクチャが付属しており、元の開発者によって完全に保守されていることです。
- オープンソース モデルには、ソース コード、トレーニング手法、さらにはトレーニング データさえも公開されており、公開して変更することができます。 企業は、そのようなモデルを「そのまま」使用することも、独自のデータで再トレーニングして、より優れた精度とパフォーマンスを達成することもできます。 ただし、モデルを実行するにはオンプレミスまたはクラウドのインフラストラクチャをセットアップする必要があります。 したがって、このような Gen AI モデルのコストには、コンピューティング コストと、Gen AI ソリューションの強化を選択した場合はモデルのトレーニングに関連する費用が含まれます。
要約しましょう。 あなたの会社が gen AI の導入を検討している場合、主に 4 つの方法があります。
- カスタマイズせずにクローズドソース モデルを使用: Gen AI のパイオニアは、API を使用して、OpenAI の ChatGPT、Google Bard、Claude、Synthesia などの既製製品をアプリケーションと統合できます。 統合プロセスは非常に簡単で、生成 AI の価格設定も同様です (詳細は後ほど)。 市販の製品は頻繁に更新され、AI 開発者向けに広範なドキュメントを提供します。 欠点は? カスタマイズのオプションは限られており、カスタマー サポートの問い合わせの処理やビジュアル コンテンツの作成など、重要なビジネス タスクについては外部企業に大きく依存することになります。
- 企業データで市販のソリューションを再トレーニングする: このシナリオでは、社内 AI チームは、OpenAI などの特定のベンダーが開発した既存の世代 AI 製品を選択し、独自のデータを使用して微調整します。 カスタマイズされた gen AI ソリューションは、ユーザーの質問をよりよく理解し、より正確な回答を導き出します。 ただし、ベンダーはクエリの実行に対して少額の料金を請求するため、最終世代の AI コストには運用費用とカスタマイズ費用の両方が含まれます。
- オープンソース基盤モデルを「そのまま」使用する: 大げさに言えますが、企業は RoBERTa、GPT-2、GPT-Neo、またはその他のオープンソース モデルを選択し、追加のトレーニングなしで顧客の電子メールへの応答などのビジネス タスクに適用できます。 ただし、Gen AI のコストは、モデルが消費するコンピューティング リソースによって決まります。 馴染みのないデータやタスクに直面すると、Gen AI ソリューションのパフォーマンスが低下する可能性があります。
- データ上でオープンソース モデルを再トレーニングする: この場合、Gen AI モデル トレーニング用の特定のデータを取得して準備し、モデルのトレーニングと操作用にオンプレミスまたはクラウド サーバーを提供し、微調整と更新を続ける必要があります。タスクの進化に応じてモデルを変更します。 このオーダーメイドのアプローチでは優れたモデルのパフォーマンスが保証されますが、生成される AI のコストも高くなります。
実装オプションがわかったので、これらのオプションに伴う AI 生成のコストに注目してみましょう。
実装シナリオに基づいた Gen AI の価格に関する洞察
市販の Gen AI ツールのコスト
テキストの処理と生成を容易にする既製のサービスは、通常、入力または出力テキスト内の文字またはトークン (つまり、句読点から単語やその他の構文要素に至るテキストの基本単位) の数に基づいて企業に料金を請求します。 。
これが実際にどのように機能するかを次に示します。
- 文字ベースの請求: Google の Vertex AI によって駆動される gen AI ツールなどの一部のソリューションは、入力テキストと出力テキストの文字数に基づいてユーザーに請求します。 各文字、数字、スペース、句読点は 1 文字としてカウントされます。 たとえば、Vertex がサポートする PaLM 2 for Text モデルの生成 AI の価格は、入力テキストと出力テキストの 1,000 文字あたり 0.0005 ドルから始まります (別途請求)。
- トークンベースの課金: より高度な gen AI ツールは、テキストを文字ではなくトークンに分割する傾向があります。 モデルのトレーニングおよび処理方法に応じて、トークンは句読点、単語、または単語の一部になることがあります。 たとえば、OpenAI はトークンを約 4 文字のグループとして定義します。 「トムはジルに花を持ってきました。」のような簡単な文です。 「brought」と「flower」という単語が 4 文字のしきい値をわずかに超えているため、 は 8 つのトークンで構成されます。このような生成 AI ソリューションのコストに関しては、選択した言語モデルに大きく依存します。 OpenAI の GPT-4 Turbo は、市場で最も洗練されたツールの 1 つであり、入力テキストの場合は 1,000 トークンあたり 0.01 ドル、出力テキストの場合は 1,000 トークンあたり 0.03 ドルの料金がかかります。 古いバージョンである GPT-3.5 Turbo の場合、価格は入力テキストの場合は 1,000 トークンあたり 0.001 ドルから、出力テキストの場合は 1,000 トークンあたり 0.002 ドルまでと大幅に安くなります。世代 AI プロバイダーが異なると、文字とトークンの概念が異なることに注意してください。 。 最もコスト効率の高いオプションを選択するには、そのドキュメントと計画を検討し、どの製品が独自のビジネス ニーズに最も適しているかを検討する必要があります。 たとえば、タスクが分析ではなくテキスト生成を中心に展開している場合は、出力レートが低い生成 AI サービスの方が適しています。
一方、ビジュアルコンテンツ作成用の Gen AI サービスは、生成された画像ごとにユーザーに料金を請求する傾向があり、料金は画像のサイズと品質に関連付けられています。 DALL・E 3 で標準品質で作成された 1024 x 1024 ピクセルの画像 1 枚の料金は 0.04 ドルです。 より大きな画像 (1024×1792 ピクセル) や高解像度画像の場合、価格は 1 枚あたり 0.08 ~ 0.12 ドルに達する可能性があります。
また、Synthesia.io などのターンキー生成 AI プラットフォームも忘れてはなりません。これらのプラットフォームでは、より伝統的な価格設定アプローチが採用されています。 マーケティング チームがビデオ作成プロセスのスピードアップを目指している場合は、年間わずか 804 ドルでこのツールを試すことができます。
市販の Gen AI 製品のカスタマイズにかかるコスト
前のセクションからわかるように、既製の Gen AI 製品の大部分は従量課金制の収益化戦略を活用しています。
価格モデルは一見すると非常に単純そうに見えますが、特にさまざまな部門で複数世代の AI のユースケースを調査しようとしている場合、従業員が実行するクエリの数を予測するのは難しい場合があります。
これは、クラウド コンピューティングの初期の頃と同様、Gen AI ツールの価格設定と総所有コストに関する混乱を引き起こします。
商用 Gen AI ソリューションを使用するもう 1 つの欠点は、ChatGPT のような汎用製品には、企業の構造、製品、サービスに関する知識など、状況に応じた知識が不足していることです。 そのため、プロンプト エンジニアリングをマスターしたとしても、カスタマー サポートやレポート生成などの業務を AI 機能で強化することが困難になります。
マッキンゼーのシニアパートナーであるエリック・ラマール氏によると、この問題を解決するには、組織は「モデルで利用できるデータ環境を構築する必要がある」という。 言い換えれば、企業データや API を介して外部ソースから取得した情報に基づいて、市販の Gen AI ツールを再トレーニングする必要があります。
目標を達成するには 2 つの方法があり、各シナリオで生成 AI のコストに影響を与えるいくつかの要因があります。
Gen AI 機能を備えた Software-as-a-Service (SaaS) プラットフォームの使用
SAP、TIBCO Spotfire、Salesforce などの多くの著名な SaaS ベンダーが、顧客データを使用して微調整できる生成 AI サービスを展開しています。 たとえば、Salesforce は、Salesforce Data Cloud から独自のデータを取得して顧客の質問に対するパーソナライズされた応答を作成する会話型 AI アシスタントである Einstein Copilot を発売しました。 インテリジェント アシスタントによって利用される情報には、Slack の会話、テレメトリ、エンタープライズ コンテンツ、その他の構造化データおよび非構造化データが含まれます。
Salesforce クライアントは、Einstein Copilot Studio のコード不要のプロンプトビルダーとモデルビルダーを使用して、カスタム AI モデル、スキル、プロンプトを作成することもできます。 現時点では、後者のツールは OpenAI の大規模言語モデル (LLM) をサポートしていますが、この製品を Amazon Bedrock や Vertex AI などの他のサードパーティ ソリューションと統合する計画があります。 Einstein Copilot はまだパイロット段階にあるため (冗談ではありません)、生成 AI の価格情報はまだ公開されていません。 ただし、生成 AI Sales GPT アシスタントのコストは、現在ユーザーあたり月額 50 ドルとなっており、そのコストを考えれば、どのようなことが予想されるかがおおよそわかるでしょう。
API を介して企業ソフトウェアを Gen AI ソリューションと統合し、データでモデルを再トレーニングする
gen AI の実装コストを削減するには、中間の SaaS ツールを排除し、アプリを API レベルで商用の gen AI ソリューションと直接結合することができます。 たとえば、カスタマー サポート チャットボットを gen AI 機能で強化したい場合は、OpenAI API を使用して OpenAI のモデルの 1 つ (GPT-3.5 や GPT-4 など) と同期できます。 次に、機械学習用にデータを準備し、そのデータを OpenAI にアップロードし、OpenAI CLI ツールと Open AI Python ライブラリを使用して微調整プロセスを管理する必要があります。 モデルを微調整している間は、1,000 トークンあたり 0,008 ドルが課金されます (GPT-3.5)。 モデルが実稼働に入ると、入力レートと出力レートはそれぞれ、1,000 トークンあたり $0,003 と 1,000 トークンあたり $0,006 になります。 OpenAI サーバーでデータをホストすることを選択した場合、Gen AI の全体コストにはストレージ コストも含まれます。 データ ストレージ費用により、1 日あたり 1 GB のデータあたり 0.2 ドルが最終見積もりに追加される可能性があります。 データの準備とモデルの微調整の取り組みも忘れないでください。 IT 部門が必要なスキルを持っていない限り、信頼できる AI 開発サービス会社と提携する必要があります。
オープンソースの Gen AI モデルを「現状のまま」使用するコスト
免責事項: 私たちは、ChatGPT に似たカスタム基盤モデルをゼロから構築することを提案しているわけではありません。これは、5 億 4,000 万ドルの損失を補うための Microsoft からの OpenAI の支援など、十分な支援を得ている人たちに任せるのが最善の事業です。
GPT-3 のようなさらに基本的な基盤モデルでは、初期トレーニングと導入コストが 400 万ドルを超える可能性があります。 さらに、これらの基礎モデルの複雑さは、近年驚くべき速度で急増しています。
ITRex: カスタム
大規模な AI モデルのトレーニングに必要なコンピューティング リソースの量は、3.5 か月ごとに 2 倍になります。 基礎モデルの複雑さも変化しています。 たとえば、2016 年に、Bert-Large は 3 億 4,000 万のパラメーターを使用してトレーニングされました。 比較すると、OpenAI の GPT-3 モデルは、約 1,750 億のパラメーターを使用してトレーニングされました。
幸いなことに、基礎モデルがすでに存在しているため、企業は生成 AI の実装コストを最適化しながら、それらの実験を開始するのが比較的簡単です。 基本的に、基盤モデルはカスタマイズの余地を残しつつ、複雑な問題を解決するための出発点を提供するため、AI ソフトウェア エンジニアのためのツールキットとして扱うことができます。
ITRex: カスタム
既存の基礎モデルを大まかに 3 つのカテゴリに分類できます。
- 言語モデルは、テキストの翻訳、生成、質問応答タスクを処理できるように設計されています。
- コンピューター ビジョン モデルは、画像分類、物体検出、顔認識に優れています。
- 3 番目のカテゴリである生成 AI モデルは、モデルが消費したデータに似たコンテンツを作成します。 このコンテンツには、新しい画像、シミュレーション、または場合によってはテキスト情報が含まれる場合があります。
ニーズに最適なオープンソース モデルを選択したら、API を使用してそれをソフトウェアと統合し、独自のサーバー インフラストラクチャを利用できます。
このアプローチには、次の AI 生成コストがかかります。
- ハードウェアのコスト: AI モデル、特に大規模なモデルの実行には、大量の計算リソースが必要です。 会社に適切なハードウェアがない場合は、強力な GPU または CPU への投資が必要になる場合がありますが、これは高価になる可能性があります。 モデルが比較的小さい場合は、NVIDIA RTX 3080 などのハイエンド GPU で十分な場合があります。 このような GPU の価格は 700 ドルから 1,500 ドルの範囲です。 GPT-2 などの大規模モデルの場合は、複数のハイエンド GPU、または専用の AI アクセラレータが必要になります。 たとえば、単一の NVIDIA A100 GPU の価格は 10,000 ドルから 20,000 ドルになります。 したがって、複数の GPU を備えたセットアップには 30,000 ドルから 50,000 ドルの費用がかかる可能性があります。
- クラウド コンピューティングのコスト: ハードウェアを購入する代わりに、Amazon Web Services (AWS)、Google Cloud Platform (GCP)、Microsoft Azure などのプロバイダーからクラウド コンピューティング リソースをレンタルできます。 これらのサービスは使用量に基づいて料金が請求されるため、コストはコンピューティング時間とストレージの点でリソースをどれだけ使用したかによって異なります。 たとえば、AWS 上の GPU インスタンス (P3 や P4 など) の料金は、インスタンスの種類に応じて 1 時間あたり 3 ドルから 24 ドルになります。
- 電気代とメンテナンス: 独自のハードウェアを使用する場合は、マシンを稼働させるための電気代と、追加の冷却システムの使用にかかる電気代が発生する可能性があります。 ハードウェアのメンテナンス費用もかさむ可能性があります。
- 統合と展開: AI モデルを既存のシステムに統合して展開するには (特に運用環境で)、追加のソフトウェア開発作業が必要になる場合があり、これにより人件費が発生する可能性があります。 ソフトウェア開発会社に AI 開発をアウトソーシングする場合の費用は 1 時間あたり 50 ドルから 200 ドルの範囲であり、総経費は数千ドルから数万ドルになります。
- データのストレージと管理: モデルで使用されるデータの保存と管理は、特に大規模なデータセットを扱う場合やクラウド ストレージ ソリューションを使用する場合にコストがかかる可能性があります。 オンサイト設置の場合、生成 AI データの保存コストは、トレーニング データセットのサイズと冗長性のニーズに応じて、1,000 ドルから 10,000 ドルの範囲になる可能性があります。 AWS S3 などのクラウドベースのデータ ストレージ ソリューションの料金は、運用とデータ転送に追加料金がかかり、GB あたり月額 0.021 ドルから 0.023 ドルとさまざまです。
最終的に、企業が生成 AI 基盤モデルを「そのまま」採用し、自社のインフラストラクチャに展開すると、どれくらいのコストがかかるでしょうか。 AI の生成コストは以下に及ぶ可能性があります。
- ハードウェア: 20,000 ~ 50,000 ドル (ハイエンド GPU または基本的なマルチ GPU セットアップの場合)
- 電気代とメンテナンス費: 年間約 2,000 ~ 5,000 ドル
- 統合と展開: 10,000 ~ 30,000 ドル (統合の複雑さが中程度であると仮定)
- データのストレージと管理: 5,000 ~ 15,000 ドル (データ サイズによって異なります)
生成 AI ソリューションのセットアップと運用にかかる総コストには、次のものが含まれます。
- 初期導入費用: 約 37,000 ドルから 100,000 ドル (ハードウェア + 初期統合およびストレージのセットアップ)
- 経常経費: 7,000 ドルから 20,000 ドル (電力、メンテナンス、継続的な統合、データ管理コストを含む)
これらの大まかな見積もりは、特定の要件、場所、市場の状況によって大きく異なる場合があります。 よりパーソナライズされた正確な見積もりを得るには、専門家に相談することが常に最善です。 さらに、ハードウェアおよびクラウド サービスの現在の市場価格を確認して最新の価格を確認することをお勧めします。
データを使用してオープンソース Gen AI ソリューションを再トレーニングするコスト
会社がオープンソース基盤モデルの調整を検討している場合は、生成 AI の実装コストに影響を与える可能性のある要因を考慮することが重要です。
このような要因には以下のものが含まれます。
- モデルのサイズ: GPT-3 などの大きなモデルでは、微調整とデプロイにさらに多くのリソースが必要になります。 その結果、生成 AI のコストは、モデルのサイズと複雑さに応じて増加します。 一方、GPT-2、XLNet、StyleGAN2 などのより単純なオープンソース基盤モデルでは、同じレベルの一貫性と関連性を備えたコンテンツを生成できません。
- 計算リソース: 企業のデータを使用して基礎モデルを再トレーニングするには、かなりの計算能力が必要です。 したがって、Gen AI ソリューションのコストは、独自のハードウェアを利用しているかクラウド サービスを利用しているかによって決まり、後者の価格はクラウド プロバイダーと運用の規模によって異なります。 よりシンプルなモデルを選択してオンプレミスに展開する場合、生成 AI ソリューションの微調整に GPU コストとして 10,000 ~ 30,000 ドルかかることが予想されます。 クラウド コンピューティングの場合、インスタンスの種類に応じて、費用は 1 時間あたり 1 ドルから 10 ドルの範囲になる可能性があります。 GPT-3 のようなオープンソース モデルには、50,000 ~ 100,000 ドルを超える、より高度な GPU セットアップが必要です。 関連するクラウド コンピューティング費用は、ハイエンド GPU インスタンスの場合、1 時間あたり 10 ドルから 24 ドルの範囲になります。
- データの準備: 基盤モデルを微調整するためにデータを収集、クリーニング、準備するプロセスは、リソースを大量に消費する可能性があります。 したがって、生成 AI の実装コストには、データの保存、処理に関連する費用が含まれます。また、会社に独自のデータがない場合、またはセキュリティやプライバシー上の理由でデータセットを使用できない場合には、トレーニング データセットの購入にかかる費用も含まれます。
- 開発時間と専門知識: AI 人材の獲得は安くありません。 米国を拠点とする社内 AI エンジニアの費用は年間 70,000 ~ 200,000 ドルに加え、採用、給与、社会保障、その他の管理費がかかります。 AI 開発の専門知識を持つオフショア ソフトウェア エンジニアリング会社と提携することで、AI の生成コストを削減できます。 場所にもよりますが、中央ヨーロッパやラテンアメリカなどの主要なアウトソーシング拠点におけるシニア開発人材の時給は、62 ドルから 95 ドルの範囲です。
- メンテナンス コスト: モデルのメンテナンス、更新、トラブルシューティングはお客様が単独で責任を負います。これには継続的な努力と機械学習エンジニアリングおよび運用 (MLOps) の専門知識が必要です。
上記の要因を考慮すると、すぐに利用できる基盤モデルに基づいてカスタマイズされた生成 AI ソリューションを作成する現実的なコストはいくらでしょうか? GPT-2 のような適度に大規模なモデルを微調整しようとしている中堅企業の場合、関連する生成 AI 実装コストは以下に及ぶ可能性があります。
- ハードウェア: 20,000 ~ 30,000 ドル (中程度の GPU セットアップの場合)
- 開発: 社内人材と外部委託人材を組み合わせて 6 か月の開発時間を想定:
社内: 35,000ドル~100,000ドル(半年分の給与)
アウトソーシング: 20,000 ~ 40,000 ドル (平均料金 75 ドル/時間で 400 時間と仮定)
- データ準備: 5,000 ~ 20,000 ドル (データのサイズと複雑さによって異なります)
- メンテナンス: 年間 5,000 ~ 15,000 ドル (継続費用)
生成 AI ソリューションのセットアップと運用にかかる総コストには、次のものが含まれます。
- 初期導入費用: 約 80,000 ドルから 190,000 ドル (ハードウェア、開発、データ準備費用を含む)
- 経常経費: 5,000 ドルから 15,000 ドル (メンテナンスおよび継続的な費用)
実際の Gen AI の開発および導入コストは、特定のプロジェクト要件、トレーニング データと社内 AI 人材の利用可能性、およびアウトソーシング パートナーの所在地によって異なります。 最も正確な最新の価格については、専門家またはサービスプロバイダーに直接相談することをお勧めします。
生成 AI システムの 19 万ドルは不当に高価に思えるかもしれませんが、オープンソースの基盤モデルを使用して生成 AI ソリューションを構築するコストは、市販のツールを選択するよりも低い可能性があります。
ChatGPT が注目を集める前、AI Dungeon と呼ばれる AI ベースのアドベンチャー ゲームを開発した先駆的なスタートアップである Latitude は、テキスト生成に OpenAI の GPT モデルを利用していました。
ユーザーベースが拡大するにつれて、OpenAI の請求書と Amazon インフラストラクチャの費用も増加しました。 ある時点で、同社は増加するユーザーのクエリに対処するために、関連コストとして月額 20 万ドルを支払っていました。
新しい生成 AI プロバイダーに切り替えた後、同社は運用コストを月額 10 万ドルに削減し、収益化戦略を調整して、高度な AI を活用した機能の月額サブスクリプションを導入しました。
したがって、生成 AI の価格設定を最適化しながら適切な実装アプローチを選択するには、プロジェクトの要件を事前に徹底的に分析することが重要です。 だからこそ、私たちはクライアントに対し、AI 開発の取り組みを発見フェーズから開始することを常に推奨しています。
Gen AIをビジネスに導入する際に考慮すべきこと
コストの面で生成 AI に何が期待できるかがわかったので、次はこのテクノロジーの実装の落とし穴と考慮事項について説明します。
- 基礎モデル、特に大規模な言語モデルは幻覚を起こし、ユーザーの質問に対して一見正当であるように見えても完全に間違った答えを生成する可能性があります。 企業は、トレーニング データを改善し、さまざまなモデル アーキテクチャを実験し、効果的なユーザー フィードバック ループを導入することで、このシナリオを回避できる可能性があります。
- Gen AI ソリューションは、すぐに古くなってしまう膨大な量のデータを使用してトレーニングされます。 その結果、モデルを定期的に再トレーニングする必要があり、生成 AI の実装コストが増加します。
- 電子医療記録 (EHR) エントリなどの特定のデータに基づいてトレーニングされた財団モデルは、当面の専門知識以外の有効なコンテンツを作成するのに苦労する可能性があります。 一方、汎用モデルは、ドメイン固有のユーザー クエリに苦労します。 この問題に対処する方法としては、ハイブリッド モデルの作成、転移学習手法の活用、ユーザー フィードバックによるモデルの微調整などが挙げられます。
- Gen AI ソリューションは本質的にブラックボックスです。つまり、なぜ特定の結果が得られるのか、またその精度をどのように評価するのかが明確になることはほとんどありません。 この理解の欠如により、開発者がモデルを微調整することができなくなる可能性があります。 モデルの解釈可能性テクニック、アテンション メカニズム、監査証跡の導入など、生成 AI モデルのトレーニング中に説明可能な AI 原則に従うことで、モデルの意思決定プロセスについて洞察を得ることができ、そのパフォーマンスを最適化できます。
また、生成 AI の実装を開始する前に、企業が回答する必要のある質問がいくつかあります。
- ベンダー ロックインを防ぎつつ、テクノロジーが差別化要因となる機能にのみ gen AI を採用していることを検証するための、確実な購入対構築戦略は確立されていますか? この戦略は、変更管理と人工知能のスケーリングに関する詳細なロードマップと、必要に応じてビジネス プロセス全体を再設計するための規定によって強化される必要があります。
- 社内の IT 部門は、複雑な ML モデルとそのトレーニング データの品質をテスト、微調整、維持するための適切な MLOps スキルを持っていますか? そうでない場合は、これらのタスクを引き受ける信頼できる AI 開発会社をすでに選択していますか?
- クラウドとエッジの両方に大量のコンピューティング リソースがありますか? また、IT インフラストラクチャのスケーラビリティと、さまざまなタスク、プロセス、ユニット間で Gen AI モデルを再利用できるかどうかを評価することも重要です。
- あなたの会社または AI 開発パートナーは、概念実証 (PoC) を通じて世代 AI の実現可能性をテストし、制御されたサンドボックス環境の外で実験を拡張するスキルを持っていますか?
- 最後に重要なことですが、あなたの組織には、機密情報を保護し、業界および地域固有の規制へのコンプライアンスを確保するための効果的なプライバシーとセキュリティのメカニズムがありますか?
よく考えられた実装計画を立てることは、リスクのない方法でテクノロジーを導入し、より早くメリットを享受できるだけでなく、人工知能のコストを削減することにも役立ちます。
ITRex gen AI コンサルティング サービスを利用して、gen AI がビジネス プロセスの刷新、適切な gen AI 実装アプローチの選択、gen AI コストの最適化に役立つかどうかを判断してください。 ボールを動かし始めるために私たちに手紙を書いてください!
この記事は元々 ITRex Web サイトに掲載されたものです。