AI の概念実証を作成することで、AI の開発と採用のリスクを最小限に抑える方法
公開: 2023-01-19私たちのクライアントは、概念実証 (PoC) から始めることを選択したため、人工知能 (AI) プロジェクトに費やした予算の 4 分の 1 しか失いませんでした。 PoC により、彼らはアイデアをテストし、限られた支出ですぐに失敗することができました。 時間と労力の無駄を避けるために、AI ソリューション コンサルタントに概念実証を依頼してください。特に、会社が AI の水域をテストしているだけの場合は特にそうです。
この記事では、AI PoC とは何かを説明し、最初の PoC をガイドする 5 つのステップと、途中で遭遇する可能性のある課題について詳しく説明します。 また、ポートフォリオからの AI PoC の例も示します。 そして、最初のパラグラフに描かれている例のハッピー エンドを見つけることができます。
AI PoC とは何ですか?また、プロジェクトの成功に欠かせないのはいつですか?
AI PoC は、ソリューションが実現可能であり、成功する可能性があるかどうかをテストするために設計された、提案された AI ソリューションのプロトタイプまたはデモンストレーションです。 AI PoC を作成する目的は、コンセプトを検証し、提案されたソリューションの潜在的な利点を評価し、潜在的な課題や制限を特定することです。
AI PoC では通常、提案された AI ソリューションの小規模バージョンを構築し、制御された環境でテストして、そのパフォーマンスと目的を満たしているかどうかを確認します。 その後、AI PoC の結果を使用して、ソリューションの開発と実装についてさらに情報を得ることができます。
通常のソフトウェア PoC と比較して、AI PoC には、AI ソリューションが時間の経過とともに学習および適応する能力や、AI バイアスなどのソリューションの潜在的な倫理的影響など、より複雑な考慮事項が含まれる場合があります。 AI PoC プロジェクトのテクノロジー スタックも異なります。
機械学習アルゴリズム
これらのアルゴリズムにより、AI システムは構造化データから学習し、その学習に基づいて予測または決定を行うことができます。 教師あり学習アルゴリズム、教師なし学習アルゴリズム、強化学習アルゴリズムなど、さまざまな種類の機械学習アルゴリズムがあります。
ニューラル ネットワーク
これらの計算モデルは、人間の脳の構造と機能に着想を得ています。 ニューラル ネットワークは、大量の非構造化データを処理および分析できます。 画像認識、自然言語処理、シナリオ モデリング、予測など、さまざまなタスクを実行するようにトレーニングできます。
ロボティクス
この技術は、自律的な操作と意思決定が可能な物理システムを構築するために使用できます。 ロボティクス ソリューションには、センサー、アクチュエータ、およびその他のハードウェア コンポーネントが組み込まれており、エンジニアは環境と対話してタスクを実行できるロボットを構築できます。
クラウドコンピューティング
Microsoft Azure、Google Cloud、AWS などのクラウド コンピューティング プラットフォームは、AI PoC の開発とテストをサポートするために必要なコンピューティング能力、ストレージ リソース、および事前構成されたサービスを提供します。 これらのプラットフォームは、開発とテストが完了すると、AI ソリューションをホストしてデプロイすることもできます。
AI PoC の作成には、データの収集と準備、機械学習モデルの構築とトレーニング、AI システムのパフォーマンスのテストと評価が含まれます。 AI PoC の作成にかかる時間は、提案された AI ソリューションの複雑さ、PoC で利用できるリソースと専門知識、PoC の具体的な目的など、いくつかの要因によって大きく異なります。 数日または数週間で開発できる AI PoC もあれば、完了までに数か月またはそれ以上かかるものもあります。
AI PoC を回避する方法が絶対にないのはいつですか?
次のシナリオでは、プロジェクトを AI PoC で開始することが不可欠です。
- あなたのプロジェクトは、まだテストされていない革新的なアイデア、つまりビジネス レベルで研究されているものの、技術的には試みられていないものに依存しています。 あなたもあなたの技術ベンダーも、それが実装できるかどうか確信が持てません。
- 利害関係者、投資家、および他の人に、限られた時間枠内でアイデアの実現可能性を示す必要がある場合。 AI PoC は、インタラクティブなプロトタイプなどよりもうまく機能します。
AI PoC が時間の無駄になる状況はありますか?
AI PoC はほとんどの場合に有益ですが、いくつかの例外があります。 プロジェクトが次のいずれかのカテゴリに該当する場合、AI PoC はやり過ぎになる可能性があります。
- あなたのアイデアとアプローチが、機能的および技術的な観点から非常によく文書化されている場合。 これはまれです。
- 開発したいソリューションが標準的で、現場での一般的な慣行に似ている場合。 これが実現可能であり、技術的な観点から可能であることはすでにわかっています。
- フロントエンド開発者とバックエンド開発者が理解できるソフトウェアを構築したい場合、多くの場合、彼らはすでに同じものに取り組んでいるためです。
AI PoC から得られるメリットとは?
AI PoC を使用すると、次の利点が得られます。
- より多くのリソースを努力に投入する前に、潜在的な課題を特定する。 AI PoC を使用すると、「すばやく失敗し、よりよく失敗する」ことができます。 チームが克服できない課題に遭遇した場合、すべての利害関係者は、他の方法で同じ目標に到達するために、再編成するか、場合によっては仮説を変更する時間があります。
- 長期的なプロジェクトに飛び込むのではなく、革新的なアイデアを小さなステップでテストするため、ビジネス リスクを最小限に抑えることができます。
- データ収集方法の改善。
- 投資家やその他の利害関係者を参加させる。
- 時間とリソースの節約。 AI PoC は、ビジネスまたはプロセスに関連する問題を明らかにし、本格的なプロジェクトを開始する前にすべてを修正する時間を与える可能性があります。
- 専門知識を構築し、将来同様のプロジェクトで別のチームメンバーを指導する知識所有者を作成します。
- 技術スタックを小規模でテストして、選択したビジネス ケースへの適合性を理解します。
AI PoC が問題を解決したポートフォリオの例
ITRex ポートフォリオから AI PoC の例をいくつか紹介します。PoC アプローチをさらに理解するのに役立ちます。
ML だけでは答えにならないことを理解する
大規模な貨物物流会社は、1 日あたり 10,000 ~ 15,000 件の出荷を行っており、すべての出荷には、業務をカバーする船荷証券と請求書が添付されていました。 従業員は、すべてのドキュメントを手作業で処理することに疲れ果てていました。 同社は、光学式文字認識 (OCR) を使用してスキャンしたドキュメントを処理し、さまざまな分野を識別する ML を活用したソリューションを構築したいと考えていました。
クライアントは、機械学習が最善の解決策であると信じていたため、この仮定をテストするために AI PoC を進めました。 すぐに、ドキュメントの形式が異なっていて、フィールドに使用されるラベルが大幅に異なることに気付きました。たとえば、Load ID フィールドだけでも 8 つのエイリアスがありました。 その結果、ML モデルは成長し続けました。 遅くなり、非効率的になりました。 私たちのチームは、このモデルに動的アルゴリズム (さまざまなフィールド ラベルがハードコードされた辞書など) を使用することにしました。 この変更により、ソリューションのパフォーマンスが大幅に向上し、クライアントの時間と費用が節約されました。
クライアントが AI PoC をスキップすることを決定した場合、純粋な ML ベースのモデルという最初のアイデアが最適なソリューションではないことに気付くために、7 か月を無駄にしていたでしょう。 AI PoC により、わずか 2 か月でこの結論に達しました。 この AI PoC が成功裏に完了した後、手動処理負荷の約 25% を引き継いで、4 種類のドキュメントを処理できる MVP を構築しました。
メタのデータ使用制限に驚かされる
エンターテインメント業界のクライアントは、独立したミュージシャン向けの AI 駆動の分析プラットフォームを構築したいと考えていました。 このソリューションは、Facebook や Instagram などのソーシャル メディアをクロールしてデータを収集することになっていました。 このすべての情報を処理して、アーティストに対する人々の感情を測定します。 ミュージシャンは、プラットフォームにサインアップして、どのようなソーシャル メディアの行動が成功に最も有益であるかについてのフィードバックを受け取ることができます。
アイデアをテストするために AI PoC を進めました。 わずか 2 週間後、Facebook と Instagram からデータを収集して上記の目的に使用することはまったく不可能であることに気付きました。 通常、一部のデータは Graph API を介して取得できました。 このため、Meta の検証済みビジネス アカウントと同様に、必要な情報にアクセスできると想定しました。 しかし、クライアントは検証済みのビジネス アカウントを提供してくれませんでした。また、Graph API からのデータだけでは、このソリューションを機能させるのに十分ではありませんでした。
クライアントが PoC をスキップすることにした場合、発見プロジェクトで約 20,000 ドルを無駄にしていたでしょう。 これには、ソリューションの詳細な説明と開発コストの見積もりが含まれていました。 しかし、彼らは AI PoC から始めることを選択したため、約 5,000 ドルしか費やしませんでしたが、Meta によるデータ アクセス制限のために提案されたソリューションを実行することは不可能であることが判明しました。
初めての AI PoC のための 5 ステップ ガイド
AI PoC を成功させるための 5 つのステップを以下に示します。 また、各ステップに関連する課題もリストします。
ステップ 1: AI で取り組みたい問題を特定する
AI PoC を実装して何を達成したいかを正確に指定することが不可欠です。 選択したユース ケースは、価値が高く、このテクノロジで最適に対処できるものである必要があります。 疑問がある場合は、まず、同じ分野の他の人が AI ソリューションを何に使用しているかを調べることから始めてください。 もう 1 つの方法は、ビジネスが直面している問題を調査し、それを AI の可能性と比較することです。
機会のリストを蓄積したら、次の質問をして、現在のプロジェクトに最適な機会を判断できます。
- あなたが解決しようとしている問題は十分に具体的ですか? 結果を評価して成功を判断できますか?
- この問題を他の技術で解決しようと試みたことはありますか?
- このプロジェクトを最後までサポートする才能と資金はありますか? 適切な人材が社内にいない場合、外部の専任チームを雇うことはできますか?
- 問題はあなたのビジネスにどのように影響しますか? この効果は、あなたの努力を正当化するのに十分なほど重要ですか?
- このプロジェクトを幹部に売り込むことはできますか? あなたの組織は、そのようなプロジェクトを引き受ける準備ができていますか?
- あなたの会社はすでにデータ戦略を持っていますか? もしそうなら、それはこのプロジェクトとどのように連携しますか?
- AI を使用してこの問題に取り組むことの潜在的なリスクと制限は何ですか?
関連する課題
- 付加価値があまりない、または AI の可能性を最大限に活用していないユース ケースを選択する。 人工知能は高価な技術であり、取るに足らないケースを選択すると、受け取るよりも多くの費用がかかることになります. 費用をよりよく理解するために、AI の実装にかかる費用に関する記事を確認してください。
ステップ 2: データを準備する
問題を明確に定義したので、次は AI アルゴリズムのトレーニング データを集計して準備します。 次の方法でそれを行うことができます:
- 社内で使用できるデータを確認する
- 特定の既製のアプリケーションまたは独自のソリューションを使用して半合成データを生成する
- 信頼できるプロバイダーからデータセットを購入する
- オープンソース データの使用
- 人を雇って目的に合ったデータをスクレイピングします。
1 つのソースに限定する必要はありません。 上記のいくつかのオプションを組み合わせて使用できます。
データ サイエンティストに依頼して、最初のデータ スクリーニングを実行します。 彼らは次のタスクを実行します。
- データを構造化する
- ノイズを除去してきれいにする
- 表形式のデータの場合は、欠落しているデータ ポイントを追加します
- 機能エンジニアリングの実行 (つまり、データ フィールドの追加と削除)
- データの結合やフィルタリングなどの操作を適用する
データ サイエンティストは、既存のデータセットで目的の結果を達成できるように、追加のデータを収集する方法や AI PoC の範囲を狭める方法についてアドバイスを提供できます。
データを使用する準備ができたら、次の 3 つのセットに分割します。
- モデルが学習に使用するトレーニング セット。
- モデルを検証し、トレーニングを繰り返すための検証セット。
- アルゴリズムのパフォーマンスを評価するテスト セット。
関連する課題
- トレーニング データは母集団全体を代表するものではありません。 この場合、アルゴリズムは一般的なケースではうまく機能する可能性がありますが、まれにしか発生しない場合には不十分な結果をもたらします。 たとえば、X 線を分析するヘルスケア ML モデルは、胸水などの一般的な疾患の検出には優れているかもしれませんが、ヘルニアなどのまれな疾患の検出には苦労します。
- クラスの不均衡: あるクラスを表すケースの数が別のクラスよりも大幅に多く、比率が 99.9% 対 0.1% の場合。
- クラスの混合などの不適切なラベル付け (例: バイクを車としてラベル付け)。
- トレーニング データセットのノイズが多い。
- 純粋なクラスの分離可能性を達成するのが難しい。 これは、トレーニング セット内の一部のデータを特定のクラスに正しく分類できない場合に発生します。
ステップ 3: ソリューションの設計と構築または購入
モデルを自分で構築する必要があるのか、それとも既存のソリューションを調達できるのか疑問に思われることでしょう。 AI モデルをゼロから作成することが理にかなっているのは、このような場合です。
- あなたのソリューションは革新的で、既存の標準に準拠していません。
- 既製のソリューションは、カスタマイズにコストがかかります。
- 最も近い既製のモデルはやり過ぎであり、実際に必要以上のことを行います。
モデルを購入してカスタマイズするコストがゼロから構築するよりも少ない場合は、既製のモデルを調達することを検討してください。
AI アルゴリズムをゼロから構築することにした場合、その精度をより細かく制御できます。 タスクを完了するには時間がかかりますが、ビジネス上の問題と内部プロセスに合わせて調整されます。 外部ソフトウェアに対応するためにシステムを変更する必要はありません。
アルゴリズムのトレーニングと実装のインフラストラクチャに関しては、ローカル リソースを使用する代わりにクラウドを利用できます。 最適なものを決定する際に考慮できる 4 つのパラメーターがあります。
- 安全。 セキュリティに関してデータの機密性が非常に高い場合は、すべてをオンプレミスに保持することをお勧めします。
- ワークロード。 処理負荷が重い場合は、クラウドを選択してください。
- コスト。 リソースをローカルで取得するか、時間の経過とともにクラウドの使用に対して支払うか、どちらがより多くの費用がかかるかを評価します。
- アクセシビリティ。 ソリューションをローカルでのみ使用する場合は、社内サーバーに依存できます。 地理的に異なる場所からアクセスできるようにする必要がある場合は、クラウドを検討する価値があります。
どのアプローチにも利点と欠点があります。 ヘルスケア セクターで事業を行っている場合は、ブログのヘルスケアにおけるクラウド コンピューティングの記事で明確に説明されています。 それ以外の場合は、AI の専門家に連絡して、アルゴリズム トレーニングに最適なテクノロジ スタックを選択してください。
関連する課題
- 適切なトレーニングの欠如。 これにより、モデルの一般化可能性が低くなるなどの問題が発生します。つまり、トレーニングで確認されていないデータに対してモデルが正確な予測を行うことができなくなります。 医療分野での X 線画像分析に戻ると、アルゴリズムは最先端のスキャンでキャプチャされた高品質の画像をうまく分析できるかもしれませんが、古いマシンで生成されたスキャンに適用するとうまくいきません。
- 既存のシステムとの統合。その一部は時代遅れであるか、独自のテクノロジによって強化されている可能性があります。
- 適切なモデル アーキテクチャを考え出すことができない (例: 目の前の問題に適した ML モデルを選択できない)。
- 選択したアーキテクチャの機能は、モデルの要件と一致できません。
- 入力データは揮発性です。つまり、モデルを頻繁に再トレーニングする必要があります。
- モデルがそのタスクを実行するために必要とするよりも多くのリソースを使用する。 単純なモデルを実行するために強力なサーバーに投資する必要はありません。
ステップ 4: AI PoC が価値を生み出す可能性を評価する
このステップでは、AI PoC が期待に応えられるかどうかを評価します。 評価を実行するには、いくつかの方法があります。
- 主要業績評価指標 (KPI) に戻り、それらに対してソリューションをテストします。 これらの要因には、正確性、顧客満足度、速度、柔軟性、公平性、および安全性が含まれる場合があります。
- AI PoC 展開前のシステムの運用方法に関するデータを収集します。 これには、特定の手動タスクに費やされた時間とエラーの数が含まれる場合があります。 次に、情報を使用して PoC の影響を評価する必要があります。
- ソリューションのパフォーマンスを、このタイプの問題のベンチマークまたはより広い業界のいずれかと見なされている他の製品と比較してください。 たとえば、画像分類関連の問題のベンチマークは、ImageNet などの一般的なデータセットで正確な結果を提供するモデルになります。
- フォーカス グループまたはオンライン アンケートを通じてユーザー フィードバックを収集し、満足度を測定し、何が欠けているかを判断します。
- 費用便益分析を実施して、このソリューションが組織に与える財務上の影響を理解します。
関連する課題
- 評価を間違える。 計算中の単純な計算ミス、またはビジネスの可能性の見積もりに関連するエラーである可能性があります。
ステップ 5: より良い結果を得るために AI PoC を反復するか、スケールアップする
前のステップで受け取った結果が標準に達していない場合は、ソリューションを変更してプロセス全体を繰り返すことを検討してください。 ML アルゴリズムを変更し、調整ごとにパフォーマンスを測定できます。 また、さまざまなハードウェア コンポーネントや代替のクラウド サービス モデルを試すこともできます。
AI PoC のパフォーマンスに満足している場合は、さまざまな方向へのスケーリングに取り組むことができます。 いくつかの例を次に示します。
- PoC を他のビジネス ケースに適用します。 ビジネス内でこの新しいソリューションの他のアプリケーションを探してください。 たとえば、予測メンテナンスの 1 つのアプリケーションとして AI をテストしている場合は、他の関連するシナリオに AI を適用することを試みることができます。
- インフラストラクチャをスケーリングします。 このソフトウェアを実行するために使用されるテクノロジを確認します。 より多くの処理能力またはより多くのデータストレージ容量を専念できますか? このような変更により、より多くのデータを使用し、待ち時間を短縮し、リアルタイムで結果を提供できるようになります。 また、将来のボトルネックの可能性を最小限に抑えます。
- PoC ソリューションを最適化します。 前のステップで妥当な結果が得られたとしても、精度を向上させる方法を探す価値があるかもしれません。 新しいデータまたはより正確にラベル付けされたデータを使用して、アルゴリズムのトレーニングを続けることができます。 または、より良い結果を得るために微調整や変更を試してみることもできます。
PoC フェーズに続いて全社的に AI を採用することを決定した場合は、組織に AI を実装する方法に関するガイドで役立つヒントを見つけることができます。
関連する課題
- アーキテクチャは慎重に検討されていませんでした。 このソリューションは 10,000 人のユーザーにはうまく機能するかもしれませんが、オーディエンスが 100,000 に達するとクラッシュします。
- モデルには、AI ソリューションをスケーリングしようとすると明らかになるバグが含まれています
- 意図されたもの以外の他のビジネス ケースにモデルを適用する。 たとえば、ガーデン用手押し車を組み立てるためのソリューションは、トラックの組み立てには適用できません。モーター付きの大きなガーデン用手押し車を組み立てる可能性があるからです。
結論として
AI の実装に関しては、小さく始めて、管理しやすい状態に保ちます。 成功を測定するための明確な目標と指標を備えた明確なビジネス ケースがあることを確認してください。 また、この記事の冒頭で紹介したケースを除いて、常に AI PoC の作成を検討してください。 これにより、完全に取り組み、期待に応えられない可能性のあるソリューションに多額の投資を行う前に、潜在的な障害を特定するのに役立ちます。
組織に AI を実装したいと考えていますが、ビジネス アイデアが実現可能かどうか確信が持てませんか? 連絡する! 私たちのチームは、アイデアを実際にテストするための PoC の実施を支援します。
2023 年 1 月 9 日に https://itrexgroup.com で最初に公開されました。