基盤モデルとは何ですか? また、基盤モデルは大規模な AI の実装にどのように役立つのでしょうか?
公開: 2023-03-29世界中の組織が長い間 AI への投資を続けてきましたが、プロトタイプから生産に至る人工知能プロジェクトの数は、依然として約 53% で変動しています。
専門家は、これは技術スキル、人的資源、および分離された AI の概念実証 (PoC) を他のユース ケースに拡張するためのツールが不足していることが原因であると考えています。 そしてもちろん、おそらくトレーニングのコストが高いため、AI モデルはタスクごとに区別されます。
ファウンデーション モデル (つまり、熟練した AI コンサルタントの指導の下、膨大な量のラベルのないデータを使用するようにトレーニングされた大規模な機械学習モデル) は、AI のスケーラビリティとコストに関する困難な問題に対する究極の答えとなる可能性があります。
あなたの会社は、紙ベースのドキュメントを編集可能なテキスト ファイルに変換することから、ソーシャル メディアのレビューで顧客の感情を明らかにすることまで、さまざまなタスクを強化または自動化するための出発点としてこのようなモデルを使用できます。 そして、そこから優れた AI を構築し、基盤モデルを将来のタスクやユースケースに適応させることができます。
基礎モデルとは何ですか? また、基礎モデルは企業の AI の卓越性にどのように役立つでしょうか?
岩の下に住んでいない限り、OpenAI の ChatGPT について聞いたことがあるでしょう。 この言語モデル プログラムは、教師あり学習を使用して膨大な量の会話テキストを吸収しており、微調整段階では、ヒューマン フィードバックからの強化学習 (RLHF) アプローチが採用されています。
このジェネレーティブ AI ソリューションは、1,750 億のパラメーターに対して入力データを分析し、書き言葉を深く理解することができます。 また、質問に答えたり、テキストを要約して翻訳したり、特定のトピックに関する記事を作成したり、コードを書いたりすることもできます。 必要なのは、ChatGPT に適切なプロンプトを提供することだけです。
OpenAI の画期的な製品は、私たちが知っている AI アプリケーション開発を変革できる基盤モデルの一例にすぎません。
私たちが知っているように、基盤モデルは AI 開発を混乱させます。 ユースケースごとに複数のモデルをトレーニングする代わりに、事前トレーニング済みの AI ソリューションを活用して、複数の部門や職務にまたがるタスクを強化または完全に自動化できるようになりました。
ChatGPT のような基盤 AI モデルを使用すると、企業は、強化または自動化するすべてのタスクについて、アルゴリズムをゼロからトレーニングする必要がなくなります。 代わりに、ユースケースに最適な基盤モデルを選択し、達成したい特定の目的に合わせてそのパフォーマンスを微調整するだけで済みます。
Foundation モデルは、トレーニング データを取得するのが困難または費用がかかりすぎる業界に最適です。 これらの業界には、ヘルスケア、ライフ サイエンス、バイオテクノロジー、製造業などが含まれます。
Foundation AI モデルにはどのような種類がありますか?
ビジネス アプリケーションでは、いくつかのタイプの基盤 AI モデルが一般的に使用されています。
- 半教師あり学習モデルは、ラベル付きデータとラベルなしデータが混在するデータセットでトレーニングされます。 目標は、ラベル付けされたデータを使用して、ラベル付けされていないデータに対するモデルのパフォーマンスを向上させることです。 AI の専門家は、トレーニング データの取得が困難な場合や、企業にとって多大な費用がかかる場合に、半教師あり学習を利用します。 これは、たとえば、さまざまなヘルスケア IT 規制が制定されている医療現場で発生する可能性があります。 半教師ありモデルの一般的な例には、事前トレーニング済みのテキスト ドキュメントと Web コンテンツの分類アルゴリズムが含まれます。
- 教師なし学習モデルは、ラベルのないデータセットで完全にトレーニングされます。 トレーニング データのパターンを発見したり、独自に構造化したりします。 このようなモデルは、とりわけ、トレーニング データセットで明らかにしたパラメーターに基づいて、情報をクラスターにセグメント化できます。 機械学習 (ML) エンジニアは、自動エンコーダー、K 平均法、階層的クラスタリング、およびその他の手法を利用して、教師なし機械学習ソリューションを作成し、その精度を向上させます。
- 強化学習モデルは、特定のトレーニングなしで環境と相互作用します。 望ましい結果を達成するとき、つまり開発者が望んでいた予測を行うとき、モデルは報われます。 それどころか、強化学習モデルは、誤った仮定を行うとペナルティを受けます。 このアプローチにより、AI アルゴリズムは、教師ありおよび半教師ありのアルゴリズムよりも複雑な決定を下すことができます。 実際の強化学習の例は、自動運転車や AlphaGo などのゲームプレイ AI プログラムです。
- ジェネレーティブ AI モデルは、トレーニングされたデータに似た新しいデータを生成します。 このデータには、テキスト、画像、オーディオ クリップ、およびビデオが含まれる場合があります。 前のセクションで説明した ChatGPT ソリューションは、基盤 AI モデルのこのカテゴリに属します。 ジェネレーティブ AI の他の例には、自然言語で記述された説明に基づいて画像を作成する DALL-E 2 ツールや、テキストベースの入力を使用してビデオ コンテンツを作成する Synthesia.io ビデオ プラットフォームが含まれます。
- 転移学習モデルは、トレーニングされたもの以外のタスクを解決できます。 たとえば、コンピュータ ビジョン エンジニアは、事前にトレーニングされた画像分類アルゴリズムをオブジェクト検出に活用できます。 また、顧客の感情分析など、より知識集約的なタスクに既存の NLP ソリューションを利用することもできます。 一般的な事前トレーニング済みの機械学習ソリューションには、オブジェクトの分類と画像検出のための堅牢なモデルを含むコンピューター ビジョン ライブラリである OpenCV や、Hugging Face の Transformers ライブラリ オファリング (Generative pre-trained Transformer (GPT) など) などがあります。生成 (GPT-3) は、ChatGPT サービスを強化します。
- メタ学習モデルは、タスク指向のモデルとは異なり、文字通り学習することを学びます。 特定の問題を解決するためにデータをむさぼり食う代わりに、そのようなモデルは問題解決のための一般的な戦略を開発します。 このようにして、メタ学習ソリューションは、メモリや計算能力などのリソースをより効率的に使用しながら、新しい課題に簡単に適応できます。 ML の専門家は、トレーニング データが不足している場合や、企業がビジネスへの AI の実装に関する明確な計画を持っていない場合に、メタ学習を利用します。 TensorFlow、PyTorch、およびその他のオープンソースの機械学習ライブラリとフレームワークは、開発者がメタ学習手法を探索できるようにするツールを提供します。 最後に、Google などのクラウド コンピューティング プロバイダーは、ML の専門家や初心者が AutoML を使用してカスタム機械学習モデルをトレーニングするのを支援しています。
特定のアプリケーションとデータの種類によっては、ある基盤モデルが別の基盤モデルよりも適切な場合があります。 あなたの会社は、ビジネス目標を満たしている限り、少し調整が必要なオープンソース ソリューションか、すぐに使用できるサードパーティ製品のどちらかを自由に選択できます。
次のプロジェクトで Foundation AI モデルを活用する 3 つの理由
スタンドアロンのタスク指向の機械学習モデルと比較して、基盤モデルは信頼性の高い AI ソリューションをより迅速かつ安価に作成するのに役立ち、関与するデータが少なくなり、微調整が最小限に抑えられます。 言うまでもなく、単一の組織が取得できるよりも多くのデータでトレーニングされているため、基盤モデルは初日から高い精度を示します。
以下に、基盤 AI モデルの利点の概要を示します。
- Foundation モデルは、AI をより速く、より安価に、より少ないリソースで実装するのに役立ちます。 AI ソリューションの作成と展開には、かなりの時間とリソースが必要です。 新しいアプリケーションごとに、適切にラベル付けされた個別のデータ セットが必要です。 持っていない場合は、その情報を検索、クレンジング、ラベル付けするデータ専門家のチームが必要になります。 IBM AI の CTO である Dakshi Agrawal 氏によると、基礎モデルは、特定のユース ケースに応じて、データのラベル付け要件を 10 ~ 200 倍削減するのに役立ち、大幅なコスト削減につながります。 ビジネス面では、クラウド コンピューティングの費用の増加も考慮する必要があります。 たとえば、Google は数百万ドルを費やして DeepMind を買収しました。 また、AI プロジェクトはその野心的な半分ではないかもしれませんが、クラウド サーバーのコストだけで 300,000 ドルを簡単に費やして、AI アプリを稼働させることができます。 ジェネレーティブ AI ソリューションなどの基盤モデルを使用するもう 1 つの理由は、R&D に多額の投資を行うことなく、さまざまなコンセプトのプロトタイプをすばやく作成してテストできることです。
- 基礎となる AI モデルを再利用して、さまざまなアプリケーションを作成できます。 その名前が示すように、AI 基盤モデルは、複数の AI アプリケーションの基礎として機能できます。 車の運転を考えてみてください。 運転免許証を取得すると、別の車を購入するたびに試験に合格する必要はありません。 同様に、少量のラベル付きデータを使用して、テキストを要約してドメイン固有のコンテンツを処理する汎用基盤モデルをトレーニングできます。 また、基礎モデルには「創発」機能も備わっています。つまり、モデルがトレーニングされると、対処すべきではない問題を解決する方法を学習したり、トレーニング データから予想外の洞察を収集したりする可能性があります。
- Foundation AI モデルは、企業の持続可能性の目標を達成するのに役立ちます。 1 つの大規模な機械学習モデルをトレーニングすると、その生涯にわたって 5 台の車を走らせた場合と同じ環境フットプリントが発生する可能性があります。 このような大量の二酸化炭素排出量は、企業の 66% がエネルギー使用の効率を高めている一方で、他の企業の 49% が新しい気候に優しいサービスや製品を開発しているという事実とは対照的です。 基盤となる AI モデルを使用すると、インテリジェントなアルゴリズムをより迅速にトレーニングし、コンピューティング リソースを賢く利用できます。特に、ハードウェアの並列処理を利用するこれらのモデルのアーキテクチャにより、複数のタスクを同時に実行できます。
「AI の未来」とみなされる基盤モデルは、AI を活用するための敷居を下げ、失敗した AI の概念実証サイクルを終わらせる可能性があります。これは、ビジネスが他のユース ケースや会社全体でモデルをスケーリングするのに役立つからです。
しかし、すべての機会には挑戦が伴います。
基礎モデルを使用する際の考慮事項
基盤 AI モデルの唯一の明らかな欠点は、一部の操作を説明するのが難しいことです。
大規模な基盤モデルは、非常に多くのトレーニング データを使用し、非常に多くの深いレイヤーを使用する可能性があるため、アルゴリズムがどのように結論に到達するかを判断するのが難しい場合があります。
財団モデルのブラックボックスの性質は、サイバー犯罪者にもバックドアを残します。 ハッカーはデータ ポイズニング攻撃を開始し、AI バイアスを導入して、AI の倫理的問題をさらに悪化させる可能性があります。
テクノロジー企業は、政府と力を合わせて公共 AI プロジェクトのインフラストラクチャを構築し、AI 基盤モデルの使用をめぐる論争を回避する必要があります。 AI ベンダーは、使用するデータセットとモデルのトレーニング方法も開示する必要があります。
スタンフォード大学の HAI の教員でコンピューター サイエンスの教授である Percy Liang 氏は、Venture Beat との最近のインタビューで次のように述べています。 したがって、この技術が倫理的および社会的に責任ある方法で開発および展開されるように、コミュニティとして今すぐ行動することが不可欠です。」
組織で基礎モデルの使用を開始するには何が必要ですか
過去 10 年間、企業による AI システムの実装を支援してきた Itrex チームは、AI の変化を目の当たりにしています。
単一のドメインで特定のタスクを実行するシステムは、より一般的に学習し、業界やユースケース全体で機能する広範な AI に取って代わられます。 ラベル付けされていない大規模なデータセットでトレーニングされ、さまざまなアプリケーション向けに微調整された Foundation モデルが、この変革を推進しています。
あなたの会社が競合他社を飛び越え、AI システムからより早く ROI を得る準備ができている場合は、基盤モデルを実装するための高レベルの戦略を次に示します。
- データを収集して前処理します。 最初のステップでは、基礎となる AI モデルにフィードするデータを収集して前処理します。 このデータの品質と多様性は、微調整されたモデルが正確で堅牢であることを保証するために重要です。
- 基礎モデルを選択してください。 多くの事前トレーニング済みの AI 基盤モデルが市場で入手できます。 一般的なソリューションには、BERT、GPT、ResNet などがあります。 解決したいタスクと所有しているデータの種類に基づいて、適切な基盤モデルを選択することが重要です。
- ビジネス目標に合わせてモデルを微調整します。 基盤モデルとデータの準備ができたら、モデルのパラメーターを特定のタスクに合わせて調整できます。 この目標を達成するための 1 つの方法は転移学習です。この方法では、基盤モデルの事前トレーニング済みの重みを開始点として使用し、トレーニング データに基づいてそれらを調整します。
- モデルを評価します。 微調整の後、モデルがうまく機能するかどうか、さらに調整が必要かどうかを判断することが重要です。 基盤モデルのパフォーマンスを評価するには、精度、精度、再現率、F1 スコアなどの標準的な指標を使用できます。
- AI ソリューションをデプロイします。 微調整されたモデルのパフォーマンスに満足したら、それを運用環境にデプロイできます。 AI モデルを展開するためのいくつかのオプションには、クラウドベースのプラットフォーム、オンプレミス サーバー、またはエッジ デバイスが含まれます。
AI 基盤モデルを実装するには、技術的な専門知識と、専用のハードウェアおよびソフトウェアへのアクセスが必要であることを覚えておくことが重要です。 したがって、専門の AI ベンダーと提携するか、AI 専門家のチームに相談して、プロセスが効果的に行われるようにすることが役立つ場合があります。
AI のニーズについてご相談ください。 貴社の AI 準備状況を評価し、データを監査してアルゴリズム分析用に準備し、人工知能を開始するための適切な基盤モデルを選択します!
この記事はもともと Itrex の Web サイトに掲載されたものです。