創建 AI 概念證明如何幫助您最大限度地降低 AI 開發和採用風險

已發表: 2023-01-19

我們的客戶只損失了他們專用於人工智能 (AI) 項目的預算的四分之一,因為他們選擇從概念驗證 (PoC) 開始。 PoC 允許他們測試他們的想法並以有限的支出快速失敗。 為避免浪費時間和精力,請始終向您的 AI 解決方案顧問諮詢概念證明——尤其是當您的公司只是在測試 AI 領域時。

本文解釋了 AI PoC 是什麼,並詳細闡述了將指導您完成第一個 PoC 的五個步驟,以及您在此過程中可能遇到的挑戰。 它還展示了我們產品組合中的 AI PoC 示例。 您會發現開頭段落中描述的示例的圓滿結局。

什麼是 AI PoC,它何時對您的項目成功至關重要?

AI PoC 是擬議的 AI 解決方案的原型或演示,旨在測試該解決方案是否可行並可能成功。 創建 AI PoC 的目的是驗證概念、評估提議的解決方案的潛在優勢,並確定任何潛在的挑戰或限制。

AI PoC 通常涉及構建擬議 AI 解決方案的小規模版本,並在受控環境中對其進行測試,以查看其性能如何以及是否滿足預期目標。 然後可以使用 AI PoC 的結果進一步為解決方案的開發和實施提供信息。

與普通軟件 PoC 相比,AI PoC 可能涉及更複雜的考慮因素,例如 AI 解決方案隨時間學習和適應的能力,以及解決方案的潛在倫理影響,例如 AI 偏見。 AI PoC 項目的技術棧也不同。

機器學習算法

這些算法允許 AI 系統從結構化數據中學習,並根據這種學習做出預測或決策。 有許多不同類型的機器學習算法,包括監督學習算法、非監督學習算法和強化學習算法。

神經網絡

這些計算模型的靈感來自於人腦的結構和功能。 神經網絡可以處理和分析大量非結構化數據。 他們可以被訓練來執行各種任務,例如圖像識別、自然語言處理、場景建模和預測。

機器人學

該技術可用於構建能夠自主操作和決策的物理系統。 機器人解決方案包含傳感器、執行器和其他硬件組件,使工程師能夠構建可以與其環境交互並執行任務的機器人。

雲計算

Microsoft Azure、Google Cloud 和 AWS 等雲計算平台提供支持 AI PoC 開發和測試所需的計算能力、存儲資源和預配置服務。 這些平台還可以在開發和測試後託管和部署人工智能解決方案。

創建 AI PoC 涉及收集和準備數據、構建和訓練機器學習模型,以及測試和評估 AI 系統的性能。 創建 AI PoC 所需的時間可能因多種因素而有很大差異,包括擬議的 AI 解決方案的複雜性、PoC 可用的資源和專業知識以及 PoC 的具體目標。 一些 AI PoC 可以在短短幾天或幾週內開發完成,而另一些則可能需要幾個月甚至更長時間才能完成。

什麼時候絕對沒有辦法繞過 AI PoC?

在以下情況下,必須使用 AI PoC 啟動您的項目。

  • 您的項目依賴於一個尚未經過測試的創新想法——已經在業務層面研究過的東西,但還沒有在技術上進行過嘗試。 您和您的技術供應商都不確定它是否可以實施。
  • 如果您需要在有限的時間內向利益相關者、投資者和其他人證明您的想法的可行性。 AI PoC 將比交互式原型或類似的東西做得更好。

是否存在 AI PoC 是浪費時間的情況?

儘管 AI PoC 在大多數情況下都是有益的,但也有一些例外。 如果您的項目屬於以下類別之一,則 AI PoC 可能有點矯枉過正。

  • 如果您的想法和方法從功能和技術角度得到了很好的記錄。 這是罕見的。
  • 如果您要開發的解決方案是標準的並且類似於該領域的常見做法。 我們已經知道,從技術角度來說,這是可行和可能的。
  • 如果您想構建您的前端和後端開發人員理解的軟件,通常是因為他們已經從事過相同的工作。

您可以從 AI PoC 中獲得什麼好處?

使用 AI PoC 帶來以下好處。

  • 在投入更多資源之前確定潛在的挑戰。 AI PoC 允許您“快速失敗,更好地失敗”。 如果團隊遇到無法克服的挑戰,所有利益相關者都有時間重新組合或可能改變假設以通過其他方法達到相同的目標。
  • 最大限度地降低業務風險,因為您以小步驟而不是投入長期項目來測試創新想法。
  • 改進數據收集實踐。
  • 讓投資者和其他利益相關者參與進來。
  • 節省時間和資源。 AI PoC 可能會發現與業務或流程相關的問題,並讓您有時間在開始全面項目之前解決所有問題。
  • 積累專業知識並培養知識所有者,他們將在未來指導另一名團隊成員從事類似項目。
  • 在較小規模上測試技術堆棧,以了解其對所選業務案例的適用性。

我們的產品組合中 AI PoC 挽救了局面的示例

以下是 ITRex 產品組合中的一些 AI PoC 示例,它們將幫助您更加了解 PoC 方法。

意識到單靠 ML 並不是解決問題的方法

一家大型貨運物流公司每天處理 10,000-15,000 件貨物,每件貨物都附有提單和發票以涵蓋運營。 員工因手動處理所有文檔而筋疲力盡。 該公司希望構建一個基於 ML 的解決方案,該解決方案將使用光學字符識別 (OCR) 來處理掃描的文檔並識別不同的字段。

客戶認為機器學習是最佳解決方案,因此我們著手進行 AI PoC 來測試這一假設。 很快我們意識到文檔的格式不同,用於字段的標籤也有很大差異——例如,僅加載 ID 字段就有 8 個別名。 因此,ML 模型不斷增長。 它變得緩慢而低效。 我們的團隊決定為這個模型配備一個動態算法(例如,不同字段標籤被硬編碼的字典)。 這一修改顯著提高了解決方案的性能,並為客戶節省了時間和金錢。

如果客戶決定跳過 AI PoC,他們可能會浪費七個月的時間才意識到他們最初關於純基於 ML 的模型的想法並不是最佳解決方案。 通過 AI PoC,他們僅用了兩個月就得出了這個結論。 在這個 AI PoC 成功完成後,我們構建了一個可以處理四種類型文檔的 MVP,承擔了大約 25% 的手動處理負載。

對 Meta 的數據使用限制感到吃驚

娛樂行業的一位客戶希望為獨立音樂表演者構建一個人工智能驅動的分析平台。 該解決方案應該抓取包括 Facebook 和 Instagram 在內的社交媒體來收集數據。 它將處理所有這些信息以衡量人們對藝術家的看法。 音樂家可以在該平台上註冊,並收到關於哪些社交媒體行為對他們的成功最有利的反饋。

我們著手進行 AI PoC 來測試這個想法。 僅僅兩週後,我們就意識到,根本不可能從 Facebook 和 Instagram 收集數據並將其用於上述目的。 通常,一些數據可以通過 Graph API 檢索。 因此,以及 Meta 中經過驗證的企業帳戶,我們假設我們可以訪問所需的信息。 但是,客戶無法向我們提供經過驗證的企業帳戶,而且僅來自 Graph API 的數據不足以讓該解決方案發揮作用。

如果客戶決定跳過 PoC,他們將在發現項目上浪費大約 20,000 美元。 這將包括解決方案的詳細描述和開發成本的估算。 但由於他們選擇從 AI PoC 開始,他們只花了大約 5,000 美元就發現由於 Meta 強制執行的數據訪問限制,所提議的解決方案無法執行。

首個 AI PoC 的五步指南

您可以按照以下五個步驟成功通過 AI PoC。 我們還列出了與每個步驟相關的挑戰。

第 1 步:確定您想用 AI 解決哪些問題

必須明確說明您希望通過實施 AI PoC 來完成什麼。 所選用例需要具有高價值並代表您可以使用該技術最好地解決的問題。 如果您有疑問,一個好的起點是研究您所在領域的其他人使用 AI 解決方案的目的。 另一種方法是調查您的企業面臨的問題,並將其與人工智能的潛力進行比較。

在您積累了一系列機會之後,您可以提出以下問題來確定哪些機會最適合您的項目。

  • 您打算解決的問題是否足夠具體? 你能評估結果以確定成功嗎?
  • 您是否已嘗試使用其他技術解決此問題?
  • 您是否有人才和資金來支持這個項目直到結束? 如果沒有合適的內部人才,是否可以聘請外部專門團隊?
  • 該問題將如何影響您的業務? 這種影響是否足以保證您的努力?
  • 你能把這個項目賣給你的高管嗎? 您的組織準備好承擔這樣的項目了嗎?
  • 您的公司是否已經制定了數據戰略? 如果是這樣,它將如何與該項目保持一致?
  • 使用 AI 解決這個問題的潛在風險和局限性是什麼?

相關挑戰

  • 選擇一個不會增加太多價值或沒有充分發揮 AI 潛力的用例。 人工智能是一項昂貴的技術,選擇一個無關緊要的案例將意味著你得不償失。 查看我們關於實施 AI 的成本的文章,以便更好地了解費用。

第 2 步:準備數據

現在您已經清楚地定義了您的問題,是時候為 AI 算法聚合和準備訓練數據了。 您可以通過以下方式做到這一點:

  • 檢查哪些數據可在貴公司內部使用
  • 使用特定的現成應用程序或您自己的解決方案生成半合成數據
  • 從可靠的供應商處購買數據集
  • 使用開源數據
  • 僱用人員來抓取適合您目的的數據。

您不必將自己局限於一種來源。 您可以組合使用上面列出的幾個選項。

求助於數據科學家進行初步數據篩選。 他們將執行以下任務。

  • 構建數據
  • 通過消除噪音來清潔它
  • 如果是表格數據,請添加任何缺失的數據點
  • 進行特徵工程(即增刪數據字段)
  • 應用操作,例如組合或過濾數據

數據科學家可以就如何收集額外數據或如何縮小 AI PoC 的範圍向您提供建議,以便您可以使用現有數據集獲得預期的結果。

當數據可供使用時,將其分成三組:

  • 模型將用於學習的訓練集。
  • 用於驗證模型和迭代訓練的驗證集。
  • 將評估算法性能的測試集。

相關挑戰

  • 訓練數據不能代表整個人群。 在這種情況下,算法可能在常見情況下表​​現良好,但在極少數情況下會產生糟糕的結果。 例如,分析 X 射線的醫療保健 ML 模型可能擅長檢測常見疾病,例如積液,但很難發現罕見疾病,例如疝氣。
  • 類別不平衡,當代表一個類別的案例數量明顯大於另一個類別時,比例為 99.9% 比 0.1%。
  • 標籤不正確,例如混合類別(例如將自行車標記為汽車)。
  • 訓練數據集中的高噪聲。
  • 難以實現純類可分離性。 當訓練集中的某些數據無法正確分類到特定類別下時,就會發生這種情況。

第 3 步:設計並構建或購買解決方案

您可能想知道是應該自己構建模型還是可以採購現有解決方案。 這就是從頭開始創建 AI 模型的意義所在。

  • 您的解決方案是創新的,不符合現有標準。
  • 現成的解決方案定製成本很高。
  • 最接近的現成模型有點矯枉過正,它做的比你實際需要的要多得多。

如果購買和定制模型的成本低於從頭開始構建的成本,請考慮購買現成的模型。

如果您決定從頭開始構建 AI 算法,您將可以更好地控制其準確性。 完成任務需要更長的時間,但它會根據您的業務問題和內部流程量身定制。 您無需更改系統即可適應外部軟件。

關於算法訓練和實現的基礎設施,可以依賴雲端,而不是使用本地資源。 在決定什麼最適合您時,您可以考慮四個參數。

  1. 安全。 如果您的數據在安全方面非常敏感,那麼您最好將所有內容都保留在本地。
  2. 工作量。 如果處理負載比較重,選擇雲。
  3. 費用。 評估什麼會讓您花費更多:在本地獲取資源或隨著時間的推移為雲使用付費。
  4. 輔助功能。 如果您只在本地使用該解決方案,則可以依賴您的內部服務器。 如果需要從不同的地理位置訪問它,那麼值得考慮雲。

每種方法都有其優點和缺點。 如果您在醫療保健行業開展業務,我們在博客上的醫療保健雲計算帖子中對這些內容進行了清楚的解釋。 否則,請隨時聯繫我們的 AI 專家,為算法訓練選擇最佳技術堆棧。

相關挑戰

  • 缺乏適當的培訓。 這會導致一些問題,例如模型泛化能力差,這意味著模型不會對它在訓練中沒有看到的數據做出準確的預測。 回到醫療領域的 X 射線圖像分析,一種算法可能會成功地分析由最先進的掃描捕獲的高質量圖像,但在應用於由舊機器生成的掃描時仍然表現不佳。
  • 與現有系統集成,其中一些系統可能已經過時或由專有技術提供支持。
  • 未能提出合適的模型架構(例如,無法為手頭的問題選擇正確的 ML 模型)。
  • 所選體系結構的功能無法滿足模型的要求。
  • 輸入數據是易變的,這意味著模型必須經常重新訓練。
  • 使用比您的模型執行其任務所需的資源更多的資源。 無需投資強大的服務器來運行簡單的模型。

第 4 步:評估 AI PoC 產生價值的潛力

這一步是評估AI PoC是否達標。 有幾種方法可以執行評估。

  • 回到您的關鍵績效指標 (KPI) 並針對它們測試解決方案。 這些因素可能包括準確性、客戶滿意度、速度、靈活性、公平性和安全性。
  • 收集有關您的系統在 AI PoC 部署之前如何運行的數據。 這可以包括在特定手動任務上花費的時間和錯誤數量。 接下來,您應該使用這些信息來評估 PoC 的影響。
  • 將解決方案的性能與被視為此類問題或更廣泛行業基準的其他產品進行比較。 例如,圖像分類相關問題的基準是在流行的數據集(如 ImageNet)上提供準確結果的模型。
  • 通過焦點小組或在線調查收集用戶反饋,以衡量滿意度並確定缺失的內容。
  • 進行成本效益分析以了解此解決方案對組織的財務影響。

相關挑戰

  • 在你的評估中犯了一個錯誤。 這可能是計算過程中的簡單數學錯誤,也可能是與估算業務潛力相關的錯誤。

第 5 步:迭代 AI PoC 以獲得更好的結果,或擴大規模

如果您在上一步中收到的結果不符合標準,您可以考慮修改解決方案並迭代整個過程。 您可以更改 ML 算法並測量每次調整的性能。 您還可以嘗試不同的硬件組件或替代的雲服務模型。

如果您對 AI PoC 的性能感到滿意,您可以在不同的方向上對其進行擴展。 這裡有一些例子。

  • 將 PoC 應用於其他業務案例。 在您的企業中尋找這種新解決方案的其他應用。 例如,如果您將 AI 作為預測性維護的一種應用進行測試,則可以嘗試將其應用於其他相關場景。
  • 擴展基礎設施。 查看用於運行此軟件的技術。 您能否投入更多的處理能力或更多的數據存儲容量? 此類修改將使您能夠使用更多數據、減少延遲,並可能實時交付結果。 它還可以最大程度地減少將來出現瓶頸的可能性。
  • 優化PoC方案。 即使您可能在上一步中獲得了合理的結果,也可能值得尋找提高準確性的方法。 您可以使用新數據或更準確標記的數據繼續訓練您的算法。 或者您甚至可以嘗試實施調整和更改以獲得更好的結果。

如果您決定在 PoC 階段後在全公司範圍內採用 AI,您可以在我們的指南中找到有關如何在您的組織中實施 AI 的有用提示。

相關挑戰

  • 沒有仔細考慮架構。 該解決方案可能適用於 10,000 名用戶,但當受眾達到 100,000 時就會崩潰。
  • 該模型包含會在您嘗試擴展 AI 解決方案時自行顯現的錯誤
  • 將該模型應用於其他業務案例,而不是它原本打算用於的業務案例。 例如,用於組裝花園獨輪手推車的解決方案不能應用於組裝卡車,因為它可能會構建帶有馬達的大型花園獨輪手推車。

總結

在實施 AI 時,從小處著手並保持可管理性。 確保您有明確的業務案例,其中包含明確的目標和衡量成功的指標。 並且始終考慮創建 AI PoC,本文開頭介紹的案例除外。 這將幫助您在全面投入之前識別任何潛在障礙,並對可能達不到預期的解決方案進行大量財務投資。

您是否想在您的組織中實施 AI,但不確定您的經營理念是否可行? 保持聯繫! 我們的團隊將幫助您進行 PoC,以在實踐中檢驗您的想法。


最初於 2023 年 1 月 9 日發佈在 https://itrexgroup.com。