事實查核與人工智慧幻覺| 商業人工智慧#110

已發表: 2024-05-06

我們追蹤了人工智慧異常的根源，提供如何避免異常的實用技巧，並解釋了事實查核如何確保人工智慧結果的可靠性。 請繼續閱讀。

事實查核與人工智慧幻覺 - 目錄

什麼是人工智慧幻覺？
幻覺的例子
如何預防出現幻覺？
事實查核。如何驗證人工智慧的工作成果？
如何從人工智慧幻覺中受益？
事實查核與人工智慧幻覺 - 摘要

在人工智慧的世界中，虛構與現實之間的界線有時變得模糊。雖然創新的人工智慧系統幾乎在每個領域都在加速進步，但它們也面臨挑戰，例如幻覺——人工智慧產生不準確或虛假資訊的現象。為了充分利用這項技術的潛力，我們需要了解幻覺並對其進行事實查核。

什麼是人工智慧幻覺？

人工智慧幻覺是人工智慧模型產生的錯誤或誤導性結果。這種現像根源於機器學習的核心——演算法使用巨大的資料集或訓練資料來識別模式並根據觀察到的模式產生回應的過程。

即使是最先進的人工智慧模型也並非沒有錯誤。產生幻覺的原因之一是訓練資料的不完美。如果資料集不充分、不完整或有偏差，系統就會學習到不正確的相關性和模式，導致虛假內容的產生。

例如，想像一個主要針對白人照片進行訓練的臉部辨識人工智慧模型。在這種情況下，演算法可能無法正確識別其他種族的人，因為它在這方面沒有經過適當的「訓練」。

產生幻覺的另一個原因是過度擬合，當演算法過於適應訓練資料集時就會發生這種情況。結果，它失去了概括和正確識別新的、以前未知的模式的能力。這種模型在訓練資料上表現良好，但在真實的動態條件下卻失敗了。

最後，錯誤的假設或不充分的模型架構可能會導致幻覺。如果人工智慧設計者的解決方案是基於錯誤的前提或使用錯誤的演算法結構，系統將產生錯誤的內容，試圖將這些錯誤的假設與真實數據「匹配」。

資料來源：DALL·E 3，提示：Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

幻覺的例子

人工智慧幻覺的影響遠遠超出了理論領域。我們越來越多地遇到它們真實的、有時令人驚訝的表現。以下是這種現象的一些例子：

2023 年 5 月，一名律師使用 ChatGPT 準備了一場訴訟，其中包括虛構地引用法院判決和不存在的法律先例。這導致了嚴重的後果——律師被罰款，因為他聲稱他對 ChatGPT 產生虛假資訊的能力一無所知，
ChatGPT 碰巧會創建有關真實人物的虛假資訊。 2023 年 4 月，模特兒編造了一個關於法學教授涉嫌騷擾學生的故事。在另一起案件中，它錯誤地指控一名澳洲市長收受賄賂，而事實上，他是揭露此類行為的舉報人。

這些並不是孤立的案例——生成式人工智慧模型經常發明歷史“事實”，例如，提供穿越英吉利海峽的虛假記錄。更重要的是，他們每次都可以針對同一主題創建完全不同的假訊息。

然而，人工智慧的幻覺不僅僅是錯誤數據的問題。它們也可能採取奇怪、令人不安的形式，就像 Bing 的例子一樣，它宣稱它愛上了記者凱文·羅斯 (Kevin Roose)。這表明這些異常的影響可能不僅僅是簡單的事實錯誤。

最後，對人工智慧系統的特殊攻擊（稱為對抗性攻擊）可以故意誘發幻覺。例如，稍微改變貓的照片會使影像辨識系統將其解釋為…。 “酪梨。” 這種類型的操縱可能會在精確影像辨識至關重要的系統中產生嚴重後果，例如自動駕駛汽車。

如何預防出現幻覺？

儘管人工智慧幻覺帶來的挑戰規模很大，但仍有有效的方法來應對這種現象。關鍵是採用一種綜合方法，該方法結合了：

高品質的訓練數據，
相關提示，即AI的命令，
直接提供知識和例子供AI使用，
人類和人工智慧本身的持續監督以改善人工智慧系統。

提示

對抗幻覺的關鍵工具之一是結構合理的提示，或向人工智慧模型發出的命令和指令。通常，對提示格式進行微小的更改就足以大大提高所產生回應的準確性和可靠性。

Anthropic 的 Claude 2.1 就是一個很好的例子。雖然在沒有相關命令的情況下使用長上下文的準確性為 27%，但在提示中添加「這是上下文中最相關的句子：」這句話，將有效性提高到 98%。

這種變化迫使模型專注於文本中最相關的部分，而不是根據斷章取義的孤立句子產生回應。這凸顯了正確制定命令對於提高人工智慧系統準確性的重要性。

創建詳細、具體的提示，盡可能減少人工智慧的解釋空間，也有助於降低產生幻覺的風險，並使事實查核變得更加容易。提示越清晰具體，產生幻覺的幾率就越低。

例子

除了有效的提示之外，還有許多其他方法可以降低人工智慧幻覺的風險。以下是一些關鍵策略：

使用高品質、多樣化的訓練數據，可靠地代表現實世界和可能的場景。數據越豐富、越完整，AI產生假資訊的風險就越低，
使用資料範本作為人工智慧回應的指南－定義可接受的格式、範圍和輸出結構，從而提高生成內容的一致性和準確性，
將資料來源限制為來自受信任實體的可靠、經過驗證的資料。這消除了模型從不確定或錯誤來源「學習」資訊的風險。

基於分析人工智慧系統的實際性能和準確性，對人工智慧系統進行持續測試和完善，可以持續修正任何缺陷，並使模型能夠從錯誤中學習。

情境

正確定義人工智慧系統運作的環境對於防止幻覺也起著重要作用。應明確定義模型的使用目的以及模型的限制和責任。

這種方法可以為人工智慧設定一個清晰的運行框架，從而降低其「提出」不需要的資訊的風險。可以透過使用過濾工具並設定可接受結果的機率閾值來提供額外的保護措施。

應用這些措施有助於為人工智慧建立安全的路徑，提高其為特定任務和領域產生的內容的準確性和可靠性。

資料來源：表意文字，提示：Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

事實查核。如何驗證人工智慧的工作成果？

不幸的是，無論採取什麼預防措施，人工智慧系統產生一定程度的幻覺都是不可避免的。因此，保證所獲得結果可靠性的關鍵要素是事實查核——驗證人工智慧產生的事實和數據的過程。

審查人工智慧結果的準確性和與現實的一致性應被視為防止虛假資訊傳播的主要保障措施之一。人工驗證有助於識別和糾正演算法無法自行檢測到的任何幻覺和不準確之處。

在實踐中，事實檢查應該是一個循環過程，定期檢查人工智慧產生的內容是否有錯誤或有問題的陳述。一旦識別出這些問題，不僅需要修正AI生成的語句本身，還需要更新、補充或編輯AI模型的訓練數據，以防止將來再次出現類似問題。

重要的是，驗證過程不應僅限於簡單地拒絕或批准有問題的段落，而應積極讓在該領域擁有深入知識的人類專家參與。只有他們才能正確評估人工智慧產生的陳述的背景、相關性和準確性，並決定可能的更正。

因此，人工事實查核為人工智慧內容的可靠性提供了必要且難以高估的「保障」。在機器學習演算法達到完美之前，這個繁瑣但至關重要的過程必須仍然是任何產業人工智慧解決方案中不可或缺的一部分。

如何從人工智慧幻覺中受益？

雖然人工智慧幻覺通常是一種不受歡迎的現象，應該盡量減少，但它們可以在一些獨特的領域找到令人驚訝的有趣和有價值的應用。巧妙地利用幻覺的創造潛力提供了新的、通常完全意想不到的視角。

藝術和設計是人工智慧幻覺可以開啟全新創意方向的領域。透過利用模型產生超現實、抽象圖像的傾向，藝術家和設計師可以嘗試新的表達形式，模糊藝術與現實之間的界線。它們還可以創造獨特的、夢幻般的世界——以前人類無法感知的世界。

反過來，在資料視覺化和分析領域，幻覺現象提供了在複雜資訊集中發現替代觀點和意外關聯的機會。例如，人工智慧發現不可預測的相關性的能力可以幫助改善金融機構做出投資決策或管理風險的方式。

最後，電腦遊戲和虛擬娛樂世界也可以從人工智慧的創意畸變中受益。這些解決方案的創建者可以利用幻覺來產生全新的、迷人的虛擬世界。透過為它們注入驚喜和不可預測的元素，它們可以為玩家提供無與倫比的身臨其境的體驗。

當然，人工智慧幻覺這種「創造性」方面的任何使用都必須受到仔細控制並受到嚴格的人類監督。否則，創造虛構而不是事實的傾向可能會導致危險或社會不良的情況。因此，關鍵在於巧妙地權衡這種現象的好處和風險，並僅在安全、結構化的框架內負責任地使用它。

事實查核與人工智慧幻覺—總結

人工智慧系統中幻覺現象的出現是我們在該領域目睹的革命不可避免的副作用。人工智慧模型產生的扭曲和虛假資訊是其巨大創造力和吸收大量資料能力的另一面。

目前，驗證人工智慧生成內容有效性的唯一方法是透過人工驗證。雖然有多種減少幻覺的方法，從提示技術到真相森林等複雜方法，但它們都無法提供令人滿意的響應準確性，從而消除事實核查的需要。

如果您喜歡我們的內容，請在 Facebook、Twitter、LinkedIn、Instagram、YouTube、Pinterest、TikTok 上加入我們的忙碌蜜蜂社群。

作者：羅伯特‧惠特尼
JavaScript 專家和 IT 部門的講師。他的主要目標是透過教導其他人如何在編碼時有效合作來提高團隊生產力。
查看所有帖子

商業人工智慧：

人工智慧在商業中的威脅與機會（第 1 部分）
人工智慧在商業中的威脅與機會（第 2 部分）
人工智慧在商業中的應用 - 概述
人工智慧輔助文字聊天機器人
商業 NLP 的今天和明天
人工智慧在商業決策中的作用
安排社交媒體貼文。人工智慧有何幫助？
自動社交媒體貼文
利用人工智慧運作的新服務和產品
我的經營理念有哪些弱點？ ChatGPT 的腦力激盪會議
在商業中使用 ChatGPT
合成演員。排名前 3 的 AI 影片產生器
3 個有用的 AI 圖形設計工具。商業中的生成式人工智慧
今天你必須嘗試的 3 位出色的人工智慧作家
探索人工智慧在音樂創作中的力量
使用 ChatGPT-4 探索新的商機
經理的人工智慧工具
6 個很棒的 ChatGTP 插件，讓您的生活更輕鬆
3 繪圖人工智慧。商業情報總局
麥肯錫全球研究院認為人工智慧的未來是什麼？
商業人工智慧 - 簡介
什麼是 NLP，即商業中的自然語言處理
自動文件處理
谷歌翻譯 vs DeepL。機器翻譯的 5 個商業應用
語音機器人的營運與商業應用
虛擬助理技術，或者說如何與AI對話？
什麼是商業智慧？
人工智慧會取代商業分析師嗎？
人工智慧如何幫助 BPM？
人工智慧和社群媒體——它們對我們有何評價？
內容管理中的人工智慧
今天和明天的創意人工智慧
多模態人工智慧及其在商業上的應用
新的互動。人工智慧如何改變我們操作設備的方式？
數位公司中的 RPA 和 API
未來的就業市場和即將到來的職業
教育科技中的人工智慧。利用人工智慧潛力的 3 個公司範例
人工智慧與環境。 3 個人工智慧解決方案可協助您建立永續發展的業務
AI 內容偵測器。他們值得嗎？
ChatGPT vs Bard vs Bing。哪個人工智慧聊天機器人在這場競賽中處於領先地位？
聊天機器人人工智慧是谷歌搜尋的競爭對手嗎？
有效的 ChatGPT 人力資源和招募提示
及時工程。即時工程師做什麼的？
AI 模型產生器。四大工具
人工智慧還有什麼？ 2024 年商業頂級技術趨勢
人工智慧和商業道德。為什麼您應該投資道德解決方案
元人工智慧。關於 Facebook 和 Instagram 的人工智慧支援功能，您應該了解哪些？
人工智慧監管。身為企業家你需要了解什麼？
人工智慧在商業中的 5 個新用途
人工智慧產品和專案—它們與其他產品和專案有何不同？
人工智慧輔助流程自動化。從哪裡開始？
如何將人工智慧解決方案與業務問題相匹配？
人工智慧作為您團隊中的專家
AI團隊與角色分工
人工智慧職業領域如何選擇？
在產品開發過程中添加人工智慧總是值得的嗎？
人力資源中的人工智慧：招募自動化如何影響人力資源和團隊發展
2023 年 6 個最有趣的人工智慧工具
人工智慧造成的六大商業災難
公司的人工智慧成熟度分析是怎樣的？
用於 B2B 個性化的 AI
ChatGPT 用例。 2024 年如何利用 ChatGPT 改善業務的 18 個範例
微學習。獲得新技能的快速方法
2024 年公司中最有趣的人工智慧實施
人工智慧專家做什麼的？
AI專案帶來了哪些挑戰？
2024 年 8 款最適合商業的人工智慧工具
CRM 中的人工智慧。人工智慧為 CRM 工具帶來了哪些改變？
UE 人工智慧法案。歐洲如何監管人工智慧的使用
索拉。 OpenAI 的真實影片將如何改變業務？
七大人工智慧網站建置者
無程式碼工具和人工智慧創新
使用人工智慧可以在多大程度上提高您團隊的生產力？
如何使用ChatGTP進行市場研究？
如何擴大人工智慧行銷活動的影響範圍？
“我們都是開發者”。公民開發者如何幫助您的公司？
運輸和物流中的人工智慧
AI可以解決哪些業務痛點？
媒體中的人工智慧
銀行和金融領域的人工智慧。 Stripe、Monzo 和 Grab
人工智慧在旅遊業的應用
人工智慧如何促進新科技的誕生
社群媒體中的人工智慧革命
電子商務中的人工智慧。全球領導者概覽
四大人工智慧影像創作工具
用於數據分析的 5 大人工智慧工具
貴公司的人工智慧策略－如何建構？
最佳人工智慧課程 – 6 個精彩推薦
使用人工智慧工具優化社群媒體聆聽
物聯網+人工智慧，或如何降低公司的能源成本
物流中的人工智慧。 5 個最佳工具
GPT 商店 – 最有趣的商業 GPT 概述
LLM、GPT、RAG...AI 縮寫是什麼意思？
人工智慧機器人—商業的未來還是現在？
在公司實施人工智慧的成本是多少？
人工智慧如何幫助自由工作者的職業生涯？
自動化工作並提高生產力。自由工作者人工智慧指南
新創公司的人工智慧—最佳工具
用人工智慧建立網站
OpenAI、中途、人擇、擁抱臉。 AI世界裡誰是誰？
十一個實驗室還有什麼？最有前途的人工智慧新創公司
綜合數據及其對業務發展的重要性
頂級人工智慧搜尋引擎。去哪裡尋找人工智慧工具？
視訊人工智慧。最新的AI視訊產生器
面向管理者的人工智慧。人工智慧如何讓您的工作變得更輕鬆
Google Gemini 有什麼新功能？你需要知道的一切
波蘭的人工智慧。公司、會議和會議
人工智慧日曆。如何優化自己在公司的時間？
人工智慧和工作的未來。如何為您的企業做好變革準備？
商業人工智慧語音克隆。如何利用人工智慧創建個人化語音訊息？
事實查核與人工智慧幻覺