自然語言生成景觀
已發表: 2022-05-03自然語言生成(NLG)的商業應用仍處於起步階段。 與擁有超過 7,000 名參與者的擁擠的 martech 環境不同,NLG 環境非常稀少。 在這篇文章中,我們研究了使用 NLG 來製作長篇和短篇內容、從結構化數據創建敘述以及將文本轉換為語音的組織。
長篇內容生成(750+ 字)
MarketMuseNLG Technology 是第一個也是唯一一個提供使用自然語言生成創建的長格式內容的平台。 我們在深度學習神經網絡和 MarketMuse 內容簡介的幫助下生成長文本。
這些 MarketMuse 內容簡介與提供給人類作家的內容完全相同,以幫助他們製作更好的內容。 簡報提供了一個詳細的框架來創建內容。 MarketMuse 內容簡介憑藉其主題、問題和字幕,為 NLG 引擎生成相關文本提供了上下文。
結果是內容的初稿達到了所有基本 KPI,同時需要最少的編輯。
文本生成(少於 750 字)
出於我們的目的,我們將任何少於 750 個單詞的內容定義為簡單的文本生成。 在某些情況下,更短的敘述形式更合適——例如電子郵件和網絡文案。
有兩種產品屬於這一類,儘管它們的目的完全不同。
Articoolo 面向需要不超過 500 字的網站文章的出版商。 所需要的只是一個兩到五個字的主題和所需的字數。 雖然令人鼓舞,但這些簡短而膚淺的文章的價值是有限的。
Phrasee 在為需要短文本的特定用例定制產品方面做得非常出色。 這些是高價值的情況,可以從高影響力和簡潔的副本中受益。
Phrasee 電子郵件用於電子郵件主題行、前標題、標題、副標題副本和號召性用語。 Phrasee Push 用於移動應用推送消息。 Phrasee Social 用於製作 Facebook 和 Instagram 消息,而 Phrasee Everywhere 則幫助處理 AdWord、登陸頁面和展示廣告文案。
文章重寫器和混合器
計算機輔助文章生成的最原始形式是文章重寫,也稱為文章旋轉。 十多年來,SEO 使用文章微調器快速生成大量低質量內容以用於鏈接網絡。
這不是自然語言生成。
人類很少訪問這些網站或閱讀這些頁面。 這些是旨在利用 Google PageRank 的博客網絡,因此某些頁面可以在搜索中排名很好。
文章紡紗的前提很簡單。 取一段原始文本並替換不同的單詞以創建一個新版本。 早期的嘗試在選擇替換時遇到了糟糕的單詞選擇。
這是上面的段落,通過文章微調器運行。
“文本重寫的原因很簡單。 獲取獨特的內容並替換各種單詞以製作新的獨特內容。 早期的嘗試在選擇替換時遇到了糟糕的單詞決定。”
雖然語法正確,但很尷尬。 到目前為止,使用這種方法的改進很少。 有些確實使用 Google 的自然語言處理 API 來進行語法分析、識別詞性 (PoS) 並提取標記和句子。 然而,產品質量仍然疲軟,這些產品的目標市場保持不變。
在這個領域工作的一些公司包括 WordAi、SEO 文章生成器、AI Spinner 和 Chimp Rewriter。 毫無疑問,還有更多,但沒有一個是好的。 儘管他們可能會嘗試將自己定位為這樣,但這些產品與人工智能或自然語言處理幾乎沒有關係。
文章混合器是另一類與自然語言生成幾乎沒有關係的內容生成器,儘管它們的營銷方式如何。 顧名思義,文章混合包括混合來自主題相關頁面的句子,將它們編織成敘述,並使用同義詞替換特定的短語。
這裡有宏觀和微觀層面的問題。 這些作品沒有真正的整體結構。 即使在句子層面,做出的選擇似乎也有些武斷。
Article Forge 和 AI Writer 這兩家公司的產品屬於文章混合類別。
結構化數據敘述
此類別中的應用程序採用高度結構化的數據集並將其轉化為敘述。 美聯社在人工智能的幫助下每季度發布近 4,000 篇公司收益文章。 電子商務網站還可以使用這種方法創建產品描述、類別故事和時事通訊。
這種方法有很多用例,只要您有結構化數據來支持它。 這是大規模開展這項工作的關鍵因素。 在收益報告的例子中,整個故事非常簡單,永遠不會改變。 每個故事的不同之處在於變量。 這是美聯社的蘋果收益報告示例。
以下是一些在這個領域工作的品牌:
- 文字匠
- 鵝毛筆
- AX 語義
- 阿里亞
- 優賽普
- 文本引擎.io
- 短語
- 具體
- 金妮
- 船員機
這些平台使用基於模板的方法或動態創建文檔。 最簡單的是間隙填充方法,其中數據填充在模板內的間隙中。
Web 模板語言、腳本或生成規則的文本,是從簡單的填補空白的一個步驟。 但如果沒有復雜的語言能力,它很難生成高質量的文本。
單詞級語法功能使編寫複雜模板變得相對容易,因為它們可以處理正字法、詞法、詞素學及其例外情況。 但請不要誤會,以這種方式產生高質量的輸出仍然是一項重大挑戰。
文字轉語音
文本到語音將書面文本轉換為各種語言的自然聲音。 它們可用於聊天機器人和語音助手交互,將數字電子書變成有聲讀物,並與車載導航系統交互。
最近,公司一直在使用深度神經網絡來合成與人類錄音幾乎相同的語音。 與 AI 系統交互時,類人的語音模式、語調和發音可顯著減少聽力疲勞。
少數知名組織在這一領域佔據主導地位:
- IBM 沃森
- 微軟
- 亞馬遜波利
- 谷歌
概括
在過去的幾年裡,自然語言生成主要集中在文本到語音和從高度結構化的數據中生成敘述。 借助 MarketMuse NLG 技術,營銷人員現在可以利用 NLG 製作長篇內容。
你現在應該做什麼
當您準備就緒時……我們可以通過以下 3 種方式幫助您更快地發布更好的內容:
- 與 MarketMuse 預約時間 與我們的一位策略師安排現場演示,了解 MarketMuse 如何幫助您的團隊實現其內容目標。
- 如果您想了解如何更快地創建更好的內容,請訪問我們的博客。 它充滿了幫助擴展內容的資源。
- 如果您認識其他喜歡閱讀此頁面的營銷人員,請通過電子郵件、LinkedIn、Twitter 或 Facebook 與他們分享。