MarketMuse NLG 技術與 GPT-3

已發表: 2022-05-03

由於最近對 GPT-3 很感興趣,我們決定看看它與 MarketMuse NLG 技術的比較,類似於評估 GPT-2 時採用的過程。

在深入研究示例之前,這裡先簡要概述一下 MarketMuse NLG 技術的差異化因素。

  • 與 GPT-3 不同,給定一個主題,我們使用內容簡介作為“主幹”,逐段構建文章。
  • 給定一個主題,我們生成一個內容簡介,結構為子標題和相關主題,我們將其用作指南。
  • 對於每個簡短的部分,我們使用相關主題和副標題作為提示,並且我們不斷生成,直到我們產生通過我們的質量過濾器的輸出。
  • 我們的過濾器當然包括我們期望在輸出中看到的相關主題的內容分數和存在,但我們還檢查語法錯誤、詞彙多樣性、抄襲和其他可讀性措施。

三個內容示例

GPT-3 比它的前身更大,據說更好,但它不太可能接管互聯網。 OpenAI 發表了一篇關於他們的語言模型的詳細論文 (PDF)。 出於我們的目的,我們對研究自然語言生成背後的科學不感興趣。 相反,我們採用的是經驗方法。

下面,您將找到關於在 Twitter 上的重要性的三個摘錄,由 MarketMuse NLG 技術、GPT-3 和在 MarketMuse NLG 技術幫助下的人類編寫。 你能分辨出哪個是哪個嗎?

版本 1

在此處閱讀整篇文章。

版本 2

在此處閱讀整篇文章。

版本 3

在此處閱讀整篇文章。

哪些內容是由人類創建的?

首先,讓我們看看它是否通過了“嗅探”測試。 這些文章看起來好像是人寫的嗎?

只有一個是。 你能猜到是哪個嗎?

第一個由 GPT-3 編寫,第二個由人類編寫,第三個由 MarketMuse NLG Technology 編寫。

他們在傳達信息方面有多好

讓我們根據內容分數、作家分數和年級水平來檢查所有三種方法的輸出。

MarketMuse 內容評分評​​估與主題模型相比,該作品涵蓋該主題的程度。 越高越好,本文的建議內容分數為 42,儘管沒有什麼是完美的分數。

作家分數是由 Writer.com 分配的分數,基於拼寫和語法、術語、風格、清晰度、包容性和交付——越高越好。 年級表示理解內容所需的預期教育水平。 你寫作的年級水平通常應該與你的聽眾的水平相匹配。

MarketMuse NLG 技術

不出所料,MarketMuse NLG Technology 在解決模型中的主題方面做得最好。 它旨在確保它滿足兩個重要的 KPI,字數和內容分數。


學到更多

什麼是內容分數?
內容得分和字數:更好的內容營銷 KPI
內容質量:MarketMuse 指南


MarketMuse NLG Technology 在 Writer Score 方面表現出色。 在拼寫和語法、術語使用、風格和清晰度方面存在一些問題。 年級水平在本文的目標讀者範圍內。

GPT-3

GPT-3就像一個話很多但話很少的人。

它的內容得分為 4 有一個非常簡單的解釋。這篇文章未能解決專家在討論在 Twitter 上的重要性時所做的重要問題。 誠然,這篇文章可能很可愛和有趣,但它沒有任何實質內容。

這篇文章在關於 Twitter 的近 2,400 字中沒有一次談到或解釋與以下內容有關的任何事情:

  • 社交媒體
  • 推文
  • 推特追隨者
  • 推特營銷
  • 熱門話題標籤

更不用說您會在 MarketMuse 主題模型中找到的 45 個其他主題。 問題是文章缺乏結構和任何內在意義。

如果有人提交了那篇文章,你會怎麼做?

這篇文章沒有說明在 Twitter 上的重要性。 因此,將草稿編輯和潤色成有價值的可發佈內容變得更加困難。 這與我們在評估 GPT-2 時發現的問題相同。

這種類型的文章有一個詞。 它被稱為“絨毛”。

它也遭受了最低的作家分數。 這是大量拼寫和語法問題以及其他涉及清晰度、包容性和風格的問題的結果。

四年級的寫作在這裡是一個問題。 最好在你的聽眾的水平上寫作。 如果你的寫作太複雜或太簡單,你就有可能失去它們。 在這種情況下,GPT-3 的寫作水平對於商業讀者來說太基礎了。

人類

如果我自己可以這麼說的話,你的人類確實做得相當不錯。 這篇文章舒適地位於目標之上,內容得分為 45。作家得分為 99,幾乎是完美的,它應該是。 我使用 Writer for Chrome 插件,所以我可以提前發現任何錯誤。 8 級仍然在商業受眾的範圍內。

MarketMuse NLG 技術優勢

GPT-3 是一種尋找應用程序的解決方案。 訪問 API 的唯一方法是加入一個候補名單,在其中描述您的用例繆斯。 即使有訪問權限,您在使用通過應用程序編程接口提供的內容時仍然會受到限制。

MarketMuse NLG Technology 旨在解決特定用例,特別是為內容營銷人員生成長篇 SEO 質量文章。 這是必須提供的優勢。

  1. 連貫性和結構——MarketMuse NL 技術輸出由 MarketMuse 內容簡介決定,因此草稿是連貫的和開箱即用的結構。 GPT-3 以提示文本開頭,但缺乏護欄,導致非結構化輸出不適合 SEO 質量的內容。
  2. 控制– 用戶可以在訂購草稿之前構建自己的 MarketMuse 內容簡介。 指定文章應提及的主題、應回答的問題以及文章的各個部分。 GPT-3 幾乎無法控制世代提及的主題以及內容回答的問題。
  3. 出版就緒– MarketMuse NLG 技術輸出可在 1-2 小時內編輯成出版就緒內容。 GPT-3 輸出需要幾個小時才能編輯成可供發布的內容。
  4. 降級、抄襲、重複——MarketMuse NLG 技術生成的文本不會出現長度降級、抄襲和重複。 GPT-3 輸出不檢查降級、抄襲或重複。
  5. 培訓——MarketMuse NLG 技術接受了來自精選數據集(不包括性別歧視、種族主義和成人內容)的文章的培訓,以改善幾代人的成果。 GPT-3 在整個網絡上訓練,包括低質量、露骨和仇恨的內容,導致低質量的生成。
  6. 配置– MarketMuse NLG 技術可以配置為以您的風格或您希望模仿的風格寫作,以及隨著時間的推移學習新詞彙。 GPT-3 只能根據模型的參數生成文本,幾乎沒有可配置性。
  7. 文章長度– MarketMuse NLG 技術可以根據 MarketMuse 內容簡介的長度生成最多 5,000 字的文章。 GPT-3 最多只能生成約 1,200 個單詞。

外賣

擴展您的內容創建,而無需擴展您的成本和令人頭疼的問題。 MarketMuse NLG 技術通過使用 AI 根據 MarketMuse Content Briefs 創建完整的文章草稿來加速內容創建。 讓 AI 為您提供強大的初稿,讓您的內容成本可預測且質量始終如一。

你現在應該做什麼

當您準備就緒時……我們可以通過以下 3 種方式幫助您更快地發布更好的內容:

  1. 與 MarketMuse 預約時間 與我們的一位策略師安排現場演示,了解 MarketMuse 如何幫助您的團隊實現其內容目標。
  2. 如果您想了解如何更快地創建更好的內容,請訪問我們的博客。 它充滿了幫助擴展內容的資源。
  3. 如果您認識其他喜歡閱讀此頁面的營銷人員,請通過電子郵件、LinkedIn、Twitter 或 Facebook 與他們分享。