MarketMuse NLG 技术与 GPT-3

已发表: 2022-05-03

由于最近对 GPT-3 很感兴趣,我们决定看看它与 MarketMuse NLG 技术的比较,类似于评估 GPT-2 时采用的过程。

在深入研究示例之前,这里先简要概述一下 MarketMuse NLG 技术的差异化因素。

  • 与 GPT-3 不同,给定一个主题,我们使用内容简介作为“主干”,逐段构建文章。
  • 给定一个主题,我们生成一个内容简介,结构为子标题和相关主题,我们将其用作指南。
  • 对于每个简短的部分,我们使用相关主题和副标题作为提示,并且我们不断生成,直到我们产生通过我们的质量过滤器的输出。
  • 我们的过滤器当然包括我们期望在输出中看到的相关主题的内容分数和存在,但我们还检查语法错误、词汇多样性、抄袭和其他可读性措施。

三个内容示例

GPT-3 比它的前身更大,据说更好,但它不太可能接管互联网。 OpenAI 发表了一篇关于他们的语言模型的详细论文 (PDF)。 出于我们的目的,我们对研究自然语言生成背后的科学不感兴趣。 相反,我们采用的是经验方法。

下面,您将找到关于在 Twitter 上的重要性的三个摘录,由 MarketMuse NLG 技术、GPT-3 和在 MarketMuse NLG 技术帮助下的人类编写。 你能分辨出哪个是哪个吗?

版本 1

在此处阅读整篇文章。

版本 2

在此处阅读整篇文章。

版本 3

在此处阅读整篇文章。

哪些内容是由人类创建的?

首先,让我们看看它是否通过了“嗅探”测试。 这些文章看起来好像是人写的吗?

只有一个是。 你能猜到是哪个吗?

第一个由 GPT-3 编写,第二个由人类编写,第三个由 MarketMuse NLG Technology 编写。

他们在传达信息方面有多好

让我们根据内容分数、作家分数和年级水平来检查所有三种方法的输出。

MarketMuse 内容评分评估与主题模型相比,该作品涵盖该主题的程度。 越高越好,本文的建议内容分数为 42,尽管没有什么是完美的分数。

作家分数是由 Writer.com 分配的分数,基于拼写和语法、术语、风格、清晰度、包容性和交付——越高越好。 年级表示理解内容所需的预期教育水平。 你写作的年级水平通常应该与你的听众的水平相匹配。

MarketMuse NLG 技术

不出所料,MarketMuse NLG Technology 在解决模型中的主题方面做得最好。 它旨在确保它满足两个重要的 KPI,字数和内容分数。


学到更多

什么是内容分数?
内容得分和字数:更好的内容营销 KPI
内容质量:MarketMuse 指南


MarketMuse NLG Technology 在 Writer Score 方面表现出色。 在拼写和语法、术语使用、风格和清晰度方面存在一些问题。 年级水平在本文的目标读者范围内。

GPT-3

GPT-3就像一个话很多但话很少的人。

它的内容得分为 4 有一个非常简单的解释。这篇文章未能解决专家在讨论在 Twitter 上的重要性时所做的重要问题。 诚然,这篇文章可能很可爱和有趣,但它没有任何实质内容。

这篇文章在关于 Twitter 的近 2,400 字中没有一次谈到或解释与以下内容有关的任何事情:

  • 社交媒体
  • 推文
  • 推特追随者
  • 推特营销
  • 热门话题标签

更不用说您会在 MarketMuse 主题模型中找到的 45 个其他主题。 问题是文章缺乏结构和任何内在意义。

如果有人提交了那篇文章,你会怎么做?

这篇文章没有说明在 Twitter 上的重要性。 因此,将草稿编辑和润色成有价值的可发布内容变得更加困难。 这与我们在评估 GPT-2 时发现的问题相同。

这种类型的文章有一个词。 它被称为“绒毛”。

它也遭受了最低的作家分数。 这是大量拼写和语法问题以及其他涉及清晰度、包容性和风格的问题的结果。

四年级的写作在这里是一个问题。 最好在你的听众的水平上写作。 如果你的写作太复杂或太简单,你就有可能失去它们。 在这种情况下,GPT-3 的写作水平对于商业读者来说太基础了。

人类

如果我自己可以这么说的话,你的人类确实做得相当不错。 这篇文章舒适地位于目标之上,内容得分为 45。作家得分为 99,几乎是完美的,它应该是。 我使用 Writer for Chrome 插件,所以我可以提前发现任何错误。 8 级仍然在商业受众的范围内。

MarketMuse NLG 技术优势

GPT-3 是一种寻找应用程序的解决方案。 访问 API 的唯一方法是加入一个候补名单,在其中描述您的用例缪斯。 即使有访问权限,您在使用通过应用程序编程接口提供的内容时仍然会受到限制。

MarketMuse NLG Technology 旨在解决特定用例,特别是为内容营销人员生成长篇 SEO 质量文章。 这是必须提供的优势。

  1. 连贯性和结构——MarketMuse NL 技术输出由 MarketMuse 内容简介决定,因此草稿是连贯的和开箱即用的结构。 GPT-3 以提示文本开头,但缺乏护栏,导致非结构化输出不适合 SEO 质量的内容。
  2. 控制– 用户可以在订购草稿之前构建自己的 MarketMuse 内容简介。 指定文章应提及的主题、应回答的问题以及文章的各个部分。 GPT-3 几乎无法控制世代提及的主题以及内容回答的问题。
  3. 出版就绪– MarketMuse NLG 技术输出可在 1-2 小时内编辑成出版就绪内容。 GPT-3 输出需要几个小时才能编辑成可供发布的内容。
  4. 降级、抄袭、重复——MarketMuse NLG 技术生成的文本不会出现长度降级、抄袭和重复。 GPT-3 输出不检查降级、抄袭或重复。
  5. 培训——MarketMuse NLG 技术接受了来自精选数据集(不包括性别歧视、种族主义和成人内容)的文章的培训,以改善几代人的成果。 GPT-3 在整个网络上训练,包括低质量、露骨和仇恨的内容,导致低质量的生成。
  6. 配置– MarketMuse NLG 技术可以配置为以您的风格或您希望模仿的风格写作,以及随着时间的推移学习新词汇。 GPT-3 只能根据模型的参数生成文本,几乎没有可配置性。
  7. 文章长度– MarketMuse NLG 技术可以根据 MarketMuse 内容简介的长度生成最多 5,000 字的文章。 GPT-3 最多只能生成约 1,200 个单词。

外卖

扩展您的内容创建,而无需扩展您的成本和令人头疼的问题。 MarketMuse NLG 技术通过使用 AI 根据 MarketMuse Content Briefs 创建完整的文章草稿来加速内容创建。 让 AI 为您提供强大的初稿,让您的内容成本可预测且质量始终如一。

你现在应该做什么

当您准备就绪时……我们可以通过以下 3 种方式帮助您更快地发布更好的内容:

  1. 与 MarketMuse 预约时间 与我们的一位策略师安排现场演示,了解 MarketMuse 如何帮助您的团队实现其内容目标。
  2. 如果您想了解如何更快地创建更好的内容,请访问我们的博客。 它充满了帮助扩展内容的资源。
  3. 如果您认识其他喜欢阅读此页面的营销人员,请通过电子邮件、LinkedIn、Twitter 或 Facebook 与他们分享。