自然语言生成景观

已发表: 2022-05-03

自然语言生成(NLG)的商业应用仍处于起步阶段。 与拥有超过 7,000 名参与者的拥挤的 martech 环境不同,NLG 环境非常稀少。 在这篇文章中,我们研究了使用 NLG 来制作长篇和短篇内容、从结构化数据创建叙述以及将文本转换为语音的组织。

长篇内容生成(750+ 字)

MarketMuseNLG Technology 是第一个也是唯一一个提供使用自然语言生成创建的长格式内容的平台。 我们在深度学习神经网络和 MarketMuse 内容简介的帮助下生成长文本。

这些 MarketMuse 内容简介与提供给人类作家的内容完全相同,以帮助他们制作更好的内容。 简报提供了一个详细的框架来创建内容。 MarketMuse 内容简介凭借其主题、问题和字幕,为 NLG 引擎生成相关文本提供了上下文。

MarketMuse NLG 技术自然语言生成的示例输出。

结果是内容的初稿达到了所有基本 KPI,同时需要最少的编辑。

文本生成(少于 750 字)

出于我们的目的,我们将任何少于 750 个单词的内容定义为简单的文本生成。 在某些情况下,更短的叙述形式更合适——例如电子邮件和网络文案。

有两种产品属于这一类,尽管它们的目的完全不同。

Articoolo 面向需要不超过 500 字的网站文章的出版商。 所需要的只是一个两到五个字的主题和所需的字数。 虽然令人鼓舞,但这些简短而肤浅的文章的价值是有限的。

Phrasee 在为需要短文本的特定用例定制产品方面做得非常出色。 这些是高价值的情况,可以从高影响力和简洁的副本中受益。

Phrasee 电子邮件用于电子邮件主题行、前标题、标题、副标题副本和号召性用语。 Phrasee Push 用于移动应用推送消息。 Phrasee Social 用于制作 Facebook 和 Instagram 消息,而 Phrasee Everywhere 则帮助处理 AdWord、登陆页面和展示广告文案。

文章重写器和混合器

计算机辅助文章生成的最原始形式是文章重写,也称为文章旋转。 十多年来,SEO 使用文章微调器快速生成大量低质量内容以用于链接网络。

这不是自然语言生成。

人类很少访问这些网站或阅读这些页面。 这些是旨在利用 Google PageRank 的博客网络,因此某些页面可以在搜索中排名很好。

文章纺纱的前提很简单。 取一段原始文本并替换不同的单词以创建一个新版本。 早期的尝试在选择替换时遇到了糟糕的单词选择。

这是上面的段落,通过文章微调器运行。

“文本重写的原因很简单。 获取独特的内容并替换各种单词以制作新的独特内容。 早期的尝试在选择替换时遇到了糟糕的单词决定。”

虽然语法正确,但很尴尬。 到目前为止,使用这种方法的改进很少。 有些确实使用 Google 的自然语言处理 API 来进行语法分析、识别词性 (PoS) 并提取标记和句子。 然而,产品质量仍然疲软,这些产品的目标市场保持不变。

在这个领域工作的一些公司包括 WordAi、SEO 文章生成器、AI Spinner 和 Chimp Rewriter。 毫无疑问,还有更多,但没有一个是好的。 尽管他们可能会尝试将自己定位为这样,但这些产品与人工智能或自然语言处理几乎没有关系。

文章混合器是另一类与自然语言生成几乎没有关系的内容生成器,尽管它们的营销方式如何。 顾名思义,文章混合包括混合来自主题相关页面的句子,将它们编织成叙述,并使用同义词替换特定短语。

这里有宏观和微观层面的问题。 这些作品没有真正的整体结构。 即使在句子层面,做出的选择似乎也有些武断。

Article Forge 和 AI Writer 这两家公司的产品属于文章混合类别。

结构化数据叙述

此类别中的应用程序采用高度结构化的数据集并将其转化为叙述。 美联社在人工智能的帮助下每季度发布近 4,000 篇公司收益文章。 电子商务网站还可以使用这种方法创建产品描述、类别故事和时事通讯。

这种方法有很多用例,只要您有结构化数据来支持它。 这是大规模开展这项工作的关键因素。 在收益报告的例子中,整个故事非常简单,永远不会改变。 每个故事的不同之处在于变量。 这是美联社的苹果收益报告示例。

以下是一些在这个领域工作的品牌:

  • 文字匠
  • 鹅毛笔
  • AX 语义
  • 阿里亚
  • 优赛普
  • 文本引擎.io
  • 短语
  • 具体
  • 金妮
  • 船员机

这些平台使用基于模板的方法或动态创建文档。 最简单的是间隙填充方法,其中数据填充在模板内的间隙中。

Web 模板语言、脚本或生成规则的文本,是从简单的填补空白的一个步骤。 但如果没有复杂的语言能力,它很难生成高质量的文本。

单词级语法功能使编写复杂模板变得相对容易,因为它们可以处理正字法、词法、词素学及其例外情况。 但请不要误会,以这种方式产生高质量的输出仍然是一项重大挑战。

文字转语音

文本到语音将书面文本转换为各种语言的自然声音。 它们可用于聊天机器人和语音助手交互,将数字电子书变成有声读物,并与车载导航系统交互。

最近,公司一直在使用深度神经网络来合成与人类录音几乎相同的语音。 与 AI 系统交互时,类人的语音模式、语调和发音可显着减少听力疲劳。

少数知名组织在这一领域占据主导地位:

  • IBM 沃森
  • 微软
  • 亚马逊波利
  • 谷歌

概括

在过去的几年里,自然语言生成主要集中在文本到语音和从高度结构化的数据中生成叙述。 借助 MarketMuse NLG 技术,营销人员现在可以利用 NLG 制作长篇内容。

你现在应该做什么

当您准备就绪时……我们可以通过以下 3 种方式帮助您更快地发布更好的内容:

  1. 与 MarketMuse 预约时间 与我们的一位策略师安排现场演示,了解 MarketMuse 如何帮助您的团队实现其内容目标。
  2. 如果您想了解如何更快地创建更好的内容,请访问我们的博客。 它充满了帮助扩展内容的资源。
  3. 如果您认识其他喜欢阅读此页面的营销人员,请通过电子邮件、LinkedIn、Twitter 或 Facebook 与他们分享。