自然言語生成の風景

公開: 2022-05-03

自然言語生成(NLG)の商用アプリケーションは、まだ初期段階にあります。 7,000人以上の参加者がいる混雑したマーテック環境とは異なり、NLGの風景は非常にまばらです。 この投稿では、NLGを使用して長い形式と短い形式の両方のコンテンツを作成し、構造化データからナラティブを作成し、テキストを音声に変換する組織について説明します。

長い形式のコンテンツ生成(750語以上)

MarketMuseNLGテクノロジーは、自然言語生成を使用して作成された長い形式のコンテンツを提供する最初で唯一のプラットフォームです。 ディープラーニングニューラルネットワークとMarketMuseコンテンツブリーフの助けを借りて、長い形式のテキストを生成します。

これらのMarketMuseコンテンツブリーフは、より良いコンテンツを作成するために人間のライターに提供されるものとまったく同じです。 ブリーフは、コンテンツを作成するための詳細なフレームワークを提供します。 MarketMuseコンテンツブリーフは、トピック、質問、およびサブタイトルとともに、NLGエンジンが関連するテキストを生成するためのコンテキストを提供します。

MarketMuseNLGTechnologyの自然言語生成からの出力例。

その結果、最小限の編集で、すべての重要なKPIに対応するコンテンツの初期ドラフトが作成されます。

テキスト生成(750語未満)

私たちの目的のために、750語未満のものを単純なテキスト生成として定義しています。 電子メールやWebコピーライティングなど、短い形式の説明がより適切な特定の状況があります。

目的は根本的に異なりますが、2つのオファリングがこのカテゴリに分類されます。

Articooloは、500語までのウェブサイト記事を必要とする出版社を対象としています。 必要なのは、2〜5語のトピックと目的の単語数だけです。 励みになりますが、そのような短くて表面的な記事の価値は限られています。

Phraseeは、短いテキストを必要とする特定のユースケースに合わせて製品を調整するという優れた仕事をしてきました。 これらは、影響力が大きく簡潔なコピーの恩恵を受ける価値の高い状況です。

Phrasee Emailは、電子メールの件名、プリヘッダー、ヘッドライン、サブヘッドコピー、およびアクションの呼び出しに使用されます。 Phrasee Pushは、モバイルアプリのプッシュメッセージに使用されます。 Phrasee SocialはFacebookとInstagramのメッセージを作成するために使用され、Phrasee EverywhereはAdWord、ランディングページ、およびディスプレイ広告のコピーを支援します。

記事のリライターとミキサー

コンピューターを利用した記事生成の最も原始的な形式は、記事の書き換えであり、記事の回転とも呼ばれます。 SEOは10年以上存在しており、記事スピナーを使用して、ネットワークをリンクするための低品質のコンテンツを大量に迅速に作成しています。

これは自然言語生成ではありません。

人間がこれらのサイトにアクセスしたり、これらのページを読んだりすることはめったにありません。 これらは、Google PageRankを利用するように設計されたブログネットワークであるため、特定のページが検索で上位にランク付けされる可能性があります。

記事の回転の前提は単純です。 元のテキストを取得し、別の単語に置き換えて新しいバージョンを作成します。 初期の試みは、置換を選択する際の単語の選択が不十分でした。

上記の段落は、記事スピナーを実行します。

「テキストを書き直す理由は簡単です。 ユニークなコンテンツを少し取り、さまざまな単語に置き換えて、新しいユニークなコンテンツを作成します。 初期の試みでは、代用を選択する際に単語の決定が不十分でした。」

文法的には正しいですが、それは厄介です。 これまでのところ、このアプローチを使用した改善は最小限に抑えられています。 Googleの自然言語処理APIを使用して構文解析を実行し、品詞(PoS)を識別し、トークンと文を抽出するものもあります。 ただし、出力の品質は引き続き弱く、これらの製品のターゲット市場は同じままです。

この分野で活動している企業には、WordAi、SEO Article Generator、AI Spinner、ChimpRewriterなどがあります。 間違いなく、もっとたくさんありますが、どれも良いものではありません。 彼らは自分たちをそのように位置付けようとするかもしれませんが、これらの製品は人工知能や自然言語処理とはほとんど関係がありません。

記事ミキサーは、どのように販売されているかにかかわらず、自然言語生成とはほとんど関係のない別のクラスのコンテンツジェネレーターです。 名前が示すように、記事のミキシングには、トピックに関連するページの文をミキシングし、それらを物語に織り込み、同義語を使用して特定のフレーズに置き換えることが含まれます。

ここには、マクロレベルとミクロレベルの両方で問題があります。 これらの部分に実際の全体的な構造はありません。 文のレベルでさえ、なされた選択は幾分恣意的であるように思われます。

製品が記事の混合のカテゴリに当てはまる2つの会社は、ArticleForgeとAIWriterです。

構造化データの物語

このカテゴリのアプリケーションは、高度に構造化されたデータのセットを取得し、それらを物語に変えます。 AP通信は、人工知能の助けを借りて、四半期ごとに4,000近くの企業収益記事を作成しています。 eコマースサイトでは、この方法を使用して製品の説明、カテゴリストーリー、ニュースレターを作成することもできます。

このアプローチをサポートする構造化データがある限り、このアプローチには多くのユースケースがあります。 これは、これを大規模に機能させるための重要な要素です。 収益レポートの例では、全体的なストーリーは非常に単純で、変更されることはありません。 それぞれのストーリーが異なるのは変数です。 これはAP通信からのAppleの収益レポートの例です。

この分野で活動しているブランドは次のとおりです。

  • ワードスミス
  • クイル
  • AXセマンティクス
  • アリア
  • YSEOP
  • textengine.io
  • vPhrase
  • スペシフィシオ
  • ジニー
  • CREWmachine

これらのプラットフォームは、テンプレートベースのアプローチを使用するか、ドキュメントを動的に作成します。 最も単純なのは、テンプレート内のギャップにデータを埋めるギャップフィルアプローチです。

Webテンプレート言語、スクリプト、またはルールを生成するテキストは、単純なギャップ埋めからのステップアップです。 しかし、洗練された言語機能がなければ、高品質のテキストを生成するのに苦労します。

単語レベルの文法関数を使用すると、正書法、形態論、形態音韻論、およびそれらの例外を処理できるため、複雑なテンプレートを比較的簡単に作成できます。 しかし、間違いなく、この方法で高品質の出力を生成することは、依然として重要な課題です。

テキスト読み上げ

テキスト読み上げは、書かれたテキストをさまざまな言語の自然な音声に変換します。 チャットボットや音声アシスタントの操作、デジタル電子書籍のオーディオブックへの変換、カーナビゲーションシステムの操作に使用できます。

最近、企業はディープニューラルネットワークを使用して、人間の録音とほぼ同じ音声を合成しています。 人間のようなスピーチパターン、イントネーション、およびアーティキュレーションは、AIシステムと対話するときのリスニング疲労を大幅に軽減します。

いくつかの有名な組織がこの分野を支配しています。

  • IBMワトソン
  • マイクロソフト
  • アマゾンポリー
  • グーグル

概要

ここ数年、自然言語生成は主にテキスト読み上げと高度に構造化されたデータからの物語の生成に焦点を合わせてきました。 MarketMuse NLGテクノロジーにより、マーケターはNLGを利用して長い形式のコンテンツを作成できるようになりました。

あなたが今すべきこと

準備ができたら…より良いコンテンツをより速く公開するための3つの方法を次に示します。

  1. MarketMuseで時間を予約するストラテジストの1人と一緒にライブデモをスケジュールして、MarketMuseがチームのコンテンツ目標の達成にどのように役立つかを確認します。
  2. より良いコンテンツをより速く作成する方法を学びたい場合は、私たちのブログにアクセスしてください。 コンテンツのスケーリングに役立つリソースが満載です。
  3. このページを読んで楽しんでいる別のマーケティング担当者を知っている場合は、電子メール、LinkedIn、Twitter、またはFacebookを介して共有してください。