O cenário da geração de linguagem natural

Publicados: 2022-05-03

A aplicação comercial da geração de linguagem natural (NLG) ainda está em sua infância. Ao contrário do ambiente martech lotado, com mais de 7.000 participantes, o cenário NLG é muito escasso. Neste post, analisamos as organizações que usam o NLG para criar conteúdo longo e curto, criar narrativas a partir de dados estruturados e converter texto em fala.

Geração de conteúdo de formato longo (mais de 750 palavras)

A MarketMuseNLG Technology é a primeira e única plataforma a oferecer conteúdo de formato longo criado usando geração de linguagem natural. Geramos texto de formato longo com a ajuda de redes neurais de aprendizado profundo e resumos de conteúdo do MarketMuse.

Esses resumos de conteúdo do MarketMuse são exatamente os mesmos dados aos escritores humanos para ajudá-los a criar um conteúdo melhor. Os resumos fornecem uma estrutura detalhada a partir da qual criar conteúdo. Com seus tópicos, perguntas e legendas, os resumos de conteúdo do MarketMuse fornecem contexto para o mecanismo NLG gerar texto relevante.

Exemplo de saída da geração de linguagem natural da MarketMuse NLG Technology.

O resultado é um rascunho inicial de conteúdo que atinge todos os KPIs essenciais, exigindo edição mínima.

Geração de texto (menos de 750 palavras)

Para nosso propósito, estamos definindo menos de 750 palavras como geração de texto simples. Existem certas situações em que uma narrativa mais curta é mais apropriada – e-mail e redação na web, por exemplo.

Duas ofertas se enquadram nessa categoria, embora seus propósitos sejam radicalmente diferentes.

Articoolo é destinado a editores que precisam de artigos do site de até 500 palavras. Tudo o que é necessário é um tópico de duas a cinco palavras e a contagem de palavras desejada. Embora encorajador, o valor desses artigos curtos e superficiais é limitado.

A Phrasee fez um excelente trabalho ao adaptar suas ofertas de produtos para casos de uso específicos que exigem texto curto. Essas são situações de alto valor que se beneficiam de uma cópia concisa e de alto impacto.

O Phrasee Email é usado para linhas de assunto de e-mail, pré-cabeçalho, títulos, cópia de subtítulo e chamadas para ação. Phrasee Push é usado para mensagens push de aplicativos móveis. O Phrasee Social é usado para criar mensagens do Facebook e Instagram, enquanto o Phrasee Everywhere ajuda com o AdWord, a página de destino e a cópia do anúncio de exibição.

Reescritores e misturadores de artigos

A forma mais primitiva de geração de artigos assistida por computador é a reescrita de artigos, também conhecida como fiação de artigos. Com mais de dez anos de existência, os SEOs usam spinners de artigos para produzir rapidamente grandes quantidades de conteúdo de baixa qualidade para vincular redes.

Isso não é geração de linguagem natural.

Os humanos raramente visitam esses sites ou lêem essas páginas. Estas são redes de blogs projetadas para explorar o Google PageRank para que certas páginas possam ter uma boa classificação na pesquisa.

A premissa da fiação de artigos é simples. Pegue um pedaço de texto original e substitua palavras diferentes para criar uma nova versão. As primeiras tentativas sofreram com a má escolha de palavras ao selecionar substituições.

Aqui está o parágrafo acima, executado através de um spinner de artigos.

“A razão da reescrita do texto é simples. Pegue um conteúdo exclusivo e substitua várias palavras para criar um novo conteúdo exclusivo. Os primeiros esforços experimentaram uma má decisão de palavras ao escolher substituições. ”

Embora gramaticalmente correto, é estranho. As melhorias usando essa abordagem até agora foram mínimas. Alguns usam a API de processamento de linguagem natural do Google para realizar análises de sintaxe, identificando partes do discurso (PoS) e extraindo tokens e frases. No entanto, a qualidade da produção continua fraca e o mercado-alvo para esses produtos permanece o mesmo.

Algumas empresas que trabalham neste espaço incluem WordAi, SEO Article Generator, AI Spinner e Chimp Rewriter. Sem dúvida, existem muitos mais, mas nenhum deles é bom. Embora possam tentar se posicionar como tal, esses produtos têm pouco a ver com inteligência artificial ou processamento de linguagem natural.

Os misturadores de artigos são outra classe de gerador de conteúdo que tem pouco a ver com a geração de linguagem natural, apesar de como eles podem ser comercializados. Como o nome indica, a mistura de artigos envolve misturar frases de páginas relacionadas ao tópico, tecendo-as em uma narrativa e substituindo frases específicas usando sinônimos.

Há problemas aqui nos níveis macro e micro. Não há uma estrutura geral real para essas peças. Mesmo no nível da sentença, as escolhas feitas parecem um tanto arbitrárias.

Duas empresas cujos produtos se enquadram na categoria de mixagem de artigos são a Article Forge e a AI Writer.

Narrativa de Dados Estruturados

Os aplicativos nesta categoria pegam conjuntos de dados altamente estruturados e os transformam em uma narrativa. A Associated Press produz quase 4.000 artigos sobre lucros da empresa trimestralmente com a ajuda de inteligência artificial. Os sites de comércio eletrônico também podem criar descrições de produtos, histórias de categorias e boletins informativos usando esse método.

Existem vários casos de uso para essa abordagem, desde que você tenha os dados estruturados para apoiá-la. Esse é o fator crítico para fazer isso funcionar em escala. No exemplo do relatório de ganhos, a história geral é bastante simples e nunca muda. O que torna cada história diferente são as variáveis. Aqui está um exemplo de um relatório de ganhos da Apple da Associated Press.

Aqui estão algumas marcas que trabalham neste espaço:

  • Escritor
  • Pena
  • Semântica AX
  • Arria
  • YSEOP
  • textengine.io
  • vFrase
  • Especificação
  • Gina
  • CREWmachine

Essas plataformas usam uma abordagem baseada em modelo ou criam documentos dinamicamente. A mais simples é uma abordagem de preenchimento de lacunas, na qual os dados são preenchidos nas lacunas do modelo.

Linguagens de modelagem da Web, scripts ou texto de produção de regras, é um passo à frente do simples preenchimento de lacunas. Mas sem recursos linguísticos sofisticados, ele se esforça para gerar texto de alta qualidade.

As funções gramaticais no nível da palavra tornam relativamente mais fácil escrever modelos complexos, pois podem lidar com ortografia, morfologia, morfofonologia e suas exceções. Mas não se engane, gerar resultados de qualidade dessa maneira continua sendo um desafio significativo.

Texto para fala

O texto em fala converte texto escrito em áudio com som natural em vários idiomas. Eles podem ser usados ​​na interação do chatbot e do assistente de voz, transformando ebooks digitais em audiolivros e interagindo com sistemas de navegação no carro.

Recentemente, as empresas têm usado redes neurais profundas para sintetizar a fala que é quase idêntica às gravações humanas. Padrões de fala, entonação e articulação semelhantes aos humanos reduzem significativamente a fadiga auditiva ao interagir com sistemas de IA.

Um punhado de organizações bem conhecidas dominam esta área:

  • IBM Watson
  • Microsoft
  • Amazon Polly
  • Google

Resumo

Nos últimos dois anos, a geração de linguagem natural concentrou-se principalmente na conversão de texto em fala e na geração de narrativas a partir de dados altamente estruturados. Com a tecnologia MarketMuse NLG, os profissionais de marketing agora podem tirar proveito do NLG para produzir conteúdo de formato longo.

O que você deve fazer agora

Quando estiver pronto... aqui estão 3 maneiras de ajudá-lo a publicar conteúdo melhor, mais rápido:

  1. Reserve um tempo com o MarketMuse Agende uma demonstração ao vivo com um de nossos estrategistas para ver como o MarketMuse pode ajudar sua equipe a atingir suas metas de conteúdo.
  2. Se você quiser aprender a criar conteúdo melhor e mais rápido, visite nosso blog. Está cheio de recursos para ajudar a dimensionar o conteúdo.
  3. Se você conhece outro profissional de marketing que gostaria de ler esta página, compartilhe com ele por e-mail, LinkedIn, Twitter ou Facebook.