Le paysage de la génération du langage naturel
Publié: 2022-05-03L'application commerciale de la génération de langage naturel (NLG) en est encore à ses balbutiements. Contrairement à l'environnement martech bondé, avec plus de 7 000 participants, le paysage NLG est très clairsemé. Dans cet article, nous examinons les organisations qui utilisent NLG pour créer du contenu long et court, créer des récits à partir de données structurées et convertir du texte en parole.
Génération de contenu long (plus de 750 mots)
La technologie MarketMuseNLG est la première et la seule plate-forme à proposer un contenu long créé à l'aide de la génération de langage naturel. Nous générons du texte long à l'aide de réseaux de neurones d'apprentissage en profondeur et de synthèses de contenu MarketMuse.
Ces synthèses de contenu MarketMuse sont exactement les mêmes que celles données aux rédacteurs humains pour les aider à créer un meilleur contenu. Les mémoires fournissent un cadre détaillé à partir duquel créer du contenu. Avec leurs sujets, questions et sous-titres, les résumés de contenu MarketMuse fournissent un contexte au moteur NLG pour générer un texte pertinent.
Le résultat est une première ébauche de contenu qui atteint tous les KPI essentiels tout en nécessitant un minimum de modifications.
Génération de texte (moins de 750 mots)
Pour notre propos, nous définissons tout ce qui est inférieur à 750 mots comme une simple génération de texte. Il existe certaines situations où une forme narrative plus courte est plus appropriée - la rédaction d'e-mails et de sites Web, par exemple.
Deux offres entrent dans cette catégorie, bien que leurs objectifs soient radicalement différents.
Articoolo s'adresse aux éditeurs qui ont besoin d'articles de site Web jusqu'à 500 mots. Tout ce qui est requis est un sujet de deux à cinq mots et le nombre de mots souhaité. Bien qu'encourageant, la valeur d'articles aussi courts et superficiels est limitée.
Phrasee a fait un excellent travail en adaptant ses offres de produits à des cas d'utilisation spécifiques nécessitant un texte court. Ce sont des situations de grande valeur qui bénéficient d'une copie à fort impact et concise.
Phrasee Email est utilisé pour les lignes d'objet, le pré-en-tête, les titres, la copie de sous-titre et les appels à l'action des e-mails. Phrasee Push est utilisé pour les messages push des applications mobiles. Phrasee Social est utilisé pour créer des messages Facebook et Instagram tandis que Phrasee Everywhere aide avec AdWord, la page de destination et l'affichage de la copie publicitaire.
Réécritures et mixages d'articles
La forme la plus primitive de génération d'articles assistée par ordinateur est la réécriture d'articles, également connue sous le nom de rotation d'articles. Existant depuis plus de dix ans, les référenceurs utilisent des spinners d'articles pour produire rapidement des quantités massives de contenu de mauvaise qualité pour les réseaux de liaison.
Ce n'est pas une génération de langage naturel.
Les humains visitent rarement ces sites ou lisent ces pages. Ce sont des réseaux de blogs conçus pour exploiter Google PageRank afin que certaines pages puissent bien se classer dans la recherche.
Le principe de la filature d'article est simple. Prenez un morceau de texte original et remplacez-le par différents mots pour créer une nouvelle version. Les premières tentatives ont souffert d'un mauvais choix de mots lors de la sélection des substitutions.
Voici le paragraphe ci-dessus, parcouru par un spinner d'article.
« La raison de la réécriture de texte est simple. Prenez un contenu unique et substituez différents mots pour créer un nouveau contenu unique. Les premiers efforts ont connu une mauvaise décision de mot lors du choix des substitutions.
Bien que grammaticalement correct, c'est maladroit. Jusqu'à présent, les améliorations apportées par cette approche ont été minimes. Certains utilisent l'API de traitement du langage naturel de Google pour effectuer une analyse syntaxique, identifier les parties du discours (PoS) et extraire des jetons et des phrases. Cependant, la qualité de la production continue d'être faible et le marché cible pour ces produits reste le même.
Quelques entreprises travaillant dans cet espace incluent WordAi, SEO Article Generator, AI Spinner et Chimp Rewriter. Sans doute, il y en a beaucoup d'autres, mais aucun d'entre eux n'est bon. Bien qu'ils tentent de se positionner comme tels, ces produits n'ont que peu à voir avec l'intelligence artificielle ou le traitement du langage naturel.
Les mélangeurs d'articles sont une autre classe de générateurs de contenu qui n'ont pas grand-chose à voir avec la génération de langage naturel, malgré la façon dont ils peuvent être commercialisés. Comme son nom l'indique, le mélange d'articles consiste à mélanger des phrases de pages thématiques, à les intégrer dans un récit et à remplacer des phrases spécifiques par des synonymes.
Il y a des problèmes ici aux niveaux macro et micro. Il n'y a pas de véritable structure globale à ces pièces. Même au niveau de la peine, les choix effectués semblent quelque peu arbitraires.
Article Forge et AI Writer sont deux sociétés dont les produits entrent dans la catégorie du mélange d'articles.
Narration des données structurées
Les applications de cette catégorie prennent des ensembles de données hautement structurées et les transforment en récit. L'Associated Press produit chaque trimestre près de 4 000 articles sur les résultats des entreprises à l'aide de l'intelligence artificielle. Les sites de commerce électronique peuvent également créer des descriptions de produits, des histoires de catégories et des newsletters en utilisant cette méthode.
Il existe de nombreux cas d'utilisation pour cette approche, tant que vous disposez des données structurées pour la prendre en charge. C'est le facteur critique pour que cela fonctionne à grande échelle. Dans l'exemple du rapport sur les revenus, l'histoire globale est assez simple et ne change jamais. Ce qui rend chaque histoire différente, ce sont les variables. Voici un exemple de rapport sur les revenus d'Apple d'Associated Press.
Voici quelques marques travaillant dans cet espace :
- Forgeur de mots
- Penne
- Sémantique AX
- Arria
- YSEOP
- textengine.io
- vPhrase
- Spécificio
- Ginnie
- CREWmachine
Ces plates-formes utilisent soit une approche basée sur des modèles, soit créent des documents de manière dynamique. La plus simple est une approche de remplissage des lacunes dans laquelle les données sont remplies dans les lacunes du modèle.
Les langages de modèles Web, les scripts ou le texte produisant des règles, constituent une avancée par rapport au simple remplissage des lacunes. Mais sans capacités linguistiques sophistiquées, il a du mal à générer un texte de haute qualité.
Les fonctions grammaticales au niveau des mots facilitent relativement l'écriture de modèles complexes car elles peuvent gérer l'orthographe, la morphologie, la morphophonologie et leurs exceptions. Mais ne vous y trompez pas, générer une production de qualité de cette manière reste un défi de taille.
Texte pour parler
La synthèse vocale convertit le texte écrit en un son naturel dans une variété de langues. Ils peuvent être utilisés dans l'interaction des chatbots et des assistants vocaux, transformant les livres électroniques numériques en livres audio et interagissant avec les systèmes de navigation embarqués.
Récemment, les entreprises ont utilisé des réseaux de neurones profonds pour synthétiser la parole qui est presque identique aux enregistrements humains. Les modèles de parole, l'intonation et l'articulation de type humain réduisent considérablement la fatigue d'écoute lors de l'interaction avec les systèmes d'IA.
Une poignée d'organisations bien connues dominent ce domaine :
- IBM Watson
- Microsoft
- Amazon Polly
Résumé
Au cours des deux dernières années, la génération du langage naturel s'est principalement concentrée sur la synthèse vocale et la génération de récits à partir de données hautement structurées. Avec la technologie MarketMuse NLG, les spécialistes du marketing peuvent désormais tirer parti de NLG pour produire du contenu long.
Ce que tu dois faire maintenant
Lorsque vous êtes prêt… voici 3 façons dont nous pouvons vous aider à publier un meilleur contenu, plus rapidement :
- Réservez du temps avec MarketMuse Planifiez une démonstration en direct avec l'un de nos stratèges pour voir comment MarketMuse peut aider votre équipe à atteindre ses objectifs de contenu.
- Si vous souhaitez apprendre à créer un meilleur contenu plus rapidement, visitez notre blog. Il regorge de ressources pour vous aider à faire évoluer le contenu.
- Si vous connaissez un autre spécialiste du marketing qui aimerait lire cette page, partagez-la avec lui par e-mail, LinkedIn, Twitter ou Facebook.