Peisajul generației limbajului natural

Publicat: 2022-05-03

Aplicarea comercială a generării limbajului natural (NLG) este încă la început. Spre deosebire de mediul martech aglomerat, cu peste 7.000 de participanți, peisajul NLG este foarte rar. În această postare, ne uităm la organizațiile care folosesc NLG pentru a crea atât conținut lung, cât și scurt, pentru a crea narațiuni din date structurate și pentru a converti textul în vorbire.

Generare de conținut în formă lungă (750+ cuvinte)

Tehnologia MarketMuseNLG este prima și singura platformă care oferă conținut de lungă durată creat folosind generarea limbajului natural. Generăm text în formă lungă cu ajutorul rețelelor neuronale de învățare profundă plus briefs de conținut MarketMuse.

Aceste informații despre conținut MarketMuse sunt exact aceleași date scriitorilor umani pentru a-i ajuta să creeze conținut mai bun. Brief-urile oferă un cadru detaliat din care să creați conținut. Cu subiectele, întrebările și subtitrarile lor, MarketMuse Content Briefs oferă context motorului NLG pentru a genera text relevant.

Exemplu de rezultate de la generarea limbajului natural MarketMuse NLG Technology.

Rezultatul este o versiune inițială a conținutului care atinge toate KPI-urile esențiale, în timp ce necesită o editare minimă.

Generare text (mai puțin de 750 de cuvinte)

În scopul nostru, definim orice mai puțin de 750 de cuvinte ca o simplă generare de text. Există anumite situații în care o narațiune în formă mai scurtă este mai potrivită - e-mail și scriere web, de exemplu.

Două oferte se încadrează în această categorie, deși scopurile lor sunt radical diferite.

Articoolo se adresează editorilor care au nevoie de articole de pe site-ul web de până la 500 de cuvinte. Tot ceea ce este necesar este un subiect de două până la cinci cuvinte și numărul de cuvinte dorit. Deși încurajatoare, valoarea unor astfel de articole scurte și superficiale este limitată.

Phrasee a făcut o treabă excelentă în adaptarea ofertelor sale de produse pentru cazuri de utilizare specifice care necesită text scurt. Acestea sunt situații de mare valoare care beneficiază de o copie de mare impact și concisă.

Phrasee Email este folosit pentru liniile de subiect ale e-mailului, antet, titluri, copie subhead și îndemnuri. Phrasee Push este folosit pentru mesajele push din aplicația mobilă. Phrasee Social este folosit pentru crearea mesajelor Facebook și Instagram, în timp ce Phrasee Everywhere ajută cu AdWord, pagina de destinație și copierea anunțurilor afișate.

Rescrierea articolelor și mixerele

Cea mai primitivă formă de generare de articole asistată de computer este rescrierea articolelor, cunoscută și sub numele de rotire a articolelor. În existență de peste zece ani, SEO-ii folosesc filatoarele de articole pentru a produce rapid cantități masive de conținut de calitate scăzută pentru conectarea rețelelor.

Aceasta nu este generarea limbajului natural.

Oamenii vizitează rar aceste site-uri sau citesc aceste pagini. Acestea sunt rețele de bloguri concepute pentru a exploata Google PageRank, astfel încât anumite pagini să se poată clasa bine în căutare.

Premisa învârtirii articolelor este simplă. Luați o bucată de text originală și înlocuiți cuvinte diferite pentru a crea o versiune nouă. Încercările timpurii au avut de suferit din cauza alegerii proaste a cuvintelor la selectarea substituțiilor.

Iată paragraful de mai sus, rulați printr-un filator de articole.

„Motivul rescrierii textului este simplu. Luați o parte unică de conținut și înlocuiți diverse cuvinte pentru a crea un conținut nou unic. Eforturile timpurii au experimentat o decizie proastă a cuvintelor în timpul alegerii substituțiilor.”

Deși este corect din punct de vedere gramatical, este ciudat. Îmbunătățirile folosind această abordare până acum au fost minime. Unii folosesc API-ul de procesare a limbajului natural de la Google pentru a efectua analize de sintaxă, identificarea părților de vorbire (PoS) și extragerea de simboluri și propoziții. Cu toate acestea, calitatea producției continuă să fie slabă, iar piața țintă pentru aceste produse rămâne aceeași.

Câteva companii care lucrează în acest spațiu includ WordAi, SEO Article Generator, AI Spinner și Chimp Rewriter. Fără îndoială, sunt multe altele, dar niciunul nu este bun. Deși ar putea încerca să se poziționeze ca atare, aceste produse au puțin de-a face cu inteligența artificială sau cu procesarea limbajului natural.

Mixerele de articole sunt o altă clasă de generatoare de conținut care au puțin de-a face cu generarea limbajului natural, în ciuda modului în care pot fi comercializate. După cum sugerează și numele, amestecarea articolelor implică amestecarea propozițiilor din pagini legate de subiect, împletirea lor într-o narațiune și înlocuirea unor fraze specifice folosind sinonime.

Există probleme aici atât la nivel macro, cât și la nivel micro. Nu există o structură generală reală a acestor piese. Chiar și la nivel de propoziție, alegerile făcute par oarecum arbitrare.

Două companii ale căror produse se încadrează în categoria de amestecare a articolelor sunt Article Forge și AI Writer.

Narațiunea datelor structurate

Aplicațiile din această categorie preiau seturi de date foarte structurate și le transformă într-o narațiune. Associated Press produce trimestrial aproape 4.000 de articole despre veniturile companiei cu ajutorul inteligenței artificiale. Site-urile de comerț electronic pot crea, de asemenea, descrieri de produse, povești de categorii și buletine informative folosind această metodă.

Există numeroase cazuri de utilizare pentru această abordare, atâta timp cât aveți datele structurate care să o susțină. Acesta este factorul critic în realizarea acestei funcții la scară. În exemplul raportului de câștiguri, povestea generală este destul de simplă și nu se schimbă niciodată. Ceea ce face ca fiecare poveste să fie diferită sunt variabilele. Iată un exemplu de raport al veniturilor Apple de la Associated Press.

Iată câteva mărci care lucrează în acest spațiu:

  • Wordsmith
  • Pană
  • Semantica AX
  • Arria
  • YSEOP
  • textengine.io
  • vPhrase
  • Specificio
  • ginnie
  • CREWmașină

Aceste platforme folosesc fie o abordare bazată pe șabloane, fie creează documente în mod dinamic. Cea mai simplă este o abordare de completare a golurilor în care datele sunt completate în golurile din șablon.

Limbi de șabloane web, scripturi sau text care produce reguli, reprezintă un pas înainte de simpla completare a golurilor. Dar fără capabilități lingvistice sofisticate, se luptă să genereze text de înaltă calitate.

Funcțiile gramaticale la nivel de cuvânt fac relativ mai ușor să scrieți șabloane complexe, deoarece se pot ocupa de ortografie, morfologie, morfofonologie și excepțiile acestora. Dar nu vă înșelați, generarea de rezultate de calitate în acest fel rămâne o provocare semnificativă.

Text to Speech

Textul în vorbire transformă textul scris în sunet natural într-o varietate de limbi. Acestea pot fi folosite în interacțiunea cu chatbot și asistentul vocal, transformând cărțile digitale digitale în cărți audio și interacționând cu sistemele de navigație din mașină.

Recent, companiile au folosit rețele neuronale profunde pentru a sintetiza vorbirea care este aproape identică cu înregistrările umane. Modelele de vorbire, intonația și articulația asemănătoare omului reduc în mod semnificativ oboseala auditivă atunci când interacționați cu sistemele AI.

O mână de organizații binecunoscute domină această zonă:

  • IBM Watson
  • Microsoft
  • Amazon Polly
  • Google

rezumat

În ultimii câțiva ani, generarea limbajului natural s-a concentrat în principal pe transformarea textului în vorbire și pe generarea de narațiuni din date foarte structurate. Cu tehnologia MarketMuse NLG, marketerii pot acum profita de NLG pentru a produce conținut de lungă durată.

Ce ar trebui să faci acum

Când sunteți gata... iată 3 moduri prin care vă putem ajuta să publicați conținut mai bun, mai rapid:

  1. Rezervați timp cu MarketMuse Programați o demonstrație live cu unul dintre strategii noștri pentru a vedea cum vă poate ajuta MarketMuse echipa să-și atingă obiectivele de conținut.
  2. Dacă doriți să aflați cum să creați mai rapid conținut mai bun, vizitați blogul nostru. Este plin de resurse pentru a ajuta la scalarea conținutului.
  3. Dacă cunoașteți un alt agent de marketing căruia i-ar face plăcere să citească această pagină, distribuiți-o prin e-mail, LinkedIn, Twitter sau Facebook.