Krajobraz generacji języka naturalnego
Opublikowany: 2022-05-03Komercyjne zastosowanie generowania języka naturalnego (NLG) jest wciąż w powijakach. W przeciwieństwie do zatłoczonego środowiska martech, z ponad 7000 uczestnikami, krajobraz NLG jest bardzo rzadki. W tym poście przyjrzymy się organizacjom wykorzystującym NLG do tworzenia zarówno długich, jak i krótkich treści, tworzenia narracji z danych strukturalnych i konwertowania tekstu na mowę.
Generowanie długich treści (ponad 750 słów)
Technologia MarketMuseNLG to pierwsza i jedyna platforma oferująca długie treści tworzone przy użyciu generowania języka naturalnego. Generujemy długi tekst za pomocą sieci neuronowych głębokiego uczenia się oraz zestawień treści z MarketMuse.
Te informacje o treści z MarketMuse są dokładnie takie same, jak te, które są przekazywane ludziom, którzy piszą, aby pomóc im tworzyć lepsze treści. Briefy zapewniają szczegółowe ramy, na podstawie których można tworzyć treści. Dzięki swoim tematom, pytaniom i napisom, MarketMuse Content Briefs dostarcza kontekst dla silnika NLG do generowania odpowiedniego tekstu.
Rezultatem jest wstępny projekt treści, który trafia we wszystkie kluczowe wskaźniki KPI, a jednocześnie wymaga minimalnej edycji.
Generowanie tekstu (mniej niż 750 słów)
Dla naszych celów definiujemy wszystko poniżej 750 słów jako proste generowanie tekstu. Są sytuacje, w których krótsza forma narracji jest bardziej odpowiednia – na przykład pisanie e-maili i stron internetowych.
Do tej kategorii należą dwie oferty, chociaż ich cele są radykalnie różne.
Articoolo jest skierowany do wydawców, którzy potrzebują artykułów na stronach internetowych do 500 słów. Wszystko, co jest wymagane, to temat składający się z dwóch do pięciu słów i żądana liczba słów. Choć zachęcające, wartość takich krótkich i powierzchownych artykułów jest ograniczona.
Phrase wykonał świetną robotę, dostosowując swoją ofertę produktów do konkretnych przypadków użycia, wymagających krótkiego tekstu. Są to sytuacje o dużej wartości, które zyskują dzięki efektownej i zwięzłej kopii.
Phrase Email jest używany w przypadku tematów wiadomości e-mail, nagłówków, nagłówków, kopii podtytułu i wezwań do działania. Phrase Push służy do wysyłania wiadomości Push aplikacji mobilnej. Phrase Social służy do tworzenia wiadomości na Facebooku i Instagramie, podczas gdy Phrasee Everywhere pomaga w AdWord, stronie docelowej i wyświetlaniu tekstu reklamy.
Rewriterzy i miksery artykułów
Najbardziej prymitywną formą komputerowego generowania artykułów jest przepisywanie artykułów, znane również jako wirowanie artykułów. Istniejący od ponad dziesięciu lat SEO używa spinnerów artykułów do szybkiego tworzenia ogromnych ilości niskiej jakości treści do łączenia sieci.
To nie jest generowanie języka naturalnego.
Ludzie rzadko odwiedzają te strony lub czytają te strony. Są to sieci blogów zaprojektowane w celu wykorzystania Google PageRank, aby niektóre strony mogły dobrze pozycjonować się w wynikach wyszukiwania.
Założenie przędzenia artykułów jest proste. Weź oryginalny fragment tekstu i zastąp różnymi słowami, aby utworzyć nową wersję. Wczesne próby cierpiały z powodu złego doboru słów przy wyborze zamienników.
Oto powyższy akapit, przejrzyj spinner artykułów.
„Powód przepisywania tekstu jest prosty. Weź unikalny fragment treści i zastąp różnymi słowami, aby stworzyć nową unikalną treść. Wczesne przedsięwzięcia miały słabą decyzję słowną przy wyborze zamienników”.
Choć gramatycznie poprawny, jest niezręczny. Dotychczasowe ulepszenia przy użyciu tego podejścia były minimalne. Niektórzy używają interfejsu API przetwarzania języka naturalnego Google do przeprowadzania analizy składni, identyfikowania części mowy (PoS) oraz wyodrębniania tokenów i zdań. Jednak jakość produkcji nadal jest słaba, a rynek docelowy dla tych produktów pozostaje taki sam.
Kilka firm działających w tej przestrzeni to WordAi, SEO Article Generator, AI Spinner i Chimp Rewriter. Bez wątpienia jest ich znacznie więcej, ale żaden z nich nie jest dobry. Chociaż mogą próbować pozycjonować się jako takie, produkty te mają niewiele wspólnego ze sztuczną inteligencją lub przetwarzaniem języka naturalnego.
Miksery artykułów to kolejna klasa generatorów treści, które mają niewiele wspólnego z generowaniem języka naturalnego, pomimo tego, jak mogą być sprzedawane. Jak sama nazwa wskazuje, mieszanie artykułów polega na mieszaniu zdań ze stron powiązanych tematycznie, wplataniu ich w narrację i zastępowaniu określonych fraz za pomocą synonimów.
Występują tutaj problemy zarówno na poziomie makro, jak i mikro. Te kawałki nie mają żadnej ogólnej struktury. Nawet na poziomie zdania dokonane wybory wydają się nieco arbitralne.
Dwie firmy, których produkty mieszczą się w kategorii mieszania artykułów, to Article Forge i AI Writer.
Narracja danych strukturalnych
Aplikacje z tej kategorii pobierają zestawy danych o wysokiej strukturze i przekształcają je w narrację. Associated Press produkuje kwartalnie prawie 4000 artykułów o zyskach firm z pomocą sztucznej inteligencji. Witryny e-commerce mogą również tworzyć opisy produktów, historie kategorii i biuletyny za pomocą tej metody.
Istnieje wiele przypadków użycia tego podejścia, o ile masz dane strukturalne, które je wspierają. To jest kluczowy czynnik, aby ta praca działała na dużą skalę. W przykładzie raportu o zarobkach ogólna historia jest dość prosta i nigdy się nie zmienia. To, co sprawia, że każda historia jest inna, to zmienne. Oto przykład raportu o zarobkach Apple z Associated Press.
Oto kilka marek działających w tej przestrzeni:
- Wordsmith
- Lotka
- Semantyka AX
- Arria
- YSEOP
- textengine.io
- vFraza
- Specyfika
- dżinnie
- ZAŁOGA maszyna
Platformy te wykorzystują podejście oparte na szablonach lub dynamicznie tworzą dokumenty. Najprostsze to podejście polegające na wypełnianiu luk, w którym dane są wypełniane w lukach w szablonie.
Języki szablonów internetowych, skrypty lub tekst tworzący reguły są krokiem naprzód w stosunku do prostego wypełniania luk. Ale bez wyrafinowanych możliwości językowych ma problemy z generowaniem wysokiej jakości tekstu.
Funkcje gramatyczne na poziomie wyrazu znacznie ułatwiają pisanie złożonych szablonów, ponieważ radzą sobie z ortografią, morfologią, morfofonologią i ich wyjątkami. Ale nie popełnij błędu, generowanie wysokiej jakości wydruków w ten sposób pozostaje poważnym wyzwaniem.
Tekst na mowę
Funkcja zamiany tekstu na mowę konwertuje tekst pisany na naturalnie brzmiący dźwięk w różnych językach. Mogą być używane w interakcji z chatbotem i asystentem głosowym, przekształcając cyfrowe e-booki w audiobooki oraz w interakcję z systemami nawigacji samochodowej.
Ostatnio firmy używają głębokich sieci neuronowych do syntezy mowy, która jest niemal identyczna z nagraniami ludzi. Wzory mowy podobne do ludzkich, intonacja i artykulacja znacznie zmniejszają zmęczenie słuchaniem podczas interakcji z systemami AI.
W tym obszarze dominuje garstka znanych organizacji:
- IBM Watson
- Microsoft
- Amazonka Polly
Streszczenie
W ciągu ostatnich kilku lat generowanie języka naturalnego koncentrowało się przede wszystkim na zamianie tekstu na mowę i generowaniu narracji z danych o wysokiej strukturze. Dzięki technologii MarketMuse NLG marketerzy mogą teraz wykorzystać technologię NLG do tworzenia długich treści.
Co powinieneś teraz zrobić
Kiedy będziesz gotowy… oto 3 sposoby, w jakie możemy pomóc Ci szybciej publikować lepsze treści:
- Zarezerwuj czas z MarketMuse Zaplanuj prezentację na żywo z jednym z naszych strategów, aby zobaczyć, jak MarketMuse może pomóc Twojemu zespołowi osiągnąć cele dotyczące treści.
- Jeśli chcesz dowiedzieć się, jak szybciej tworzyć lepsze treści, odwiedź naszego bloga. Jest pełen zasobów, które pomagają skalować zawartość.
- Jeśli znasz innego marketera, który chciałby przeczytać tę stronę, udostępnij mu ją za pośrednictwem poczty e-mail, LinkedIn, Twittera lub Facebooka.