자연어 생성 환경

게시 됨: 2022-05-03

자연어 생성(NLG)의 상업적 적용은 아직 초기 단계입니다. 7,000명 이상의 참가자가 있는 혼잡한 마테크 환경과 달리 NLG 환경은 매우 희박합니다. 이 게시물에서는 NLG를 사용하여 긴 형식과 짧은 형식의 콘텐츠를 제작하고 구조화된 데이터에서 내러티브를 만들고 텍스트를 음성으로 변환하는 조직을 살펴봅니다.

장편 콘텐츠 생성(750단어 이상)

MarketMuseNLG Technology는 자연어 생성을 사용하여 만든 장편 콘텐츠를 제공하는 최초이자 유일한 플랫폼입니다. 우리는 딥 러닝 신경망과 MarketMuse Content Briefs의 도움으로 긴 형식의 텍스트를 생성합니다.

이 MarketMuse 콘텐츠 브리프는 인간 작가가 더 나은 콘텐츠를 제작하는 데 도움을 주기 위해 제공되는 것과 똑같은 것입니다. 브리핑은 콘텐츠를 만드는 데 기반이 되는 자세한 프레임워크를 제공합니다. 주제, 질문 및 자막과 함께 MarketMuse Content Briefs는 NLG 엔진이 관련 텍스트를 생성할 수 있는 컨텍스트를 제공합니다.

MarketMuse NLG Technology 자연어 생성의 출력 예.

그 결과 최소한의 편집만 필요로 하는 모든 필수 KPI에 부합하는 초기 콘텐츠 초안이 생성됩니다.

텍스트 생성(750단어 미만)

우리의 목적을 위해 750단어 미만을 단순 텍스트 생성으로 정의합니다. 이메일 및 웹 카피라이팅과 같이 짧은 형식의 서술이 더 적절한 특정 상황이 있습니다.

목적은 근본적으로 다르지만 두 가지 제품이 이 범주에 속합니다.

Articoolo는 최대 500단어의 웹사이트 기사가 필요한 게시자를 대상으로 합니다. 필요한 것은 2~5단어의 주제와 원하는 단어 수뿐입니다. 고무적이지만 그러한 짧고 피상적인 기사의 가치는 제한적입니다.

Phrasee는 길이가 짧은 텍스트가 필요한 특정 사용 사례에 맞게 제품을 조정하는 데 탁월한 성과를 거두었습니다. 임팩트가 높고 간결한 카피의 이점을 얻을 수 있는 가치가 높은 상황입니다.

Phrasee Email은 이메일 제목, 머리말, 헤드라인, 부제목 및 행동 유도에 사용됩니다. Phrasee Push는 모바일 앱 푸시 메시지에 사용됩니다. Phrasee Social은 Facebook 및 Instagram 메시지 작성에 사용되는 반면 Phrasee Everywhere는 AdWord, 랜딩 페이지 및 디스플레이 광고 카피를 지원합니다.

기사 재작성 및 믹서

컴퓨터 지원 기사 생성의 가장 원시적인 형태는 기사 회전이라고도 하는 기사 재작성입니다. 10년 넘게 존재해 온 SEO는 기사 스피너를 사용하여 네트워크 연결을 위한 대량의 저품질 콘텐츠를 빠르게 생성합니다.

이것은 자연어 생성이 아닙니다.

인간은 이 사이트를 거의 방문하거나 이 페이지를 읽지 않습니다. 이들은 Google PageRank를 활용하여 특정 페이지가 검색 순위를 높일 수 있도록 설계된 블로그 네트워크입니다.

기사 회전의 전제는 간단합니다. 원본 텍스트를 가져오고 다른 단어로 대체하여 새 버전을 만듭니다. 초기 시도는 대체물을 선택할 때 단어 선택이 좋지 않았습니다.

여기 위의 단락이 있습니다. 기사 스피너를 통해 실행하세요.

“텍스트를 다시 쓰는 이유는 간단합니다. 유니크한 컨텐츠를 가지고 다양한 단어로 대체하여 새롭고 유니크한 컨텐츠를 만들어보세요. 초기 노력은 대체품을 선택하는 동안 잘못된 단어 결정을 경험했습니다.”

문법적으로는 맞지만 어색합니다. 지금까지 이 접근 방식을 사용한 개선은 미미했습니다. 일부는 Google의 자연어 처리 API를 사용하여 구문 분석을 수행하고 품사(PoS)를 식별하고 토큰과 문장을 추출합니다. 그러나 산출물의 품질은 계속해서 약하고 이러한 제품의 목표 시장은 동일하게 유지됩니다.

이 분야에서 일하는 몇몇 회사에는 WordAi, SEO 기사 생성기, AI Spinner 및 Chimp Rewriter가 있습니다. 의심의 여지없이 더 많은 것이 있지만 그 중 어느 것도 좋지 않습니다. 스스로를 그렇게 포지셔닝하려고 할 수 있지만 이러한 제품은 인공 지능이나 자연어 처리와 거의 관련이 없습니다.

기사 믹서는 마케팅 방법에도 불구하고 자연어 생성과 거의 관련이 없는 또 다른 종류의 콘텐츠 생성기입니다. 이름에서 알 수 있듯이 기사 혼합에는 주제와 관련된 페이지의 문장을 혼합하여 내러티브로 짜고 동의어를 사용하여 특정 구문을 대체하는 작업이 포함됩니다.

여기에는 거시적 수준과 미시적 수준 모두에서 문제가 있습니다. 이 조각에는 실제 전체 구조가 없습니다. 문장 수준에서도 선택이 다소 자의적으로 보입니다.

제품이 기사 혼합 범주에 속하는 두 회사는 Article Forge와 AI Writer입니다.

구조화된 데이터 내러티브

이 범주의 응용 프로그램은 고도로 구조화된 데이터 집합을 가져와서 내러티브로 변환합니다. AP 통신은 인공 지능의 도움으로 분기별로 거의 4,000개의 회사 실적 기사를 생산합니다. 전자 상거래 사이트는 또한 이 방법을 사용하여 제품 설명, 카테고리 스토리 및 뉴스레터를 작성할 수 있습니다.

이 접근 방식을 지원하는 구조화된 데이터가 있는 한 이 접근 방식의 사용 사례가 많이 있습니다. 이것이 이 작업을 대규모로 수행하는 데 중요한 요소입니다. 수익 보고서 예에서 전체 스토리는 매우 간단하며 절대 변경되지 않습니다. 각 이야기를 다르게 만드는 것은 변수입니다. 다음은 Associated Press의 Apple 수익 보고서의 예입니다.

다음은 이 분야에서 활동하는 일부 브랜드입니다.

  • 워드스미스
  • AX 의미론
  • 아리아
  • 이섭
  • textengine.io
  • vPhrase
  • 특정
  • 지니
  • 크루머신

이러한 플랫폼은 템플릿 기반 접근 방식을 사용하거나 문서를 동적으로 생성합니다. 가장 간단한 방법은 템플릿 내의 간격에 데이터를 채우는 간격 채우기 방식입니다.

웹 템플릿 언어, 스크립트 또는 규칙 생성 텍스트는 단순한 공백 채우기에서 한 단계 더 나아간 것입니다. 그러나 정교한 언어 능력이 없으면 고품질 텍스트를 생성하는 데 어려움을 겪습니다.

단어 수준의 문법 기능을 사용하면 철자법, 형태학, 형태음운학 및 해당 예외를 처리할 수 있으므로 복잡한 템플릿을 비교적 쉽게 작성할 수 있습니다. 그러나 실수하지 마십시오. 이러한 방식으로 고품질 출력을 생성하는 것은 여전히 ​​중요한 과제입니다.

텍스트 음성 변환

텍스트 음성 변환은 작성된 텍스트를 다양한 언어로 된 자연스러운 오디오로 변환합니다. 챗봇 및 음성 비서 상호 작용에 사용되어 디지털 전자책을 오디오북으로 전환하고 차량 내 내비게이션 시스템과 상호 작용할 수 있습니다.

최근 기업들은 사람이 녹음한 것과 거의 동일한 음성을 합성하기 위해 심층 신경망을 사용하고 있습니다. 인간과 같은 언어 패턴, 억양 및 조음은 AI 시스템과 상호 작용할 때 청취 피로를 크게 줄입니다.

소수의 잘 알려진 조직이 이 영역을 지배하고 있습니다.

  • IBM 왓슨
  • 마이크로소프트
  • 아마존 폴리
  • Google

요약

지난 몇 년 동안 자연어 생성은 주로 텍스트를 음성으로 변환하고 고도로 구조화된 데이터에서 내러티브를 생성하는 데 중점을 두었습니다. MarketMuse NLG 기술을 통해 마케터는 이제 NLG를 활용하여 긴 형식의 콘텐츠를 제작할 수 있습니다.

지금 해야 할 일

준비가 되셨다면... 더 나은 콘텐츠를 더 빠르게 게시할 수 있는 3가지 방법이 있습니다.

  1. MarketMuse와 함께 시간을 예약하십시오. 전략가와 실시간 데모 일정을 예약하여 MarketMuse가 팀이 콘텐츠 목표를 달성하는 데 어떻게 도움이 되는지 확인하십시오.
  2. 더 나은 콘텐츠를 더 빠르게 만드는 방법을 배우고 싶다면 블로그를 방문하세요. 콘텐츠 확장에 도움이 되는 리소스로 가득 차 있습니다.
  3. 이 페이지를 읽는 것을 좋아하는 다른 마케팅 담당자를 알고 있다면 이메일, LinkedIn, Twitter 또는 Facebook을 통해 공유하십시오.