NLU motor kıyaslaması: AI pazar liderleri için veri odaklı bir yaklaşım

Yayınlanan: 2022-09-09

Doğal Dil Anlama (NLU) motorları, büyük müşteri duyarlılığı sürücüleridir. AI ve NLU o kadar gelişti ki bir Google çalışanı , şirketin sohbet robotu LaMDA'nın kendini bilen bir insan olduğunu iddia ettiğinde tüm dünyanın dikkatini çekti.

Ama endişelenme. Dünyayı ele geçiren AI botlarının hikayeleriyle veya müşteri hizmetleriyle sizi korkutmak için burada değiliz.

Amerikalı tüketicilerin yaklaşık %71'i müşteri hizmetleri konuşmalarında hala insan dokunuşunu tercih ediyor ve bu noktada referans NLU motorları devreye giriyor.

NLU, müşteri etkileşimlerine bilgi, bağlam ve duyarlılık katmanları ekleyerek aracıların müşterileri daha iyi anlamasına ve daha iyi hizmet vermesine yardımcı olabilir. Kıyaslama NLU motorları tarafından desteklenen konuşma tabanlı AI, markaların daha akıllı ve empatik olmasına ve müşteri hizmetlerini daha kişisel ve daha az makine benzeri hale getirmek için gizli müşteri ipuçlarını tespit etmesine olanak tanır.

Ancak, AI yeteneklerini değerlendirmek için NLU motorlarını nasıl kıyaslarsınız? Oraya ulaşmak için önce temel teknik terimleri anlayalım.

NLU motor kıyaslama sözlüğü

  • konuşma yapay zekası
    Konuşmaya Dayalı Yapay Zeka , insan konuşmalarının altında yatan duygu, aciliyet ve bağlamı tanıyarak bilgisayarların ve dijital uygulamaların müşterilerle empati kurmasını sağlayan NLU destekli bir yetenektir.

  • veri seti
    Veri kümesi, bilgisayarların tek bir bilgi kümesi olarak işleyebileceği ilgili bilgi kümeleri topluluğudur.

  • söz
    Sözce, metin, ses veya video yoluyla alınan kullanıcı konuşmasının bir tümcesi veya cümlesidir. NLU motorları, kullanıcı amaçlarını eğitmek, test etmek ve yorumlamak için ifadeler kullanır.

  • niyet
    Amaç, bir kullanıcının eylemlerin, olayların veya ifadelerin arkasındaki amacı belirtir. Örneğin, bir kullanıcı eylemi, ürün sorgulama, şikayet, iade talebi vb. olarak kategorize edilebilir.

  • Kesinlik
    Doğruluk, NLU motoru tarafından doğru niyetle eşleşen test cümlelerinin yüzdesidir.

  • F1 Makrosu
    Her amaç için kesinlik ve geri çağırma makro ortalamalarının harmonik ortalaması F1 Makrosu olarak adlandırılır.

    Kesinlik = bir amaca yönelik gerçek olumlu sonuçların sayısı/bir amaca yönelik tüm olumlu sonuçların sayısı.
    Geri çağırma = bir niyete yönelik gerçek pozitif sonuçların sayısı/bir niyete yönelik pozitif olarak tanımlanan sonuçların sayısı.

NLU motor kıyaslaması: süreci anlayın

NLU motorlarını karşılaştırmak sıkıcı bir süreç olabilir. Bir dizi NLU etkin çözümün kısa listeye alınması ve müşterilerinizde gözlemlenen ortak amaçları test etme alıştırmasından geçmek zaman alıcı olabilir. NLU motorlarını ve onların AI sezgi yeteneklerini önyargısız bir yaklaşımla değerlendirmek için araştırmalarla desteklenen yapılandırılmış bir yaklaşımın kullanışlı olduğu yer burasıdır.

Konuşma aracıları oluşturmak için doğal dil anlama hizmetlerini kıyaslama

Bu NLU kıyaslama yöntemi , farklı eğitim ve test veri boyutları üzerinden makine öğrenimi doğruluğunu değerlendirmek için küçük ve büyük veri kümelerine ayrılmış bir ev otomasyon botunun veri kümesindeki NLU motorlarını karşılaştırır.

NLU kıyaslama yönteminde kullanılan metodoloji

Küçük veri seti

  • 64 farklı amaç rastgele seçilir

  • NLU motorunu eğitmek için her amaç için 10 örnek cümle kullanılır

  • 1.076 örnek cümle (eğitim setinin parçası olmayan) test edildi

Büyük veri seti

  • Büyük veri seti için yukarıda bahsedilen aynı 64 amaç seçilmiştir.

  • NLU motorunu eğitmek için her amaç için yaklaşık 30 örnek cümle kullanılır

  • 5.518 örnek cümle (eğitim setinin parçası olmayan) test edildi

NLU motor kıyaslama raporu: sonuç

NLU kıyaslama yöntemi, Sprinklr'ın geri çağırma sayesinde NLP doğruluğunu ve F1 makrolarının çağdaşlarının (Google Cloud, Azure Language Studio ve AWS Comprehend) çok üzerinde olduğunu gösterir. Kıyaslama verileri ve sonuçları burada bulunabilir.

NLU motor kıyaslamasını küçük ve büyük veri kümelerine bölersek, Sprinklr NLU motoru hala açık bir kazanandır.

Not : Daha büyük veri kümeleri, daha yüksek doğruluk için amaçları test etmenin ve eğitmenin en iyi yoludur. Ancak Sprinklr'ın NLU motoruyla doğruluktaki değişiklik sadece ≤ %3'tür.

Küçük veri seti

parametreler:

  • 640 eğitim cümlesi = Niyet başına 10 cümle

  • 1.076 test cümlesi

Varlık 67@4xVarlık 68@4x

Büyük veri seti


parametreler:

  • 1.908 eğitim cümlesi ≈ Niyet başına 30 cümle

  • 5.518 test cümlesi

Varlık 69@4xVarlık 70@4x

Sprinklr, NLU motor kıyaslamada net bir kazanan olarak ortaya çıkıyor

Sprinklr'ın NLU motoru, test girdileri ve eğitim girdileri arasında daha iyi eşleme ile sorguların amacını belirlemede tutarlı ve doğru kalır.

Örnek 1: Küçük veri seti

Sorgu: bilmem gereken bir şey var mı
Temel gerçek: Calendar_query

Varlık 71@4x-100

Örnek 2: Büyük veri seti

Soru: Avrupa Birliği'nde kaç ülke var?
Temel gerçek: qa_factoid

Varlık 72@4x-100

NLU motor kıyaslamasının sınırlamaları

  • Veri kümesinin boyutu : Çok sayıda iyi araştırılmış veri kümesi kullanıldığından, NLU motorları test ifadelerinden tipik olarak bulunan ham, yapılandırılmış verilere göre daha hızlı öğrenmiş olabilir.

  • Kullanılan diller: Farklı örnekleri ve amaçları test etmek için yalnızca İngilizce kullanıldı.

  • Test verilerinin doğası : Kullanıcı ifadeleri, daha fazla gramer hatası yapabilen ve konuşma boşlukları olan tipik müşteriler gibi görünmeyebilir.

En yaygın NLU motor yorumlama zorlukları

Tipik NLU motorları, özellikle müşteri etkileşimlerini yorumlarken belirli sınırlamalarla gelir. İşte en yaygın NLU motoru yorumlama hataları ve bunlardan kaçınma stratejileri:

İğneleyici söz

NLU motorları, alaycılığı veya pasif agresif müşteri yorumlarını tespit etmekte zorlanabilir.

Varlık 76@4x

Nasıl düzeltilir: Bunun üstesinden gelmenin bir yolu, otomatik NLU motor yanıtını onaylamadan önce aracıları çalıştırmak için "teşekkür ederim, vay, her neyse" gibi anahtar sözcükler eklemektir.

belirsizlik

Bazen insanlar bir cümledeki bir kelimenin isim, fiil veya sıfat olarak kullanılıp kullanılmadığını ayırt etmekte zorlanırlar. “Beklemek” veya “dışarı çıkarmak” gibi öbek fiiller de NLU motorunun algısını etkileyebilir.

Nasıl düzeltilir: Belirsizliği azaltmanın en iyi yolu, NLU motorunu belirsiz cümleler ve ifadeler için eğitmeye devam etmektir. Zamanla motor, test girdilerini gerçek kullanıcı etkileşimleriyle karşılaştırarak öğrenmeye başlar.

NLU motorlarında ve AI sohbet robotlarında belirsizliği azaltmanın diğer yolları:

  • Daha iyi NLU eğitimi için makine öğrenimi modellerinden yararlanın: NLU motorunuzu eğitmek için Transformers'tan Çift Yönlü Kodlayıcı Temsilleri (BERT) ve Dil Modelinden Gömmeler (ELMo) gibi bağlama duyarlı makine öğrenimi modellerini kullanın. Bu AI modelleri , kelimelerin ve cümlelerin tüm farklı temsillerini dikkate alır ve belirsiz kullanıcı girişlerini doldurmak için ek metin kullanır.

  • Dil belirsizliklerini iki kez kontrol etmek için uygun istemler oluşturun : NLU motorunuzun, kullanıcıların birden fazla olasılık arasından metinlerinin doğru sürümünü seçmelerini isteyen "belirsizliği giderme" yanıtları vermesini sağlayın. Bu, Google'ın arama teriminizin olası varyasyonlarını içeren "Şunu mu demek istediniz?" istemine oldukça benzer.

  • Daha da fazlasını eğitin ve eğitin: Sinyalleri gürültüden ayırmak için NLU motorlarınızı titizlikle eğitin. NLU motorunuzu çeşitli ve benzersiz veri kümeleriyle eğitmekten daha iyi niyet tespiti için kısayol yoktur. Kullanıcı istekleri, NLU motorunun niyet etiketleme yeteneklerini etkileyen kelimeler ve cümle oluşumları içerebilir.

Varlık 77@4x

Dil hataları

Yazım hataları ve uygun olmayan cümle oluşumları, NLU motorunun kullanıcı amacını doğru bir şekilde tanımlamasını engelleyebilir. Dilbilgisi kontrolleri temel hataları çözebilirken, özellikle metin-konuşma ve konuşma analizinde argo ve konuşma dilinin yorumlanması zordur.

Nasıl düzeltilir: Bir kez daha, bu sorunun üstesinden gelmenin anahtarı, NLU motorunu hatalar ve hatalı dillerle dolu çok sayıda yanlış sahte sözcelerle beslemektir.

Alan varyasyonları

Etki alanı konuşması, bir endüstriden diğerine farklılık gösteren başka bir alandır. Sağlık hizmetlerinde “dokümantasyon”, teknolojideki “dokümantasyon” iş akışından farklı olabilir.

Nasıl düzeltilir: Amaç hiyerarşilerini açıkça tanımlamak, NLU motorunuzun bir müşteri yanıtının veya ifadesinin ilişkili olduğu sektörü veya alanı belirlemesine yardımcı olabilir.

En yüksek performanslı NLU motorlarını karakterize eden nitelikler

NLU motorlarının bilişsel yetenekleri, onları şirketiniz için değerlendirirken göz önünde bulundurulması gereken faktörlerden sadece biridir. Kullanıcı amacını geniş ölçekte anlamanın önünde duran sıkıcı manuel çabanın üstesinden gelmeye yardımcı olur.

Ayrıca, bir NLU motorunda dikkat edilmesi gereken bazı önemli nitelikler şunlardır:

1. Hız

NLU motorunun sonuçları hızlı bir şekilde vermesi gerekir, çünkü konuşma tabanlı yapay zeka, müşterinin hız ve doğrulukla yanıt verme amacını anlamakla ilgilidir. Bir müşteri etkileşimini işleme hızı, NLU motorunun amaç algılama doğruluğunu azaltmamalıdır.

2. Dikeyleştirme

NLU motorları, teknoloji, perakende, e-ticaret, lojistik ve konaklama gibi sektörleri kapsayan çok sayıda kullanım örneğine sahiptir. Konuşmaya dayalı yapay zeka işlevi, bu sektörler arasında ayrım yapabilmeli ve benzersiz bir yaklaşımla her çözüm alanına uyum sağlayabilmelidir.

3. Kullanım kolaylığı

Teknik olmayan çalışan profillerini içeren NLU motorlarına dikkat edin. Veri kümelerinin nasıl test edileceğini ve eğitileceğini anlamak, kalite güvence mühendisleri ve geliştiricileriyle sınırlı kalmamalıdır. Teknoloji dışı bir geçmişe sahip işletme sahiplerinin kendi başlarına yapabilecekleri bir şey. Kodsuz NLU motorları tarafından desteklenen konuşma tabanlı yapay zeka, benimsemeyi ve kullanılabilirliği iyileştirmenin yoludur.

4. Ölçeklenebilirlik

Bir NLU motorunun topladığı daha fazla veri girişiyle, kendisini çeşitli bölgesel anlambilim, dilsel varyasyonlar ve farklı kullanıcı ifadesi varlıkları konusunda eğitmesi gerekir. Birden çok dili işleyebilen ve konuşma tabanlı yapay zeka sohbet robotlarınızı geleceğe hazırlayabilen bir NLU çerçevesi oluşturun.

Sprinklr'ın NLU motorunu konuşma yapay zekasında pazar lideri yapan nedir?

Sprinklr'ın AI motoru, müşteri deneyimi yönetiminin tüm yelpazesini anlamak ve bağlamsallaştırmak için amaca yönelik olarak tasarlanmıştır. İşte Sprinklr AI'ı geleneksel konuşma AI platformlarından ayıran yedi farklılaştırıcı:

1. Doğru mesaj sınıflandırması

Müşteri mesajlarını otomatik olarak okuyun, deşifre edin ve analiz edin, bunları amaç olarak sınıflandırın ve doğru vaka ataması için dahili ekipleri tanımlayın.

2. Çalışkan kriz tespiti

Negatif marka sözleri ve anahtar kelimeler gibi önceden belirlenmiş parametreler veya duyarlılık tespiti gibi AI tarafından tanımlanan sıkıntı işaretleri gibi müşteri etkileşimleri kontrolden çıktığında tetikleyici uyarıları.

3. Bağlama duyarlı sanal yardım

Mevcut müşteri verilerine, bilgi tabanına ve kanallar arasındaki etkileşim geçmişine dayalı olarak müşterilere otomatik yanıtlar oluşturun veya aracılara yapay zeka yardımı sağlayın.

4. Geleceğe hazır tahmine dayalı analiz

Ürününüzü ve pazarlama yol haritalarınızı yeniden hizalamak için sadece müşteri hizmetlerini değil, aynı zamanda popüler konular, makroekonomi, tüketici duyarlılığı, halkla ilişkiler krizleri ve değişen sektör karşılaştırmaları gibi pazar eğilimlerini de öngörün. Sprinklr'ın yapay zekası, bağlamsal veri dökümleri ile dijital kanallar, müşteri demografisi ve daha fazlası arasındaki kalıpları tanıyabilir.

Varlık 78@4x

5. Akıllı görsel yorumlar

Görüntüleri ve videoları bir insan aracısı olmadan doğru bir şekilde tanımlamak için marka ve müşteri etkileşimlerinde yer alan görsel verileri işleyin.

6. Uçtan uca AI stüdyosu

Daha iyi sosyal dinleme, mesaj sınıflandırma, konuşma tabanlı yapay zeka ve sohbet robotları, yanıt otomasyonu ve self servis topluluklar için yapay zeka modellerini Sprinklr içinde eğitin, test edin ve dağıtın.

7. Marka etkileşimi denetimi

Dahili marka yönergelerine bağlılığı sağlamak için her temsilci-müşteri etkileşimini izleyin ve müşteri memnuniyetini artırmak (CSAT) ve en çok temas eden sürücüleri azaltmak için iyileştirme alanlarını belirlemek için raporlar oluşturun.

Müşteri desteğinizi el değmeden kişiselleştirme ve operasyonel verimlilikle ölçeklendirmek ister misiniz? Sprinklr'ın NLU motoru ihtiyacınız olan köprü olabilir; milyonlarca yapay zeka tahmini, veri noktası ve anında devreye alınabilen yüzlerce yapay zeka modeliyle birlikte gelir.

Modern Care Lite'ın ücretsiz deneme sürümünü başlatın

Sprinklr'ın, müşteri deneyimi genelinde dinleme, yönlendirme, çözümleme ve ölçüm yapabilmeniz için temel yapay zekayı kullanarak 13'ten fazla kanalda birinci sınıf bir deneyim sunmalarına nasıl yardımcı olduğunu öğrenin.