2020'de Veri Biliminde Takip Edilmesi Gereken 10 Trend
Yayınlanan: 2020-08-22Çeşitli üniversitelerdeki birçok araştırmacı NLP araştırmalarını ikiye katlıyor
Herhangi bir veri bilimi projesi için en büyük göstericilerden biri, ilgili eğitim verilerinin eksikliğidir.
2020 ve önümüzdeki birkaç yıl, veri bilimini benimseyen işletmeler ve ekipler için çok heyecan verici olacak
Yapay Zeka bugün sıcak bir konu ve başka bir kışın gelebileceğini iddia eden bazı gruplar olsa da, daha büyük bir nüfus (ben dahil) bu sefer yazın geldiğini ve büyük bir parti olacağını şiddetle hissediyor. Aslında, hem donanım hem de yazılımdaki gelişmelerle birlikte, uzun bir süre kış görünmeyebilir. Aşağıda, 2020'de beni heyecanlandıran ilk 10 trend var.
Kuantum hesaplama
2019'un sonlarına doğru, Google'ın standart bir süper bilgisayarı bir milyardan fazla geride bırakan kuantum hesaplama gücünü açıklaması medyada dalgalara neden oldu. Bugün gerçek dünya uygulamalarında herhangi bir doğrudan kullanımı olmasa da, Google ve IBM gibi şirketlerdeki araştırma laboratuvarlarında kuantum hesaplamaya yoğun bir şekilde odaklanılmaktadır. Bu nedenle, 2020 ve sonrasında kuantum hesaplamada kesin sıçramalar yapacağımızdan eminiz ve yakında pratik uygulamalar için uygulanabilir hale gelebilir.
Doğal Dil İşlemedeki (NLP) Gelişmeler
Doğal dil işleme (NLP) bir süredir önemli bir odak noktası olmuştur ve son zamanlarda transformatörlerin ve dikkat modellerinin girişiyle birlikte işler tam gaz ilerlemektedir. Birkaç ay önce Elon Musk'ın OpenAI'si GPT-3 modelini piyasaya sürdü. Model, 175B'ye kadar parametre üzerinde eğitilmiş trafo mimarisi modeline dayanmaktadır. Bu her şeyi değiştirdi. Model, çeşitli dil modeli görevlerinde SOTA elde etti ve birçok özel görevde bunu yapmaya devam ediyor.
Çeşitli üniversitelerdeki birçok araştırmacı NLP araştırmalarını ikiye katlıyor. Daha yeni bağlamsallaştırılmış sözcük temsillerinden diziden diziye modellemeye kadar, NLP'ye çok sayıda kaynak ayrılmakta ve makinenin tıpkı insanlar gibi dili anlamasını ve bunlara yanıt vermesini sağlamaktadır.
Veri Depoları ve Pazar Yerleri
Herhangi bir veri bilimi projesi için en büyük göstericilerden biri, ilgili eğitim verilerinin olmamasıdır. Birçok ekip, zamanlarının %80'ini doğru eğitim verilerini toplamak için harcıyor. Geçen yıl boyunca, birçok bağımsız ekip, açık kaynak projesi ve kamu tarafından finanse edilen projeler, birçok yapılandırılmış veri kümesine erişim sağladı. Kuruluşlar ayrıca, erişimleri olan veya diğer veri bilimi ekipleri tarafından kullanılabilecek biçimlerde verileri toplayan, normalleştiren ve yapılandıran veri toplayıcılar olarak işlev gören verilerden para kazanma işine giriyor. Bu yeni iş kolu, önümüzdeki yıllarda yükselen bir trende tanıklık edecek.
Bir İşletme Olarak Ek Açıklama
Veri toplama ve birleştirme paralel yollarda gerçekleşirken, aynı verinin etiketlenmesini, açıklamasını ve eğitime hazır hale getirilmesini içeren kritik bir parça da büyük bir ivme kazanıyor. Ek açıklamaların kitle kaynaklı olmasını sağlayan mekanik turk gibi araçlar ve hizmetler zaten var, ancak şimdi bunun gerçekten uygulanabilir bir iş olabileceğine dair artan bir farkındalık var. Pek çok gelişmekte olan ülke, özellikle daha ucuz işgücü ekonomilerinde faaliyet gösterenler, girdi verilerini seçen, etiketleyen ve etiketleyen büyük ekiplerle verileri etiketleme ve bunları tüketime hazır hale getirme etrafında bir iş geliştiriyor.
Artırılmış Gerçeklik (AR)
Son birkaç yılda diğerleri de dahil olmak üzere Google Glass ve Microsoft HoloLens uygulamalarının piyasaya sürülmesinden bu yana, AR'de önemli ilerlemeler kaydedildi. Bu yıl, insanların gerçek dünya simüle edilmiş bir ortamda etkileşim kurmasını ve çalışmasını sağlayacak AR gözlüklerinde çeşitli şirketlerden patentler ve duyurular gördük. 2021'in akıllı gözlükleri dünyanın çalışma ve iletişim şeklini değiştirecek.
Sizin için tavsiye edilen:
Hizmet Olarak Veri Analitiği
Verileri ölçekte analiz etmek, iyi bir yazılım ve donanım kurulumu gerektirir. İlk veri setinin analiz edilebilmesi için önce makine öğrenimi kümeleri kurulmalı, gerekli yazılımlar (' tak ve çalıştır' olanlar dahil) kurulmalı ve önceden büyük bir maliyete katlanılmalıdır. Bununla birlikte, dolar üzerinde kuruşlarla başlayabileceğiniz birçok SaaS ve self servis çözümü vardır. Ayrıca, neredeyse tüm sağlayıcılarda bulunan AutoML gibi araçlar ve tekniklerle, yüksek güçlü veri analitiği artık herkes tarafından kullanılabilir.
AI Açıklanabilirliği
AI modelleri, özellikle de çeşitli temas noktalarından toplanan verilerin ve verilerin daha büyük türetilmiş boyutlarıyla ilgilenenler, büyük ölçüde derin öğrenme modeli kara kutularıdır. Veri girer ve karar (çıktı) çıkar. Belirli bir kararın neden verildiğinin arkasında çok az sebep var. Yapay zekanın tıbbi teşhis, kendi kendini süren araçlar, otomatik ticaret gibi uygulamalarda ve hatta işe alım ve diğer karar verme işlevlerinde kullanıldığı geleceğe doğru ilerlerken, belirli bir makinenin neden şeffaflık ve görünürlük sağlamak önemli hale geliyor. -Öğrenilmiş model belirli bir karara varmıştır. Yapay zeka modellerinin yorumlanmasında erken dönemde iyi sonuçlar veren birçok açık kaynaklı araç ve çerçeve vardır.
Sorumlu ve Etik Yapay Zeka
Kendi kendini süren bir araba, her ikisi de bir insana zarar veren iki seçenekle karşı karşıyaysa, model hangi kararı vermelidir? Verilere mi dayanmalı yoksa bazı geçersiz kılma kuralları mı olmalı?
Yapay zekada çok yeni bir ilerleme yapıldıysa, bunun sonunda savaşta kullanılacak askeri bir uygulamada kullanılması uygun mudur?
Bunlar, sorumlu ve etik yapay zekanın ele almaya çalıştığı önyargı, veri koruma, ayrımcılık vb. ile birlikte sorulardan bazılarıdır. Yapay zekanın etik kullanımı etrafında büyük bir hareket var ve birçok şirket bununla ilgilenen özel görev güçleri ve koalisyonlar oluşturuyor.
Veri Ambarı ve Veri Yönetim Platformları
Depolama uzun bir süredir var ve kuruluşların veri toplaması ve anlamlı hale gelecek şekilde yapılandırması için birincil adım olarak hizmet etti. Geçtiğimiz birkaç yıl, veri mühendisliği ekipleri tarafından veri ambarı ve veri havuzu yolculuklarını başlatmak için kullanılabilecek birçok ambarlama hizmetinin ve platformunun ortaya çıkmasına tanık oldu.
Kuruluşlar İçin Temel Bir Yetkinlik Olarak Veri Bilimi
Yıllar önce, istatistiksel ve büyük veri analizi, analitik ekiplerine verilen "uzman" beceriler olarak görülüyordu, ancak bu birkaç yıl önce değişti. Şu anda birçok iş ekibi, ekip üyelerinin verileri analiz etmek için analitik araçlarını kullanmasını tercih ediyor.
Benzer şekilde, günümüzde veri bilimi becerilerinin iş ekipleri içinde oluşturulduğu bir hareket var. İş ekipleri, veri bilimi projelerini, beklentileri ve zaman çizelgelerini nasıl yöneteceklerini ve becerilerin ve ekip yönetiminin geleneksel yazılım geliştirme ekiplerinden ne kadar farklı olduğunu öğreniyor.
Özetle, 2020 ve önümüzdeki birkaç yıl, veri bilimini ve ilgili çalışma alanlarını benimseyen işletmeler ve ekipler için çok heyecan verici olacak.