Etkili Öğrenme: Yapay Zekanın Yakın Geleceği

Yayınlanan: 2017-11-09

Bu Etkili Öğrenme Teknikleri Yeni Derin Öğrenme/Makine Öğrenimi Teknikleri Değil, Var Olan Teknikleri Hack Olarak Artırıyor

Yapay zekanın nihai geleceğinin insan zekasına ulaşmak ve onu aşmak olduğuna kesinlikle şüphe yok. Ancak bu, elde edilmesi çok uzak bir başarıdır. Aramızdaki en iyimser olanlar bile, insan seviyesindeki AI'nın (YGG veya ASI) 10-15 yıl kadar uzakta olacağına bahse girerken, şüpheciler mümkünse yüzyıllar alacağına bile bahse girmeye isteklidir. Neyse, yazının konusu bu değil.

Burada daha somut, daha yakın bir gelecek hakkında konuşacağız ve bize göre AI'nın yakın geleceğini şekillendirecek olan yeni ortaya çıkan ve güçlü AI algoritmalarını ve tekniklerini tartışacağız.

Yapay zeka, seçilmiş ve belirli birkaç görevde insanları iyileştirmeye başladı. Örneğin, cilt kanseri teşhisinde doktorları yenmek ve dünya şampiyonasında Go oyuncularını yenmek. Ancak aynı sistemler ve modeller, çözmek için eğitildiklerinden farklı görevleri yerine getirmede başarısız olacaktır. Bu nedenle, uzun vadede, yeniden değerlendirmeye ihtiyaç duymadan bir dizi görevi verimli bir şekilde yerine getiren genel olarak akıllı bir sistem, AI'nın geleceği olarak adlandırılır.

Ancak, AI'nın yakın geleceğinde, AGI ortaya çıkmadan çok önce, bilim adamları, bugün karşılaştıkları sorunların üstesinden gelmek ve laboratuvarlardan çıkmak ve günlük kullanım nesneleri haline gelmek için AI destekli algoritmayı nasıl yapacaklar?

Etrafınıza baktığınızda, AI her seferinde bir kale kazanıyor (AI'nın insanları nasıl geride bıraktığına dair yazılarımızı okuyun, birinci kısım ve ikinci kısım). Böyle bir kazan-kazan oyununda yanlış giden ne olabilir? İnsanlar zamanla daha fazla veri (yapay zekanın tükettiği yem) üretiyor ve donanım yeteneklerimiz de daha iyi hale geliyor. Sonuçta, Derin Öğrenme devriminin 2012'de başlamasının nedenleri veri ve daha iyi hesaplamadır, değil mi? Gerçek şu ki , veri ve hesaplamanın büyümesinden daha hızlı, insan beklentilerinin büyümesidir. Veri Bilimcileri, gerçek dünyadaki sorunları çözmek için şu anda var olanın ötesinde çözümler düşünmek zorunda kalacaklardı. Örneğin, çoğu insanın düşündüğü gibi görüntü sınıflandırması bilimsel olarak çözülmüş bir problemdir (%100 doğruluk veya GTFO deme dürtüsüne direnirsek).

AI kullanarak insan kapasitesine uygun görüntüleri (kedi görüntüleri veya köpek görüntüleri diyelim) sınıflandırabiliriz. Ancak bu, gerçek dünyadaki kullanım durumları için zaten kullanılabilir mi? AI, insanların karşılaştığı daha pratik sorunlara bir çözüm sunabilir mi? Bazı durumlarda evet, ancak çoğu durumda henüz orada değiliz.

Yapay zeka kullanarak gerçek dünya çözümü geliştirmenin önündeki ana engeller olan zorluklarda size yol göstereceğiz. Diyelim ki kedi ve köpek resimlerini sınıflandırmak istiyorsunuz. Yazı boyunca bu örneği kullanacağız.

Örnek algoritmamız: Kedi ve köpek resimlerini sınıflandırma

Aşağıdaki grafik zorlukları özetlemektedir:

Gerçek dünyadan bir yapay zeka geliştirmeyle ilgili zorluklar

Bu zorlukları ayrıntılı olarak tartışalım:

Daha Az Veriyle Öğrenme

  • En başarılı Derin Öğrenme algoritmalarının tükettiği eğitim verileri, içerdiği içeriğe/özelliğe göre etiketlenmesini gerektirir. Bu işleme açıklama denir.
  • Algoritmalar çevrenizde doğal olarak bulunan verileri kullanamaz. Birkaç yüzün (veya birkaç bin veri noktasının) açıklaması kolaydır, ancak insan düzeyinde görüntü sınıflandırma algoritmamız iyi öğrenmek için bir milyon açıklamalı görüntü aldı.
  • Öyleyse soru şu ki, bir milyon görüntüye açıklama eklemek mümkün mü? Değilse, AI daha az miktarda açıklamalı veriyle nasıl ölçeklenebilir?

Çeşitli Gerçek Dünya Sorunlarını Çözme

  • Veri kümeleri sabit olsa da, gerçek dünya kullanımı daha çeşitlidir (örneğin, renkli görüntüler üzerinde eğitilen algoritma, insanların aksine gri tonlamalı görüntülerde kötü bir şekilde başarısız olabilir).
  • İnsanlarla eşleşecek nesneleri algılamak için Bilgisayarla Görme algoritmalarını geliştirdik. Ancak daha önce de belirtildiği gibi, bu algoritmalar, birçok anlamda çok daha genel olan insan zekasına kıyasla çok özel bir sorunu çözüyor.
  • Kedi ve köpekleri sınıflandıran örnek AI algoritmamız, o türün görüntüleri ile beslenmediği takdirde, nadir görülen bir köpek türünü tanımlayamayacaktır.

Artımlı Verileri Ayarlama

  • Bir diğer önemli zorluk da artımlı verilerdir. Örneğimizde, kedileri ve köpekleri tanımaya çalışıyorsak, ilk konuşlandırmada AI'mızı farklı türlerin bir dizi kedi ve köpek görüntüsü için eğitebiliriz. Ancak tamamen yeni bir türün keşfi üzerine, önceki türlerle birlikte “Kotpies” i tanımak için algoritmayı eğitmemiz gerekiyor.
  • Yeni tür, diğerlerine düşündüğümüzden daha benzer olsa ve algoritmayı uyarlamak için kolayca eğitilebilse de, bunun daha zor olduğu ve tam bir yeniden eğitim ve yeniden değerlendirme gerektirdiği noktalar var.
  • Soru şu ki, yapay zekayı en azından bu küçük değişikliklere uyarlanabilir hale getirebilir miyiz?

AI'yı hemen kullanılabilir hale getirmek için, fikir, yukarıda belirtilen zorlukları Etkili Öğrenme adı verilen bir dizi yaklaşımla çözmektir (lütfen bunun resmi bir terim olmadığını unutmayın, sadece Meta-Öğrenme, Aktarma Öğrenme, Az Yazı yazmaktan kaçınmak için uyduruyorum). Shot Learning, Adversarial Learning ve Multi-Task Learning her seferinde). Biz ParallelDots olarak artık bu yaklaşımları AI ile ilgili dar sorunları çözmek için kullanıyoruz, küçük savaşlar kazanırken daha büyük savaşları fethetmek için daha kapsamlı AI için hazırlanıyoruz. Gelin bu teknikleri teker teker tanıtalım.

Dikkat çekici bir şekilde, bu Etkili Öğrenme tekniklerinin çoğu yeni bir şey değildir. Sadece şimdi bir canlanma görüyorlar. SVM (Destek Vektör Makineleri) araştırmacıları bu teknikleri çok uzun zamandır kullanıyorlar. Öte yandan, Düşmanca Öğrenme, Goodfellow'un GAN'lardaki son çalışmalarından ortaya çıkan bir şeydir ve Sinirsel Akıl Yürütme, veri kümelerinin çok yakın zamanda kullanıma sunulduğu yeni bir teknikler kümesidir. Gelin bu tekniklerin yapay zekanın geleceğini şekillendirmede nasıl yardımcı olacağına derinlemesine bakalım.

Transfer Öğrenimi

Bu ne?

Transfer Öğrenmede adından da anlaşılacağı gibi öğrenme bir görevden diğerine aynı algoritma içerisinde aktarılır. Daha büyük bir veri kümesine sahip bir görev (kaynak görev) üzerinde eğitilen algoritmalar, (nispeten) daha küçük bir veri kümesi üzerinde farklı bir görevi (hedef görev) öğrenmeye çalışan algoritmanın bir parçası olarak değişiklik yapılarak veya değiştirilmeden aktarılabilir.

Bazı örnekler

Nesne algılama gibi farklı görevlerde özellik çıkarıcı olarak bir görüntü sınıflandırma algoritmasının parametrelerini kullanmak, Transfer Learning'in basit bir uygulamasıdır. Buna karşılık, karmaşık görevleri gerçekleştirmek için de kullanılabilir. Google'ın bir süre önce Diyabetik Retinopatiyi doktorlardan daha iyi sınıflandırmak için geliştirdiği algoritma, Transfer Learning kullanılarak yapıldı. Şaşırtıcı bir şekilde, Diyabetik Retinopati dedektörü aslında göz taramalarını sınıflandırmak için gerçek bir dünya görüntü sınıflandırıcısıydı (köpek/kedi görüntü sınıflandırıcısı).

Bana daha fazlasını anlat!

Derin Öğrenme literatüründe, sinir ağlarının kaynaktan hedef göreve aktarılan bu tür kısımlarını önceden eğitilmiş ağlar olarak adlandıran Veri Bilimcilerini bulacaksınız. İnce Ayar, hedef görev hatalarının önceden eğitilmiş ağı değiştirilmemiş olarak kullanmak yerine önceden eğitilmiş ağa hafifçe geri yayıldığı zamandır. Bilgisayarla Görmede Transfer Öğrenmeye iyi bir teknik giriş burada görülebilir. Bu basit Transfer Öğrenimi kavramı, Etkili Öğrenme metodolojilerimiz için çok önemlidir.

Sizin için tavsiye edilen:

Metaverse Hindistan Otomobil Endüstrisini Nasıl Dönüştürecek?

Metaverse Hindistan Otomobil Endüstrisini Nasıl Dönüştürecek?

Anti-Profiteing Hükmü Hintli Startuplar İçin Ne Anlama Geliyor?

Anti-Profiteing Hükmü Hintli Startuplar İçin Ne Anlama Geliyor?

Edtech Startup'ları Beceri Kazanmaya ve İş Gücünü Geleceğe Hazır Hale Getirmeye Nasıl Yardımcı Oluyor?

Edtech Startup'ları Hindistan'ın İşgücünün Becerilerini Geliştirmesine ve Geleceğe Hazır Olmasına Nasıl Yardımcı Oluyor?

Bu Hafta Yeni Çağ Teknoloji Hisseleri: Zomato'nun Sorunları Devam Ediyor, EaseMyTrip Gönderileri Stro...

Hintli Startup'lar Finansman İçin Kısayollar Kullanıyor

Hintli Startup'lar Finansman İçin Kısayollar Kullanıyor

Dijital pazarlama girişimi Logicserve Digital'in alternatif varlık yönetimi şirketi Florintree Advisors'tan 80 INR Cr fon sağladığı bildirildi.

Dijital Pazarlama Platformu Logicserve Çantaları 80 INR Cr Finansmanı, LS Dig Olarak Yeniden Markala...

Çok Görevli Öğrenme

Bu ne?

Multi-Task Learning'de, görevler arasındaki ortak özelliklerden ve farklılıklardan yararlanırken birden fazla öğrenme görevi aynı anda çözülür. Şaşırtıcıdır, ancak bazen iki veya daha fazla görevi (ana görev ve yardımcı görevler olarak da adlandırılır) birlikte öğrenmek, görevler için daha iyi sonuçlar verebilir. Lütfen her ikili, üçlü veya dörtlü görevin yardımcı olarak kabul edilemeyeceğini unutmayın. Ancak çalıştığında, doğrulukta ücretsiz bir artıştır.

Bazı örnekler

Örneğin, ParallelDots'ta Duygu, Niyet ve Duygu Algılama sınıflandırıcılarımız, ayrı ayrı eğitmemize kıyasla doğruluklarını artıran Çok Görevli Öğrenme olarak eğitildi. NLP'de bildiğimiz en iyi Semantik Rol Etiketleme ve POS etiketleme sistemi Çok Görevli Öğrenme Sistemidir, bu nedenle Bilgisayarla Görmede anlamsal ve örnek segmentasyonu için en iyi sistemlerden biridir. Google, aynı anda hem görüntü hem de metin veri kümelerinden öğrenebilen çok modlu Çok Görevli Öğreniciler (hepsine hükmedecek tek bir model) ile geldi.

Bana daha fazlasını anlat!

Gerçek dünyadaki uygulamalarda görülen Çok Görevli Öğrenmenin çok önemli bir yönü, herhangi bir görevi kurşun geçirmez hale getirmek için eğitmek, birçok alan verisine saygı duymamız gerektiğidir (alan uyarlaması da denir). Kedi ve köpek kullanım durumlarımıza bir örnek, farklı kaynakların görüntülerini (örneğin VGA kameralar ve HD kameralar ve hatta kızılötesi kameralar) tanıyan bir algoritma olacaktır. Bu gibi durumlarda, herhangi bir göreve yardımcı bir etki alanı sınıflandırması kaybı (görüntülerin nereden geldiği) eklenebilir ve ardından makine, algoritmanın ana görevde (görüntüleri kedi veya köpek görüntüleri olarak sınıflandırma) daha iyi hale gelmesini sağlayacak şekilde öğrenir, ancak yardımcı görevde kasıtlı olarak daha da kötüleşir (bu, etki alanı sınıflandırma görevinden ters hata gradyanını geri yaymak suretiyle yapılır). Buradaki fikir, algoritmanın ana görev için ayırt edici özellikleri öğrenmesi, ancak alanları farklılaştıran özellikleri unutması ve bunun onu daha iyi hale getirmesidir. Çok Görevli Öğrenme ve Etki Alanı Uyarlama kuzenleri, bildiğimiz en başarılı Etkili Öğrenme tekniklerinden biridir ve AI'nın geleceğini şekillendirmede büyük rol oynayacaktır.

Düşmanca Öğrenme

Bu ne?

Düşmanca Öğrenme, Ian Goodfellow'un araştırma çalışmasından gelişen bir alan olarak. Çelişkili Öğrenmenin en popüler uygulamaları şüphesiz çarpıcı görüntüler oluşturmak için kullanılabilecek Üretken Çelişkili Ağlar (GAN'lar) olsa da, bu tekniklerin başka birçok yolu vardır. Tipik olarak, bu oyun teorisinden ilham alan teknik, eğitim sırasında birbirlerini kandırmayı amaçlayan bir jeneratör ve bir ayrımcı olmak üzere iki algoritmaya sahiptir. Oluşturucu, tartıştığımız gibi yeni yeni görüntüler oluşturmak için kullanılabilir, ancak ayrıntıları ayırt ediciden gizlemek için diğer verilerin temsillerini de oluşturabilir. İkincisi, bu kavramın bizim için bu kadar ilgi çekici olmasının nedenidir.

Bazı örnekler

Bu yeni bir alandır ve görüntü oluşturma kapasitesi muhtemelen gökbilimciler gibi en çok ilgilenen insanların odaklandığı şeydir. Ancak bunun daha sonra anlatacağımız gibi daha yeni kullanım durumları geliştireceğine inanıyoruz.

Bana daha fazlasını anlat!

Etki alanı uyarlama oyunu, GAN kaybı kullanılarak daha iyi hale getirilebilir. Buradaki yardımcı kayıp, bir ayırıcının verilerin hangi etki alanından geldiğini sınıflandırmaya çalıştığı ve bir üretici bileşeninin veri olarak rastgele gürültü sunarak onu kandırmaya çalıştığı saf alan sınıflandırması yerine bir GAN sistemidir. Deneyimlerimize göre bu, düz alan uyarlamasından daha iyi çalışır (ki bu da kodlanması daha düzensizdir).

Birkaç Atış Öğrenimi

Bu ne?

Birkaç Atış Öğrenimi, Derin Öğrenme (veya herhangi bir Makine Öğrenimi algoritması) algoritmalarının geleneksel bir algoritmanın yapacağına kıyasla daha az sayıda örnekle öğrenmesini sağlayan tekniklerin bir çalışmasıdır. One Shot Learning, temel olarak bir kategori örneği ile öğrenmedir, tümevarımsal olarak k-shot öğrenme, her kategorinin k örneği ile öğrenme anlamına gelir.

Bazı örnekler

Bir alan olarak Few Shot Learning, tüm büyük Derin Öğrenme konferanslarında bir makale akışı görüyor ve tıpkı MNIST ve CIFAR'ın normal makine öğrenimi için olduğu gibi, artık sonuçları kıyaslamak için belirli veri kümeleri var. One-shot Learning, özellik algılama ve temsil gibi belirli görüntü sınıflandırma görevlerinde bir dizi uygulamayı görmektir.

Bana daha fazlasını anlat!

Algoritmanın tamamı veya bir kısmı olarak Transfer Öğrenimi, Çok Görevli Öğrenme ve Meta-Öğrenme dahil olmak üzere Few Shot öğrenimi için kullanılan birden fazla yöntem vardır. Akıllı kayıp işlevine sahip olmak, dinamik mimarileri kullanmak veya optimizasyon hacklerini kullanmak gibi başka yollar da var. Algoritmanın bile görmediği kategoriler için cevapları tahmin ettiğini iddia eden bir algoritma sınıfı olan Zero Shot Learning, temel olarak yeni bir veri türü ile ölçeklenebilen algoritmalardır.

Meta-Öğrenme

Bu ne?

Meta-Öğrenme tam olarak kulağa nasıl geliyorsa, bir veri kümesini gördüğünde, o belirli veri kümesi için yeni bir makine öğrenimi tahmincisi verecek şekilde eğiten bir algoritmadır. İlk bakışta, tanım çok fütüristtir. "Vay canına! bir Veri Bilimcisi bunu yapar” ve “21. yüzyılın en seksi işini” otomatikleştiriyor ve bazı açılardan Meta-Öğreniciler bunu yapmaya başladı.

Bazı örnekler

Meta-Öğrenme, son zamanlarda Derin Öğrenmede sıcak bir konu haline geldi ve en yaygın olarak hiperparametre ve sinir ağı optimizasyonu tekniğini kullanan, iyi ağ mimarileri bulma, Few-Shot görüntü tanıma ve hızlı pekiştirmeli öğrenme için birçok araştırma makalesi çıktı.

Bana daha fazlasını anlat!

Bazı insanlar hem parametrelere hem de ağ mimarisi gibi hiperparametrelere karar vermenin bu tam otomasyonuna autoML olarak atıfta bulunur ve Meta Learning ve AutoML'den farklı alanlar olarak bahseden insanlar bulabilirsiniz. Etraflarındaki tüm yutturmacalara rağmen, gerçek şu ki Meta Öğreniciler, verilerin karmaşıklığı ve çeşitliliği arttıkça Makine Öğrenimini ölçeklendirmek için hala algoritmalar ve yollar.

Çoğu Meta-Öğrenme makalesi, Wikipedia'ya göre aşağıdaki özelliklere sahip olan akıllı hilelerdir:

  • Sistem, deneyimle uyum sağlayan bir öğrenme alt sistemi içermelidir.
  • Deneyim, tek bir veri kümesindeki önceki bir öğrenme bölümünde veya farklı alanlardan veya problemlerden elde edilen meta-bilgiden yararlanılarak kazanılır.
  • Öğrenme yanlılığı dinamik olarak seçilmelidir.

Alt sistem temel olarak, bir etki alanının (veya tamamen yeni bir etki alanının) meta verileri kendisine tanıtıldığında uyum sağlayan bir kurulumdur. Bu meta veriler, artan sınıf sayısı, karmaşıklık, renk ve dokulardaki ve nesnelerdeki (görüntülerdeki), stiller, dil kalıpları (doğal dil) ve diğer benzer özelliklerdeki değişiklik hakkında bilgi verebilir. Burada bazı süper harika makalelere göz atın: Meta-Öğrenme Paylaşılan Hiyerarşiler ve Geçici Konvolüsyonları Kullanarak Meta-Öğrenme. Meta-Learning mimarilerini kullanarak Az Atış veya Sıfır Atış algoritmaları da oluşturabilirsiniz. Meta-Öğrenme, AI'nın geleceğini şekillendirmeye yardımcı olacak en umut verici tekniklerden biridir.

Sinirsel Akıl Yürütme

Bu ne?

Sinirsel Akıl Yürütme, görüntü sınıflandırma problemlerinde bir sonraki büyük şeydir. Nöral Akıl Yürütme, algoritmaların metin veya görüntüleri basitçe tanımlama ve sınıflandırma fikrinin ötesine geçtiği örüntü tanımanın üzerinde bir adımdır. Sinirsel Akıl Yürütme, metin analizi veya görsel analizde daha genel soruları çözüyor. Örneğin, aşağıdaki görüntü, Nöral Akıl Yürütme'nin bir görüntüden yanıtlayabileceği bir dizi soruyu temsil eder.

Bana daha fazlasını anlat!

Bu yeni teknikler seti, Facebook'un bAbi veri setinin veya en son CLEVR veri setinin yayınlanmasından sonra ortaya çıkıyor. Sadece kalıpları değil, ilişkileri deşifre etmek için ortaya çıkan teknikler, sadece Nöral Akıl Yürütme'yi değil, aynı zamanda Few Shot öğrenme problemleri de dahil olmak üzere birçok başka zor problemi çözmek için muazzam bir potansiyele sahiptir.

Geri gitmek

Artık tekniklerin ne olduğunu bildiğimize göre, geri dönelim ve başladığımız temel sorunları nasıl çözdüklerini görelim. Aşağıdaki tablo, zorlukların üstesinden gelmek için Etkili Öğrenme tekniklerinin yeteneklerinin anlık görüntüsünü vermektedir:

Etkili Öğrenme Tekniklerinin Yetenekleri

  • Yukarıda bahsedilen tüm teknikler, bir şekilde daha az miktarda veri ile eğitimin çözülmesine yardımcı olur. Meta-Öğrenme, sadece verilerle şekillenecek mimariler verirken, Transfer Learning, daha az veriyi telafi etmek için başka bir alandan bilgiyi yararlı hale getiriyor. Few Shot Learning, bilimsel bir disiplin olarak soruna adanmıştır. Düşmanca Öğrenme, veri kümelerinin geliştirilmesine yardımcı olabilir.
  • Etki Alanı Uyarlaması (bir tür Çok Görevli Öğrenme), Çelişmeli Öğrenme ve (bazen) Meta-Öğrenme mimarileri, veri çeşitliliğinden kaynaklanan sorunların çözülmesine yardımcı olur.
  • Meta-Learning ve Few Shot Learning, artımlı veri sorunlarının çözülmesine yardımcı olur.
  • Sinirsel Akıl Yürütme algoritmaları, Meta-Öğreniciler veya Az Sayıda Öğrenen olarak birleştirildiğinde gerçek dünyadaki sorunları çözmek için muazzam bir potansiyele sahiptir.

Lütfen bu Etkili Öğrenme tekniklerinin yeni Derin Öğrenme/Makine Öğrenimi teknikleri olmadığını, ancak mevcut teknikleri hack'ler olarak artırarak paranın karşılığını daha fazla almalarını sağladığını unutmayın. Bu nedenle, Evrişimli Sinir Ağları ve LSTM'ler gibi normal araçlarımızı çalışırken, ancak eklenen baharatlarla birlikte göreceksiniz. Daha az veriyle çalışan ve hareket halindeyken birçok görevi yerine getiren bu Etkili Öğrenme teknikleri, yapay zeka destekli ürün ve hizmetlerin daha kolay üretilmesine ve ticarileştirilmesine yardımcı olabilir. ParallelDots'ta Verimli Öğrenmenin gücünün farkındayız ve onu Araştırma felsefemizin ana özelliklerinden biri olarak dahil ediyoruz.


Parth Shrivastava'nın bu yazısı ilk olarak ParallelDots blogunda yayınlandı ve izin alınarak çoğaltıldı.