Apa Itu Model Fondasi, dan Bagaimana Mereka Dapat Membantu Menerapkan AI dalam Skala Besar?

Diterbitkan: 2023-03-29

Sementara organisasi di seluruh dunia telah lama melakukan investasi AI, jumlah proyek kecerdasan buatan yang membuatnya dari prototipe hingga produksi masih berfluktuasi sekitar 53%.

Para ahli yakin hal ini sering terjadi karena kurangnya keterampilan teknologi, sumber daya manusia, dan alat untuk menskalakan proof of concept (PoC) AI yang terisolasi di seluruh kasus penggunaan lainnya. Dan, tentu saja, biaya pelatihan yang mungkin tinggi membedakan model AI untuk tugas yang berbeda.

Model dasar — ​​yaitu model pembelajaran mesin besar yang telah dilatih untuk menggunakan data tak berlabel dalam volume besar di bawah bimbingan konsultan AI yang terampil — mungkin merupakan jawaban akhir untuk masalah skalabilitas dan biaya AI yang menakutkan.

Perusahaan Anda dapat menggunakan model seperti itu sebagai titik awal untuk menyempurnakan atau mengotomatiskan berbagai tugas, mulai dari mengonversi dokumen berbasis kertas menjadi file teks yang dapat diedit hingga mengungkap sentimen pelanggan dalam ulasan media sosial. Dan Anda dapat membangun keunggulan AI Anda dari sana, mengadaptasi model dasar untuk tugas dan kasus penggunaan di masa mendatang.

Apa Itu Model Fondasi, dan Bagaimana Mereka Bisa Membantu Perusahaan Anda Unggul di AI?

Kecuali Anda telah hidup di bawah batu, Anda pernah mendengar tentang ChatGPT OpenAI. Program model bahasa ini telah menyerap banyak sekali teks percakapan menggunakan pembelajaran yang diawasi dan, pada tahap penyempurnaan, pembelajaran penguatan dari pendekatan umpan balik manusia (RLHF).

Solusi AI generatif ini dapat menganalisis data masukan terhadap 175 miliar parameter dan sangat memahami bahasa tertulis. Itu juga dapat menjawab pertanyaan, meringkas dan menerjemahkan teks, menghasilkan artikel tentang topik tertentu, dan menulis kode, di antara tugas-tugas lainnya. Yang Anda butuhkan hanyalah menyediakan ChatGPT dengan petunjuk yang tepat.

Produk terobosan OpenAI hanyalah salah satu contoh model dasar yang dapat mengubah pengembangan aplikasi AI seperti yang kita kenal.

Model dasar mengganggu pengembangan AI seperti yang kita ketahui. Alih-alih melatih beberapa model untuk kasus penggunaan terpisah, kini Anda dapat memanfaatkan solusi AI terlatih untuk menyempurnakan atau mengotomatiskan tugas sepenuhnya di beberapa departemen dan fungsi pekerjaan.

Dengan model dasar AI seperti ChatGPT, perusahaan tidak lagi harus melatih algoritme dari awal untuk setiap tugas yang ingin mereka tingkatkan atau otomatisasi. Sebagai gantinya, Anda hanya perlu memilih model fondasi yang paling sesuai dengan kasus penggunaan Anda — dan menyempurnakan kinerjanya untuk tujuan tertentu yang ingin Anda capai.

Model dasar sempurna untuk industri di mana data pelatihan bisa jadi terlalu sulit atau mahal untuk diperoleh. Industri-industri ini termasuk perawatan kesehatan, ilmu kehidupan, bioteknologi, dan manufaktur, untuk beberapa nama.

Apa Jenis Model AI Foundation yang Ada?

Beberapa jenis model AI dasar biasanya digunakan dalam aplikasi bisnis.

  • Model pembelajaran semi-diawasi dilatih pada kumpulan data yang berisi campuran data berlabel dan tidak berlabel. Tujuannya adalah menggunakan data berlabel untuk meningkatkan performa model pada data yang tidak berlabel. Pakar AI beralih ke pembelajaran semi-diawasi ketika data pelatihan sulit diperoleh atau akan merugikan perusahaan. Ini, misalnya, dapat terjadi dalam pengaturan medis di mana berbagai peraturan TI perawatan kesehatan diberlakukan. Beberapa contoh umum model semi-diawasi mencakup dokumen teks terlatih dan algoritme klasifikasi konten web.
  • Model pembelajaran tanpa pengawasan sepenuhnya dilatih pada kumpulan data yang tidak berlabel. Mereka menemukan pola dalam data pelatihan atau menyusunnya sendiri. Model seperti itu, antara lain, dapat mengelompokkan informasi ke dalam kluster berdasarkan parameter yang telah mereka temukan dalam kumpulan data pelatihan. Insinyur Machine Learning (ML) beralih ke pembuat enkode otomatis, K-Means, pengelompokan hierarkis, dan teknik lain untuk membuat solusi pembelajaran mesin tanpa pengawasan dan meningkatkan akurasinya.
  • Model pembelajaran penguatan berinteraksi dengan lingkungannya tanpa pelatihan khusus. Saat mencapai hasil yang diinginkan — yaitu membuat prediksi yang diharapkan pengembang — model mendapatkan hadiah. Sebaliknya, model pembelajaran penguatan dihukum ketika mereka membuat asumsi yang salah. Pendekatan ini memungkinkan algoritme AI membuat keputusan yang lebih kompleks daripada rekan mereka yang diawasi dan semi-diawasi. Contoh pembelajaran penguatan dalam aksi adalah kendaraan otonom atau program AI permainan, seperti AlphaGo.
  • Model AI generatif menghasilkan data baru yang mirip dengan data yang telah mereka latih. Data ini dapat mencakup teks, gambar, klip audio, dan video. Solusi ChatGPT yang disebutkan di bagian sebelumnya termasuk dalam kategori model AI dasar ini. Contoh lain dari AI generatif termasuk alat DALL-E 2, yang membuat gambar berdasarkan deskripsi yang ditulis dalam bahasa alami, dan platform video Synthesia.io, yang menggunakan input berbasis teks untuk menghasilkan konten video.
  • Model pembelajaran transfer dapat menyelesaikan tugas selain yang telah dilatihkan. Misalnya, insinyur visi komputer dapat memanfaatkan algoritme klasifikasi gambar terlatih untuk deteksi objek. Mereka juga dapat memanfaatkan solusi NLP yang ada untuk tugas yang lebih intensif pengetahuan, seperti analisis sentimen pelanggan. Beberapa solusi pembelajaran mesin pra-terlatih yang populer termasuk OpenCV, pustaka visi komputer yang berisi model-model tangguh untuk klasifikasi objek dan deteksi gambar, dan penawaran pustaka Transformers dari Hugging Face, seperti trafo pra-terlatih generatif (GPT) — yaitu model bahasa kaya yang ketiga generasi (GPT-3) menggerakkan layanan ChatGPT.
  • Model pembelajaran meta, tidak seperti padanannya yang berorientasi pada tugas, secara harfiah belajar untuk belajar. Alih-alih menghabiskan data untuk memecahkan masalah tertentu, model seperti itu mengembangkan strategi umum untuk pemecahan masalah. Dengan cara ini, solusi meta-learning dapat dengan mudah beradaptasi dengan tantangan baru saat menggunakan sumber dayanya, seperti memori dan daya komputasi, secara lebih efisien. Pakar ML memanfaatkan meta-learning saat data pelatihan langka, atau perusahaan tidak memiliki rencana pasti terkait implementasi AI dalam bisnis. TensorFlow, PyTorch, serta pustaka dan kerangka kerja pembelajaran mesin sumber terbuka lainnya menawarkan alat yang memungkinkan pengembang menjelajahi teknik pembelajaran meta. Terakhir, penyedia komputasi awan, seperti Google, membantu pakar ML dan pemula melatih model pembelajaran mesin khusus menggunakan AutoML.

Bergantung pada aplikasi spesifik dan tipe data yang Anda miliki, satu model pondasi mungkin lebih sesuai daripada yang lain. Perusahaan Anda bebas memilih antara solusi sumber terbuka, yang memerlukan sedikit penyesuaian, atau produk pihak ketiga yang siap pakai, asalkan memenuhi target bisnis Anda.

3 Alasan Teratas untuk Memanfaatkan Model AI Foundation untuk Proyek Anda Berikutnya

Dibandingkan dengan model pembelajaran mesin mandiri yang berorientasi pada tugas, model dasar membantu menciptakan solusi AI yang andal lebih cepat dan lebih murah, dengan lebih sedikit data yang terlibat dan penyempurnaan minimal. Dan itu belum lagi, dilatih pada lebih banyak data daripada yang bisa diperoleh satu organisasi, model yayasan menampilkan akurasi tinggi sejak hari pertama.

Di bawah ini Anda akan menemukan ikhtisar keunggulan model dasar AI.

  • Model dasar akan membantu Anda mengimplementasikan AI lebih cepat, lebih murah, dan dengan sumber daya yang lebih sedikit. Membuat dan menggunakan solusi AI membutuhkan banyak waktu dan sumber daya. Untuk setiap aplikasi baru, Anda memerlukan kumpulan data terpisah yang diberi label dengan baik. Dan jika Anda tidak memilikinya, Anda memerlukan tim ahli data untuk menemukan, membersihkan, dan melabeli informasi tersebut. Menurut Dakshi Agrawal, CTO IBM AI, model dasar membantu mengurangi persyaratan pelabelan data sebanyak 10–200 kali, bergantung pada kasus penggunaan tertentu, yang menghasilkan penghematan biaya yang signifikan. Di sisi bisnis, Anda juga harus mempertimbangkan peningkatan biaya cloud computing. Google, misalnya, menghabiskan jutaan dolar untuk mengakuisisi DeepMind. Dan meskipun proyek AI Anda mungkin tidak terlalu ambisius, Anda dapat dengan mudah membelanjakan $300.000 hanya untuk biaya server cloud agar aplikasi AI Anda aktif dan berjalan. Alasan lain untuk menggunakan model dasar, seperti solusi AI generatif, adalah kesempatan untuk dengan cepat membuat prototipe dan menguji berbagai konsep tanpa berinvestasi besar-besaran dalam R&D.
  • Anda dapat menggunakan kembali model dasar AI untuk membuat berbagai aplikasi. Sesuai dengan namanya, model dasar AI dapat berfungsi sebagai dasar untuk beberapa aplikasi AI. Pikirkan tentang mengendarai mobil. Setelah Anda memiliki SIM, Anda tidak perlu lulus ujian setiap kali membeli kendaraan lain. Demikian pula, Anda dapat menggunakan data berlabel dalam jumlah yang lebih kecil untuk melatih model dasar tujuan umum yang meringkas teks untuk memproses konten khusus domain. Dan model dasar juga memiliki kemampuan "kemunculan", yang berarti bahwa model, setelah dilatih, dapat belajar memecahkan masalah yang seharusnya tidak ditangani atau mengumpulkan wawasan tak terduga dari data pelatihan.
  • Model Foundation AI membantu mencapai tujuan keberlanjutan perusahaan Anda. Melatih satu model pembelajaran mesin besar dapat memiliki jejak lingkungan yang sama dengan menjalankan lima mobil selama masa pakainya. Jejak karbon yang begitu besar sangat kontras dengan fakta bahwa 66% bisnis meningkatkan efisiensi penggunaan energi mereka sementara 49% bisnis lain mengembangkan layanan dan produk baru yang ramah iklim. Dengan model AI dasar, Anda dapat melatih algoritme cerdas lebih cepat dan memanfaatkan sumber daya komputasi dengan bijak — paling tidak berkat arsitektur model ini yang memanfaatkan paralelisme perangkat keras, yang memungkinkan Anda menjalankan beberapa tugas secara bersamaan.

Dianggap sebagai "masa depan AI", model fondasi menurunkan ambang batas untuk memasuki AI dan berpotensi mengakhiri siklus bukti konsep AI yang gagal dengan membantu model skala bisnis di seluruh kasus penggunaan lain dan di seluruh perusahaan.

Tetapi dengan setiap kesempatan datang tantangan.

Hal yang Perlu Dipertimbangkan Saat Menggunakan Model Fondasi

Satu-satunya kelemahan mencolok dari model AI dasar adalah kesulitan dalam menjelaskan beberapa operasinya.

Model pondasi besar dapat menggunakan begitu banyak data pelatihan dan memiliki begitu banyak lapisan dalam sehingga terkadang sulit untuk menentukan bagaimana algoritme sampai pada kesimpulannya.

Sifat kotak hitam dari model yayasan juga meninggalkan pintu belakang bagi penjahat dunia maya. Peretas dapat meluncurkan serangan peracunan data dan memperkenalkan bias AI, yang semakin memperburuk masalah etika AI.

Perusahaan teknologi harus bekerja sama dengan pemerintah untuk menyiapkan infrastruktur untuk proyek AI publik guna menghindari kontroversi seputar penggunaan model dasar AI. Vendor AI juga harus mengungkapkan dataset apa yang mereka gunakan dan bagaimana mereka melatih model mereka.

Percy Liang, profesor fakultas dan ilmu komputer Stanford HAI, berpendapat selama wawancaranya baru-baru ini dengan Venture Beat, “Kami masih sangat awal, jadi norma profesional untuk AI kurang berkembang. Oleh karena itu, sangat penting bagi kami, sebagai komunitas, bertindak sekarang untuk memastikan bahwa teknologi ini dikembangkan dan digunakan dengan cara yang bertanggung jawab secara etis dan sosial.”

Apa yang Dibutuhkan untuk Mulai Menggunakan Model Fondasi di Organisasi Anda

Sebagai seseorang yang menghabiskan sepuluh tahun terakhir membantu perusahaan menerapkan sistem AI, tim Itrex menyaksikan perubahan dalam AI.

Sistem yang menjalankan tugas tertentu dalam satu domain memberi jalan bagi AI luas yang belajar lebih umum dan bekerja lintas industri dan kasus penggunaan. Model dasar, dilatih pada kumpulan data besar tanpa label dan disesuaikan untuk berbagai aplikasi, mendorong transformasi ini.

Jika perusahaan Anda siap untuk melompati pesaing Anda dan mendapatkan ROI dari sistem AI Anda lebih cepat, inilah strategi tingkat tinggi untuk menerapkan model dasar.

  1. Kumpulkan dan pra-proses data Anda. Langkah pertama melibatkan pengumpulan dan pra-pemrosesan data yang akan Anda masukkan ke model AI dasar. Kualitas dan keragaman data ini sangat penting untuk memastikan bahwa model yang disesuaikan akurat dan kuat.
  2. Pilih model pondasi. Banyak model yayasan AI pra-pelatihan tersedia di pasar. Beberapa solusi populer antara lain BERT, GPT, dan ResNet. Penting untuk memilih model fondasi yang tepat berdasarkan tugas yang ingin Anda selesaikan dan jenis data yang Anda miliki.
  3. Tweak model sesuai dengan tujuan bisnis Anda. Setelah model dan data dasar Anda siap, Anda dapat menyesuaikan parameter model untuk tugas spesifik Anda. Salah satu cara untuk mencapai tujuan ini adalah pembelajaran transfer, di mana Anda menggunakan bobot model pondasi yang telah dilatih sebelumnya sebagai titik awal dan menyesuaikannya berdasarkan data pelatihan Anda.
  4. Evaluasi modelnya. Setelah penyempurnaan, sangat penting untuk menentukan apakah model berfungsi dengan baik dan apakah penyesuaian lebih lanjut diperlukan. Untuk menilai performa model fondasi, Anda dapat menggunakan metrik standar seperti akurasi, presisi, daya ingat, dan skor F1.
  5. Terapkan solusi AI Anda. Setelah Anda puas dengan performa model yang telah disempurnakan, Anda dapat menerapkannya di lingkungan produksi. Beberapa opsi untuk menerapkan model AI mencakup platform berbasis cloud, server lokal, atau perangkat edge.

Penting untuk diingat bahwa menerapkan model dasar AI memerlukan keahlian teknis dan akses ke perangkat keras dan perangkat lunak khusus. Oleh karena itu, mungkin berguna untuk bermitra dengan vendor AI khusus atau berkonsultasi dengan tim ahli AI untuk memastikan bahwa prosesnya dilakukan secara efektif.

Hubungi kami untuk mendiskusikan kebutuhan AI Anda! Kami akan menilai kesiapan AI perusahaan Anda, mengaudit data Anda, dan mempersiapkannya untuk analisis algoritmik, dan memilih model dasar yang tepat untuk memulai kecerdasan buatan!


Artikel ini awalnya diterbitkan di situs web Itrex.