Mengapa Menggunakan Pendekatan Human in the Loop (HITL) dalam Pembelajaran Mesin?

Diterbitkan: 2022-07-20

Pernahkah Anda mendengar tentang mobil Uber yang bisa mengemudi sendiri yang menabrak dan membunuh seorang wanita di Arizona? Pada kesempatan lain, solusi pengenalan wajah memprofilkan pria kulit berwarna yang tidak bersalah sebagai penjahat di New Jersey, dan alat rekrutmen bertenaga AI Amazon menunjukkan bias terhadap kandidat wanita.

Jelas, kecerdasan buatan membuat kesalahan. Kesalahan yang signifikan, bahkan mengubah hidup. Jadi, bagaimana kita masih bisa mendapatkan manfaat AI sambil menghilangkan jenis kesalahan ini? Salah satu opsinya adalah membiarkan pakar manusia melatih, mengevaluasi, dan memantau solusi bisnis AI setelah penerapan. Konsep ini disebut pembelajaran mesin human in the loop (HITL). Gartner memperkirakan bahwa di beberapa industri, solusi AI HITL akan mencakup sekitar 30% dari semua penawaran otomatisasi pada tahun 2025.

Kami berbicara dengan pakar AI kami, Maksym Bochok, untuk memahami bagaimana manusia menyesuaikan diri dalam lingkaran, manfaat apa yang mereka bawa, dan bagaimana mengatur proses ini.

Definisi dan manfaat manusia dalam lingkaran

Untuk berbuat salah adalah manusia, untuk benar-benar merusak hal-hal yang membutuhkan komputer.

–Paul Ehlrich, seorang dokter Jerman dan pemenang Hadiah Nobel

Sekarang kutipan Ehlrich lebih relevan dari sebelumnya. Dengan AI yang menangani aplikasi penting, margin kesalahan semakin tipis. Dan mesin tidak sempurna. Mereka membangun pemahaman mereka tentang tugas berdasarkan data pelatihan yang diterima, dan dapat membuat asumsi yang salah.

Dan ini membawa kita ke terminologi pembelajaran mesin manusia dalam lingkaran.

Human in the loop berarti mengintegrasikan karyawan manusia ke dalam alur pembelajaran mesin sehingga mereka dapat terus melatih dan memvalidasi model. Ini mencakup semua orang yang bekerja dengan model dan data pelatihan mereka.

Bagaimana human-in-the-loop menambah nilai pada algoritme pembelajaran mesin Anda

Mempertahankan tingkat presisi yang tinggi. Ini sangat penting untuk domain yang tidak dapat mentolerir kesalahan. Misalnya, ketika membuat peralatan penting untuk pesawat terbang, kami menginginkan otomatisasi dan kecepatan, tetapi kami tidak dapat membahayakan keselamatan. HITL juga bermanfaat dalam aplikasi yang kurang kritis. Misalnya, perusahaan konsultan besar yang sangat bergantung pada AI untuk kepatuhan peraturan dokumen melibatkan manusia dalam pembelajaran mesin loop untuk memvalidasi algoritme pemrosesan bahasa alami mereka.

Menghilangkan bias. Model pembelajaran mesin dapat menjadi bias selama pelatihan. Selain itu, mereka dapat memperoleh bias setelah penerapan, karena mereka terus belajar. Karyawan manusia dapat mendeteksi dan menghilangkan fenomena ini pada tahap awal dengan mengoreksi algoritme yang sesuai.

Memastikan transparansi. Algoritme ML mengevaluasi ribuan atau bahkan jutaan parameter untuk membuat keputusan akhir, dan seringkali tidak dapat dijelaskan. Dengan HITL, ada manusia yang mengerti bagaimana algoritma bekerja dan dapat membenarkan keputusan yang mereka buat. Ini disebut AI yang dapat dijelaskan. Misalnya, ketika seseorang mengajukan pinjaman dan ditolak, mereka mungkin meminta petugas pinjaman untuk menjelaskan alasan di balik penolakan tersebut dan apa yang dapat dilakukan pemohon untuk meningkatkan peluang mereka di lain waktu.

Membuka kesempatan kerja. Kita sering mendengar tentang AI mencuri pekerjaan orang. Pembelajaran mesin dengan manusia dalam lingkaran memberikan contoh bagaimana teknologi dapat menciptakan lowongan baru. Lihat saja pasar annotator data India.

Peran manusia dalam saluran AI

Maksym menjelaskan bagaimana manusia dapat menjadi bagian dari saluran AI untuk meningkatkan kemampuannya membuat prediksi. Model pembelajaran mesin beroperasi di bawah mode pembelajaran terawasi atau tidak terawasi. Dalam kasus pembelajaran yang diawasi, orang dapat melakukan tugas-tugas berikut:

  • Pelabelan dan anotasi. Karyawan manusia memberi label pada set data pelatihan. Tergantung pada keahlian yang dibutuhkan, ini bisa menjadi ahli domain atau karyawan mana pun dengan pelatihan yang tepat.
  • Merekayasa ulang model. Jika diperlukan, insinyur dan pemrogram ML dapat membuat penyesuaian pada algoritme untuk memastikannya mendapatkan yang terbaik dari kumpulan data yang disediakan.
  • Pelatihan dan pelatihan ulang. Karyawan memberi makan model dengan data beranotasi, melihat output, melakukan koreksi, menambahkan lebih banyak data jika memungkinkan, dan melatih kembali model.
  • Memantau kinerja model setelah penerapan. Siklus hidup machine learning manusia dalam loop tidak berhenti setelah menerapkan solusi AI di lokasi klien. Insinyur ML terus memantau kinerjanya dengan persetujuan klien dan membuat penyesuaian pada model bila diperlukan melalui verifikasi selektif terhadap outputnya. Kasus-kasus yang diperoleh melalui verifikasi selektif akan menambah dataset pelatihan awal untuk meningkatkan kinerja algoritma.

Dalam pembelajaran mesin tanpa pengawasan, algoritme mengambil data yang tidak berlabel sebagai input dan menemukan strukturnya sendiri. Dalam hal ini, manusia tidak membubuhi keterangan pada dataset dan tidak banyak mengganggu dalam pelatihan awal. Tetapi mereka dapat memperkaya model secara signifikan dengan melakukan langkah 4 di atas.

Ketika pembelajaran mesin manusia dalam lingkaran adalah kebutuhan mutlak

Maksym percaya bahwa pendekatan human in the loop bermanfaat untuk sebagian besar kasus penggunaan pembelajaran mesin. Solusi AI sangat mengesankan dalam membuat prediksi optimal saat dilatih pada kumpulan data besar yang ekstensif, sementara manusia dapat mengenali pola dari persediaan sampel data berkualitas rendah yang terbatas. Menggabungkan kedua kemampuan bersama-sama dapat menciptakan sistem yang kuat. Meskipun dalam beberapa aplikasi, model ML dapat bekerja dengan baik dengan intervensi manusia yang terbatas, ada beberapa kasus di mana manusia yang bekerja penuh dalam sistem loop adalah suatu keharusan:

  • Ketika ada kesalahan dengan algoritma bisa sangat mahal, seperti dalam diagnosis medis.
  • Ketika data yang Anda butuhkan untuk melatih algoritme dengan benar langka. Lebih banyak data pelatihan selalu sama dengan kinerja model yang lebih baik. Dengan bantuan pemantauan model pascaproduksi, Anda dapat menambah data pelatihan dengan sampel yang relevan, memberikan model lebih banyak contoh untuk dipelajari.
  • Dalam kasus one-shot learning ketika suatu algoritma dilatih pada ratusan atau bahkan ribuan sampel untuk mengklasifikasikan beberapa objek. Dan kemudian kelas lain ditambahkan, dan algoritme harus belajar mengidentifikasinya hanya dari beberapa sampel pelatihan.
  • Dalam industri yang sangat diatur di mana sangat penting untuk menjelaskan bagaimana algoritme mencapai kesimpulannya. Misalnya, ketika dokter menggunakan AI untuk menyarankan perawatan kanker yang dipersonalisasi, mereka perlu membenarkan rencana perawatan ini kepada pasien.

Saat melihat jenis data yang diproses oleh algoritma ML, HITL AI akan sangat penting untuk aplikasi visi komputer dan pemrosesan bahasa alami (NLP), terutama ketika menyangkut analisis sentimen dari teks yang mungkin mengandung sarkasme. HITL kurang penting untuk data tabular dan analisis deret waktu.

Kiat untuk meningkatkan kecerdasan buatan dengan praktik manusia dalam lingkaran

Maksym menawarkan tips berikut tentang cara berhasil menerapkan pendekatan human in the loop dalam pembelajaran mesin:

  • Saat memantau dan menganalisis kinerja algoritme setelah penerapan , tidak peduli seberapa baik manusia dalam sistem loop, peserta manusia tidak akan dapat memperhatikan setiap input yang diproses algoritme dan setiap output yang dihasilkannya. Pilih kasus Anda dengan bijak. Gunakan verifikasi selektif untuk memilih kasus yang layak Anda perhatikan. Maksym menyarankan pendekatan ini untuk pemilihan kasus pintar:
  • Berdasarkan tingkat kepercayaan. Misalnya, suatu algoritma perlu mengklasifikasikan setiap gambar input baik sebagai kucing atau anjing. Gambar yang menerima tingkat kepercayaan sekitar 48/52 atau yang serupa adalah gambar yang membingungkan algoritme dan perlu diberi label dengan benar dan digunakan untuk melatih ulang model.
  • Verifikasi acak dari kasus-kasus "sepele". Mari kita asumsikan bahwa hanya satu dari sepuluh kasus yang menyimpan informasi berharga dalam hal kinerja algoritme. Contoh kasus seperti itu adalah ketika model terlalu percaya diri tentang prediksi yang salah. Anda pasti harus mempertimbangkan kasus ini, tetapi Anda juga perlu secara acak memilih satu dari sembilan kasus yang tersisa untuk memastikan algoritme tidak menjadi terlalu percaya diri dengan prediksi yang salah atau memungkinkan bias.
  • Saat menganalisis kasus yang Anda pilih pada langkah sebelumnya , jangan membatasi diri Anda pada hasil akhir. Alih-alih melihat output dari rangkaian akhir neuron di jaringan saraf, periksa lapisan sebelumnya, seperti pada gambar di bawah, dan analisis distribusi jarak antara prediksi yang salah dan prediksi terdekat yang benar yang dibuat oleh algoritma.
  • Dorong pengguna akhir algoritme untuk memberikan umpan balik tentang kinerjanya. Buat formulir umpan balik dan buat tersedia untuk semua orang, sehingga pengguna dapat menyampaikan kekhawatiran apa pun yang mungkin mereka miliki.
  • Terus menambah set data pelatihan secara iteratif menggunakan titik data dari langkah sebelumnya. Dengan cara ini, Anda akan yakin bahwa algoritme Anda tetap relevan bahkan ketika beberapa perubahan terjadi pada operasi klien.

Alat AI berkemampuan HITL siap pakai

Ada beberapa alat pembelajaran mesin in the loop manusia siap pakai yang memungkinkan Anda memberi label pada set data pelatihan dan memverifikasi hasilnya. Namun, Anda mungkin tidak dapat menerapkan tips di atas dengan alat standar ini. Berikut adalah beberapa contoh alat human in the loop:

Google Cloud HITL

Solusi ini menawarkan alur kerja dan antarmuka pengguna (UI) yang dapat digunakan orang untuk memberi label, meninjau, dan mengedit data yang diambil dari dokumen. Perusahaan klien dapat menggunakan karyawan mereka sendiri sebagai pemberi label atau dapat mempekerjakan tenaga kerja Google HITL untuk menyelesaikan tugas.

Alat ini memiliki fitur UI tertentu untuk merampingkan alur kerja pemberi label dan memfilter output berdasarkan ambang batas kepercayaan. Ini juga memungkinkan perusahaan untuk mengelola kumpulan pemberi label mereka.

Amazon Augmented AI (Amazon A2I)

Alat kecerdasan buatan manusia dalam lingkaran ini memungkinkan orang untuk meninjau prediksi ML dengan kepercayaan diri rendah dan acak. Tidak seperti Google Cloud HITL, yang hanya beroperasi pada teks, Amazon A2I dapat melengkapi Amazon Recognition untuk mengekstrak gambar dan memvalidasi hasil. Ini juga dapat membantu meninjau data tabular.

Jika klien tidak puas dengan alur kerja A2I yang disediakan, mereka dapat mengembangkan pendekatan mereka sendiri dengan SageMaker atau alat serupa.

DataRobot Humble AI

Humble AI memungkinkan orang untuk menentukan seperangkat aturan yang harus diterapkan oleh model ML saat membuat prediksi. Setiap aturan mencakup kondisi dan tindakan yang sesuai. Saat ini, ada tiga tindakan:

  • Tidak ada operasi, ketika manusia hanya memantau kondisi yang sesuai tanpa mengganggu
  • Mengganti prediksi, ketika orang dapat mengganti output model dengan nilai yang berbeda
  • Mengembalikan kesalahan, cukup membuang prediksi sama sekali

Jadi, apakah pembelajaran mesin dengan manusia dalam lingkaran merupakan pendekatan terbaik untuk Anda?

Mempekerjakan manusia dalam pendekatan AI loop meningkatkan akurasi, transparansi, dan kualitas prediksi. Ini juga meningkatkan biaya dan waktu yang dibutuhkan untuk menyelesaikan tugas karena campur tangan manusia sekaligus menciptakan kesempatan kerja, yang merupakan efek samping positif.

Terlepas dari manfaat nyata HITL AI, ada aplikasi di mana human-out-of-the-loop adalah pendekatan yang lebih disukai karena risiko yang terkait dengan aktivitas tertentu. Pikirkan pengembangan dan penyebaran senjata otonom.

Jika Anda merasa bahwa algoritme ML Anda dapat menggunakan manusia dalam loop, tetapi Anda tidak yakin bagaimana menyeimbangkan biaya operasional dan akurasi serta kemampuan menjelaskan yang diinginkan, hubungi konsultan machine learning. Mereka akan bekerja dengan Anda untuk menemukan kecocokan yang tepat. Jika human in the loop machine learning bukanlah solusi optimal dalam kasus Anda, ada trik ML lain yang dapat membantu Anda mengatasi masalah kelangkaan data pelatihan:

  • Transfer pembelajaran , saat Anda menyempurnakan model yang telah dilatih sebelumnya dengan data Anda sendiri
  • Pembelajaran semi-diawasi , ketika Anda menggunakan kumpulan data besar yang tidak berlabel bersama dengan sejumlah kecil sampel berlabel
  • Pembelajaran yang diawasi sendiri , ketika Anda menutupi bagian acak dari sampel pelatihan di setiap batch dan algoritme mencoba memprediksinya

Apakah Anda mempertimbangkan untuk meningkatkan akurasi dan kemampuan menjelaskan model ML Anda? Berhubungan! Pakar AI ITRex akan mempelajari situasi Anda dan merancang manusia yang optimal dalam pendekatan loop untuk memenuhi kebutuhan Anda.


Awalnya diterbitkan di https://itrexgroup.com pada 17 Juli 2022.