Pengecekan fakta dan halusinasi AI | AI dalam bisnis #110

Diterbitkan: 2024-05-06

Kami menelusuri sumber anomali AI, memberikan tips praktis tentang cara menghindarinya, dan menjelaskan bagaimana pengecekan fakta dapat memastikan keandalan hasil AI. Baca terus.

Pengecekan fakta dan halusinasi AI - daftar isi

  1. Apa itu halusinasi AI?
  2. Contoh halusinasi
  3. Bagaimana cara mencegah halusinasi?
  4. Pengecekan fakta. Bagaimana cara memverifikasi hasil kerja dengan AI?
  5. Bagaimana cara mendapatkan manfaat dari halusinasi AI?
  6. Pengecekan fakta dan halusinasi AI - ringkasan

Dalam dunia kecerdasan buatan, batas antara fiksi dan kenyataan terkadang kabur. Meskipun sistem AI yang inovatif mempercepat kemajuan di hampir semua bidang, sistem tersebut juga memiliki tantangan, seperti halusinasi – sebuah fenomena di mana AI menghasilkan informasi yang tidak akurat atau salah. Untuk sepenuhnya memanfaatkan potensi teknologi ini, kita perlu memahami halusinasi dan memeriksa faktanya.

Apa itu halusinasi AI?

Halusinasi AI adalah hasil palsu atau menyesatkan yang dihasilkan oleh model AI. Fenomena ini berakar pada pembelajaran mesin – sebuah proses di mana algoritma menggunakan kumpulan data yang sangat besar, atau data pelatihan, untuk mengenali pola dan menghasilkan respons berdasarkan pola yang diamati.

Bahkan model AI tercanggih pun tidak bebas dari kesalahan. Salah satu penyebab halusinasi adalah ketidaksempurnaan data pelatihan. Jika kumpulan data tidak mencukupi, tidak lengkap, atau bias, sistem mempelajari korelasi dan pola yang salah, sehingga menghasilkan konten palsu.

Misalnya, bayangkan model AI untuk pengenalan wajah yang telah dilatih terutama pada foto orang Kaukasia. Dalam kasus seperti ini, algoritme mungkin mengalami kesulitan dalam mengidentifikasi orang dari kelompok etnis lain dengan benar karena algoritme tersebut belum “dilatih” dengan baik dalam hal ini.

Penyebab halusinasi lainnya adalah overfitting, yang terjadi ketika algoritme beradaptasi terlalu dekat dengan kumpulan data pelatihan. Akibatnya, ia kehilangan kemampuan untuk menggeneralisasi dan mengenali dengan benar pola-pola baru yang sebelumnya tidak diketahui. Model seperti itu berperforma baik pada data pelatihan tetapi gagal dalam kondisi nyata dan dinamis.

Terakhir, halusinasi dapat disebabkan oleh asumsi yang salah atau arsitektur model yang tidak memadai. Jika perancang AI mendasarkan solusi mereka pada premis yang salah atau menggunakan struktur algoritmik yang salah, sistem akan menghasilkan konten palsu dalam upaya untuk “mencocokkan” asumsi yang salah ini dengan data sebenarnya.

Fact-checking

Sumber: DALL·E 3, petunjuk: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Contoh halusinasi

Dampak halusinasi AI jauh melampaui teori. Kita semakin sering menjumpai manifestasi nyata dari hal-hal tersebut, yang terkadang mengejutkan. Berikut beberapa contoh fenomena ini:

  • Pada bulan Mei 2023, seorang pengacara menggunakan ChatGPT untuk menyiapkan gugatan yang mencakup kutipan fiktif atas keputusan pengadilan dan preseden hukum yang tidak ada. Hal ini menyebabkan konsekuensi yang serius – pengacara tersebut didenda, karena dia menyatakan bahwa dia tidak tahu apa-apa tentang kemampuan ChatGPT untuk menghasilkan informasi palsu,
  • kebetulan ChatGPT membuat informasi palsu tentang orang sungguhan. Pada April 2023, model tersebut mengarang cerita tentang dugaan pelecehan terhadap mahasiswa yang dilakukan seorang profesor hukum. Dalam kasus lain, mereka secara keliru menuduh seorang wali kota Australia menerima suap, padahal sebenarnya dia adalah seorang pelapor yang membeberkan praktik-praktik tersebut.

Ini bukan kasus yang terisolasi – model AI generatif sering kali menciptakan “fakta” ​​sejarah, misalnya memberikan catatan palsu tentang penyeberangan Selat Inggris. Terlebih lagi, mereka dapat menciptakan informasi palsu yang sangat berbeda mengenai subjek yang sama setiap saat.

Namun, halusinasi AI bukan hanya masalah data yang salah. Bentuknya juga bisa aneh dan meresahkan, seperti dalam kasus Bing, yang menyatakan cintanya pada jurnalis Kevin Roose. Hal ini menunjukkan bahwa dampak anomali ini dapat melampaui kesalahan faktual yang sederhana.

Terakhir, halusinasi dapat dengan sengaja dipicu oleh serangan khusus terhadap sistem AI, yang dikenal sebagai serangan adversarial. Misalnya, sedikit mengubah foto kucing membuat sistem pengenalan gambar menafsirkannya sebagai…. "guacamole." Jenis manipulasi ini dapat menimbulkan konsekuensi serius dalam sistem yang mengutamakan pengenalan gambar yang akurat, seperti pada kendaraan otonom.

Bagaimana cara mencegah halusinasi?

Terlepas dari besarnya tantangan yang ditimbulkan oleh halusinasi AI, ada cara efektif untuk memerangi fenomena tersebut. Kuncinya adalah pendekatan komprehensif yang menggabungkan:

  • data pelatihan berkualitas tinggi,
  • petunjuk yang relevan, yaitu perintah untuk AI,
  • secara langsung memberikan pengetahuan dan contoh untuk digunakan AI,
  • pengawasan berkelanjutan oleh manusia dan AI itu sendiri untuk meningkatkan sistem AI.
Anjuran

Salah satu alat utama dalam memerangi halusinasi adalah perintah atau perintah dan instruksi yang terstruktur dengan baik yang diberikan kepada model AI. Seringkali, perubahan kecil pada format prompt sudah cukup untuk meningkatkan akurasi dan keandalan respons yang dihasilkan.

Contoh terbaiknya adalah Claude 2.1 dari Anthropic. Meskipun menggunakan konteks panjang memberikan akurasi 27% tanpa perintah yang relevan, menambahkan kalimat “Ini kalimat paling relevan dari konteksnya:” ke perintah, meningkatkan efektivitas hingga 98%.

Perubahan seperti ini memaksa model untuk fokus pada bagian teks yang paling relevan, dibandingkan menghasilkan tanggapan berdasarkan kalimat-kalimat tersendiri yang diambil di luar konteks. Hal ini menyoroti pentingnya perintah yang dirumuskan dengan benar dalam meningkatkan akurasi sistem AI.

Membuat perintah yang mendetail dan spesifik sehingga AI memiliki ruang interpretasi yang sesedikit mungkin juga membantu mengurangi risiko halusinasi dan mempermudah pengecekan fakta. Semakin jelas dan spesifik petunjuknya, semakin rendah kemungkinan terjadinya halusinasi.

Contoh

Selain petunjuk yang efisien, ada banyak metode lain untuk mengurangi risiko halusinasi AI. Berikut adalah beberapa strategi utama:

  • menggunakan data pelatihan berkualitas tinggi dan beragam yang secara andal mewakili dunia nyata dan skenario yang mungkin terjadi. Semakin kaya dan lengkap datanya, semakin rendah risiko AI menghasilkan informasi palsu,
  • menggunakan templat data sebagai panduan untuk respons AI – menentukan format, cakupan, dan struktur keluaran yang dapat diterima, yang meningkatkan konsistensi dan keakuratan konten yang dihasilkan,
  • membatasi sumber data hanya pada materi yang andal dan terverifikasi dari entitas tepercaya. Hal ini menghilangkan risiko bahwa model akan “mempelajari” informasi dari sumber yang tidak pasti atau salah.

Pengujian dan penyempurnaan sistem AI secara terus-menerus, berdasarkan analisis performa dan akurasi aktualnya, memungkinkan koreksi berkelanjutan atas segala kekurangan dan memungkinkan model belajar dari kesalahan.

Konteks

Mendefinisikan dengan tepat konteks di mana sistem AI beroperasi juga memainkan peran penting dalam mencegah halusinasi. Tujuan penggunaan model, serta keterbatasan dan tanggung jawab model, harus didefinisikan dengan jelas.

Pendekatan seperti ini memungkinkan untuk menetapkan kerangka kerja yang jelas bagi AI untuk beroperasi, sehingga mengurangi risiko “menghasilkan” informasi yang tidak diinginkan. Perlindungan tambahan dapat diberikan dengan menggunakan alat penyaringan dan menetapkan ambang batas probabilitas untuk hasil yang dapat diterima.

Menerapkan langkah-langkah ini membantu menetapkan jalur aman untuk diikuti AI, sehingga meningkatkan akurasi dan keandalan konten yang dihasilkannya untuk tugas dan domain tertentu.

Fact-checking

Sumber: Ideogram, petunjuk: Marta M. Kania (https://www.linkedin.com/in/martamatyldakania/)

Pengecekan fakta. Bagaimana cara memverifikasi hasil kerja dengan AI?

Terlepas dari tindakan pencegahan yang diambil, sayangnya sejumlah halusinasi oleh sistem AI tidak dapat dihindari. Oleh karena itu, elemen kunci yang menjamin keandalan hasil yang diperoleh adalah pengecekan fakta – proses verifikasi fakta dan data yang dihasilkan oleh AI.

Meninjau keakuratan dan konsistensi hasil AI dengan kenyataan harus dianggap sebagai salah satu perlindungan utama terhadap penyebaran informasi palsu. Verifikasi manusia membantu mengidentifikasi dan memperbaiki halusinasi dan ketidakakuratan yang tidak dapat dideteksi sendiri oleh algoritme.

Dalam praktiknya, pemeriksaan fakta harus menjadi proses siklus, di mana konten yang dihasilkan AI diperiksa secara berkala untuk menemukan kesalahan atau pernyataan yang meragukan. Setelah hal ini teridentifikasi, penting tidak hanya untuk memperbaiki pernyataan yang dihasilkan AI itu sendiri, namun juga memperbarui, melengkapi, atau mengedit data pelatihan model AI untuk mencegah masalah serupa terulang kembali di masa mendatang.

Yang penting, proses verifikasi tidak boleh terbatas pada sekadar menolak atau menyetujui bagian-bagian yang meragukan, namun harus secara aktif melibatkan pakar yang memiliki pengetahuan mendalam di bidangnya. Hanya mereka yang dapat menilai dengan tepat konteks, relevansi, dan keakuratan pernyataan yang dihasilkan AI dan memutuskan kemungkinan koreksi.

Oleh karena itu, pengecekan fakta oleh manusia memberikan “perlindungan” yang diperlukan dan tidak dapat dilebih-lebihkan untuk keandalan konten AI. Hingga algoritme pembelajaran mesin mencapai kesempurnaan, proses yang membosankan namun penting ini harus tetap menjadi bagian integral dalam bekerja dengan solusi AI di industri mana pun.

Bagaimana cara mendapatkan manfaat dari halusinasi AI?

Meskipun halusinasi AI umumnya merupakan fenomena yang tidak diinginkan dan harus diminimalkan, halusinasi AI ternyata dapat diterapkan secara menarik dan berharga di beberapa bidang unik. Memanfaatkan potensi kreatif halusinasi dengan cerdik menawarkan perspektif baru dan seringkali sama sekali tidak terduga.

Seni dan desain adalah bidang di mana halusinasi AI dapat membuka arah kreatif yang sepenuhnya baru. Dengan memanfaatkan kecenderungan model untuk menghasilkan gambar yang nyata dan abstrak, seniman dan desainer dapat bereksperimen dengan bentuk ekspresi baru, sehingga mengaburkan batas antara seni dan kenyataan. Mereka juga dapat menciptakan dunia yang unik dan seperti mimpi – yang sebelumnya tidak dapat diakses oleh persepsi manusia.

Di bidang visualisasi dan analisis data, fenomena halusinasi menawarkan peluang untuk menemukan perspektif alternatif dan korelasi tak terduga dalam kumpulan informasi yang kompleks. Misalnya, kemampuan AI untuk menemukan korelasi yang tidak dapat diprediksi dapat membantu meningkatkan cara lembaga keuangan mengambil keputusan investasi atau mengelola risiko.

Terakhir, dunia permainan komputer dan hiburan virtual juga dapat memperoleh manfaat dari penyimpangan kreatif AI. Pencipta solusi ini dapat menggunakan halusinasi untuk menghasilkan dunia virtual yang benar-benar baru dan menawan. Dengan memasukkan elemen kejutan dan ketidakpastian, mereka dapat memberikan pengalaman mendalam dan tak tertandingi kepada pemain.

Tentu saja, setiap penggunaan sisi “kreatif” dari halusinasi AI ini harus dikontrol dengan hati-hati dan diawasi secara ketat oleh manusia. Jika tidak, kecenderungan untuk menciptakan fiksi dan bukan fakta dapat mengarah pada situasi yang berbahaya atau tidak diinginkan secara sosial. Oleh karena itu, kuncinya adalah dengan terampil mempertimbangkan manfaat dan risiko dari fenomena tersebut, dan menggunakannya secara bertanggung jawab hanya dalam kerangka yang aman dan terstruktur.

Pengecekan fakta dan halusinasi AI – ringkasan

Munculnya fenomena halusinasi dalam sistem AI merupakan efek samping yang tak terhindarkan dari revolusi yang kita saksikan di bidang ini. Distorsi dan informasi palsu yang dihasilkan oleh model AI adalah sisi lain dari kreativitas dan kemampuan mereka yang luar biasa untuk mengasimilasi data dalam jumlah besar.

Untuk saat ini, satu-satunya cara untuk memverifikasi validitas konten yang dihasilkan AI adalah melalui verifikasi manusia. Meskipun ada beberapa metode untuk mengurangi halusinasi, mulai dari teknik dorongan hingga metode kompleks seperti Hutan Kebenaran, belum ada satupun yang dapat memberikan akurasi respons yang memuaskan sehingga menghilangkan kebutuhan akan pengecekan fakta.

Fact-checking

Jika Anda menyukai konten kami, bergabunglah dengan komunitas lebah kami yang sibuk di Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest, TikTok.

Fact-checking and AI hallucinations | AI in business #110 robert whitney avatar 1background

Penulis: Robert Whitney

Pakar JavaScript dan instruktur yang melatih departemen TI. Tujuan utamanya adalah meningkatkan produktivitas tim dengan mengajari orang lain cara bekerja sama secara efektif saat membuat kode.

AI dalam bisnis:

  1. Ancaman dan peluang AI dalam bisnis (bagian 1)
  2. Ancaman dan peluang AI dalam bisnis (bagian 2)
  3. Aplikasi AI dalam bisnis - ikhtisar
  4. Chatbot teks yang dibantu AI
  5. Bisnis NLP hari ini dan besok
  6. Peran AI dalam pengambilan keputusan bisnis
  7. Menjadwalkan posting media sosial. Bagaimana AI dapat membantu?
  8. Postingan media sosial otomatis
  9. Layanan dan produk baru yang beroperasi dengan AI
  10. Apa kelemahan ide bisnis saya? Sesi brainstorming dengan ChatGPT
  11. Menggunakan ChatGPT dalam bisnis
  12. Aktor sintetik. 3 generator video AI teratas
  13. 3 alat desain grafis AI yang berguna. AI generatif dalam bisnis
  14. 3 penulis AI hebat yang harus Anda coba hari ini
  15. Menjelajahi kekuatan AI dalam penciptaan musik
  16. Menavigasi peluang bisnis baru dengan ChatGPT-4
  17. Alat AI untuk manajer
  18. 6 plugin ChatGTP mengagumkan yang akan membuat hidup Anda lebih mudah
  19. 3 grafik AI. Menghasilkan kecerdasan dalam bisnis
  20. Bagaimana masa depan AI menurut McKinsey Global Institute?
  21. Kecerdasan buatan dalam bisnis - Pendahuluan
  22. Apa itu NLP, atau pemrosesan bahasa alami dalam bisnis
  23. Pemrosesan dokumen otomatis
  24. Google Terjemahan vs DeepL. 5 aplikasi terjemahan mesin untuk bisnis
  25. Pengoperasian dan aplikasi bisnis voicebots
  26. Teknologi asisten virtual, atau bagaimana cara berbicara dengan AI?
  27. Apa itu Intelijen Bisnis?
  28. Akankah kecerdasan buatan menggantikan analis bisnis?
  29. Bagaimana kecerdasan buatan dapat membantu mengatasi BPM?
  30. AI dan media sosial – apa pendapat mereka tentang kita?
  31. Kecerdasan buatan dalam manajemen konten
  32. AI kreatif hari ini dan masa depan
  33. AI multimodal dan penerapannya dalam bisnis
  34. Interaksi baru. Bagaimana AI mengubah cara kita mengoperasikan perangkat?
  35. RPA dan API di perusahaan digital
  36. Pasar kerja masa depan dan profesi yang akan datang
  37. AI di EdTech. 3 contoh perusahaan yang memanfaatkan potensi kecerdasan buatan
  38. Kecerdasan buatan dan lingkungan. 3 solusi AI untuk membantu Anda membangun bisnis yang berkelanjutan
  39. Detektor konten AI. Apakah itu layak?
  40. ObrolanGPT vs Bard vs Bing. Chatbot AI manakah yang memimpin persaingan?
  41. Apakah chatbot AI merupakan pesaing pencarian Google?
  42. Perintah ChatGPT yang Efektif untuk SDM dan Rekrutmen
  43. Rekayasa yang cepat. Apa yang dilakukan seorang insinyur yang cepat?
  44. Pembuat AI Mockup. 4 alat teratas
  45. AI dan apa lagi? Tren teknologi teratas untuk bisnis pada tahun 2024
  46. AI dan etika bisnis. Mengapa Anda harus berinvestasi pada solusi etis
  47. Meta AI. Apa yang perlu Anda ketahui tentang fitur-fitur yang didukung AI di Facebook dan Instagram?
  48. Regulasi AI. Apa yang perlu Anda ketahui sebagai seorang wirausaha?
  49. 5 penggunaan baru AI dalam bisnis
  50. Produk dan proyek AI - apa bedanya dengan yang lain?
  51. Otomatisasi proses yang dibantu AI. Mulai dari mana?
  52. Bagaimana Anda mencocokkan solusi AI dengan masalah bisnis?
  53. AI sebagai ahli di tim Anda
  54. Tim AI vs. pembagian peran
  55. Bagaimana cara memilih bidang karir di AI?
  56. Apakah selalu ada gunanya menambahkan kecerdasan buatan ke dalam proses pengembangan produk?
  57. AI dalam SDM: Bagaimana otomatisasi perekrutan memengaruhi pengembangan SDM dan tim
  58. 6 alat AI paling menarik di tahun 2023
  59. 6 kecelakaan bisnis terbesar yang disebabkan oleh AI
  60. Apa analisis kematangan AI perusahaan?
  61. AI untuk personalisasi B2B
  62. Kasus penggunaan ChatGPT. 18 contoh cara meningkatkan bisnis Anda dengan ChatGPT pada tahun 2024
  63. Pembelajaran mikro. Cara cepat untuk mendapatkan keterampilan baru
  64. Implementasi AI paling menarik di perusahaan pada tahun 2024
  65. Apa yang dilakukan pakar kecerdasan buatan?
  66. Tantangan apa saja yang ditimbulkan oleh proyek AI?
  67. 8 alat AI teratas untuk bisnis pada tahun 2024
  68. AI dalam CRM. Apa perubahan AI pada alat CRM?
  69. Undang-undang UE AI. Bagaimana Eropa mengatur penggunaan kecerdasan buatan
  70. Sora. Bagaimana video realistis dari OpenAI akan mengubah bisnis?
  71. 7 pembuat situs web AI teratas
  72. Alat tanpa kode dan inovasi AI
  73. Seberapa besar penggunaan AI meningkatkan produktivitas tim Anda?
  74. Bagaimana cara menggunakan ChatGTP untuk riset pasar?
  75. Bagaimana cara memperluas jangkauan kampanye pemasaran AI Anda?
  76. "Kita semua adalah pengembang". Bagaimana pengembang warga dapat membantu perusahaan Anda?
  77. AI dalam transportasi dan logistik
  78. Masalah bisnis apa yang dapat diperbaiki oleh AI?
  79. Kecerdasan buatan di media
  80. AI di bidang perbankan dan keuangan. Stripe, Monzo, dan Grab
  81. AI di industri perjalanan
  82. Bagaimana AI mendorong lahirnya teknologi baru
  83. Revolusi AI di media sosial
  84. AI dalam e-niaga. Ikhtisar para pemimpin global
  85. 4 alat pembuatan gambar AI teratas
  86. 5 alat AI teratas untuk analisis data
  87. Strategi AI di perusahaan Anda - bagaimana cara membangunnya?
  88. Kursus AI terbaik – 6 rekomendasi luar biasa
  89. Mengoptimalkan pendengaran media sosial dengan alat AI
  90. IoT + AI, atau cara mengurangi biaya energi di perusahaan
  91. AI dalam bidang logistik. 5 alat terbaik
  92. Toko GPT – ikhtisar GPT paling menarik untuk bisnis
  93. LLM, GPT, RAG... Apa arti akronim AI?
  94. Robot AI – bisnis masa depan atau masa kini?
  95. Berapa biaya penerapan AI di perusahaan?
  96. Bagaimana AI dapat membantu karir seorang freelancer?
  97. Mengotomatiskan pekerjaan dan meningkatkan produktivitas. Panduan AI untuk freelancer
  98. AI untuk startup – alat terbaik
  99. Membangun situs web dengan AI
  100. OpenAI, Tengah Perjalanan, Antropik, Wajah Memeluk. Siapa siapa di dunia AI?
  101. Sebelas Labs dan apa lagi? Startup AI paling menjanjikan
  102. Data sintetis dan pentingnya bagi pengembangan bisnis Anda
  103. Mesin pencari AI teratas. Di mana mencari alat AI?
  104. Video AI. Generator video AI terbaru
  105. AI untuk manajer. Bagaimana AI dapat mempermudah pekerjaan Anda
  106. Apa yang baru di Google Gemini? Segala sesuatu yang perlu Anda ketahui
  107. AI di Polandia. Perusahaan, rapat, dan konferensi
  108. kalender AI. Bagaimana cara mengoptimalkan waktu Anda di perusahaan?
  109. AI dan masa depan pekerjaan. Bagaimana mempersiapkan bisnis Anda untuk perubahan?
  110. Kloning suara AI untuk bisnis. Bagaimana cara membuat pesan suara yang dipersonalisasi dengan AI?
  111. Pengecekan fakta dan halusinasi AI