10 Tren Yang Harus Diikuti Dalam Ilmu Data Pada Tahun 2020

Diterbitkan: 2020-08-22

Banyak peneliti di berbagai universitas menggandakan penelitian NLP

Salah satu showstoppers terbesar untuk proyek ilmu data apa pun adalah kurangnya data pelatihan yang relevan

2020 dan beberapa tahun ke depan akan sangat menarik bagi bisnis dan tim yang mengadopsi ilmu data

Kecerdasan Buatan adalah topik hangat hari ini, dan sementara ada beberapa kelompok yang mengklaim bahwa musim dingin yang lain mungkin akan datang, populasi yang lebih besar (termasuk saya sendiri) sangat merasa bahwa kali ini, musim panas telah tiba dan itu akan menjadi satu pesta besar. Bahkan, dengan kemajuan perangkat keras dan perangkat lunak, mungkin tidak akan ada musim dingin untuk waktu yang lama. Di bawah ini adalah 10 tren teratas yang saya sukai di tahun 2020.

Komputasi Kuantum

Menjelang akhir 2019, pengumuman Google tentang kekuatan komputasi kuantum, yang mengungguli superkomputer standar dengan faktor lebih dari satu miliar, menyebabkan gelombang di media. Meskipun mungkin tidak ada penggunaan langsung untuk itu dalam aplikasi dunia nyata saat ini, ada fokus luas pada komputasi kuantum di laboratorium penelitian di perusahaan seperti Google dan IBM. Oleh karena itu, pada tahun 2020 dan seterusnya, kami yakin akan membuat lompatan definitif dalam komputasi kuantum, dan segera, ini mungkin menjadi layak untuk aplikasi praktis.

Kemajuan Dalam Pemrosesan Bahasa Alami (NLP)

Pemrosesan bahasa alami (NLP) telah menjadi fokus penting untuk sementara waktu, dan dengan masuknya transformer dan model perhatian baru-baru ini, segala sesuatunya bergerak maju dengan kecepatan penuh. Beberapa bulan yang lalu, OpenAI Elon Musk merilis model GPT-3. Model ini didasarkan pada model arsitektur transformator, yang dilatih hingga parameter 175B. Ini mengubah segalanya. Model mencapai SOTA pada berbagai tugas model bahasa dan terus melakukannya pada banyak tugas pribadi.

Banyak peneliti di berbagai universitas menggandakan penelitian NLP. Dari representasi kata kontekstual yang lebih baru hingga pemodelan urutan-ke-urutan, sejumlah besar sumber daya dikhususkan untuk NLP dan memungkinkan mesin untuk memahami dan merespons bahasa, seperti halnya manusia.

Repositori Data Dan Pasar

Salah satu showstoppers terbesar untuk setiap proyek ilmu data adalah kurangnya data pelatihan yang relevan. Banyak tim akhirnya menghabiskan hingga 80% dari waktu mereka untuk mengumpulkan data pelatihan yang tepat. Selama setahun terakhir, banyak tim independen, proyek sumber terbuka, dan proyek yang didanai publik telah membuka akses ke banyak kumpulan data terstruktur. Organisasi juga masuk ke bisnis memonetisasi data yang mereka akses atau berfungsi sebagai agregator data yang mengumpulkan, menormalkan, dan menyusun data dalam format yang dapat digunakan oleh tim ilmu data lainnya. Lini bisnis baru ini akan menyaksikan tren yang meningkat di tahun-tahun mendatang.

Anotasi Sebagai Bisnis

Sementara pengumpulan dan agregasi data terjadi di jalur paralel, bagian penting, yang melibatkan mendapatkan data yang sama ditandai, diberi anotasi, dan siap untuk pelatihan, juga meningkat pesat. Alat dan layanan seperti mechanical turk—yang memungkinkan crowdsourcing anotasi—sudah ada, tetapi sekarang ada kesadaran yang berkembang bahwa ini sebenarnya bisa menjadi bisnis yang layak. Banyak negara berkembang, terutama yang beroperasi di ekonomi tenaga kerja yang lebih murah, sedang mengembangkan bisnis seputar penandaan data dengan tim besar yang terdiri dari orang-orang yang memilih, menandai, dan melabeli data input dan membuatnya siap untuk dikonsumsi.

Realitas Tertambah (AR)

Sejak peluncuran aplikasi Google Glass dan Microsoft HoloLens, termasuk yang lain dalam beberapa tahun terakhir, ada kemajuan signifikan yang dibuat dalam AR. Tahun ini, kami melihat paten dan pengumuman dari berbagai perusahaan di kacamata AR, yang akan memungkinkan orang untuk berinteraksi dan bekerja di lingkungan simulasi dunia nyata. Kacamata pintar tahun 2021 akan mengubah cara dunia bekerja dan berkomunikasi.

Direkomendasikan untukmu:

Bagaimana Kerangka Agregator Akun RBI Ditetapkan Untuk Mengubah Fintech Di India

Bagaimana Kerangka Kerja Agregator Akun RBI Ditetapkan Untuk Mengubah Fintech Di India

Pengusaha Tidak Dapat Menciptakan Startup yang Berkelanjutan dan Terukur Melalui 'Jugaad': CEO CitiusTech

Pengusaha Tidak Dapat Menciptakan Startup yang Berkelanjutan dan Skalabel Melalui 'Jugaad': Cit...

Bagaimana Metaverse Akan Mengubah Industri Otomotif India

Bagaimana Metaverse Akan Mengubah Industri Otomotif India

Apa Arti Ketentuan Anti-Profiteering Bagi Startup India?

Apa Arti Ketentuan Anti-Profiteering Bagi Startup India?

Bagaimana Startup Edtech Membantu Meningkatkan Keterampilan & Mempersiapkan Tenaga Kerja untuk Masa Depan

Bagaimana Startup Edtech Membantu Tenaga Kerja India Meningkatkan Keterampilan & Menjadi Siap Masa Depan...

Saham Teknologi Zaman Baru Minggu Ini: Masalah Zomato Berlanjut, EaseMyTrip Posting Stro...

Analisis Data Sebagai Layanan

Menganalisis data dalam skala besar memerlukan pengaturan perangkat lunak dan perangkat keras yang baik. Seseorang harus menyiapkan kluster pembelajaran mesin, menginstal perangkat lunak yang diperlukan—bahkan yang ' plug and play'—dan mengeluarkan biaya awal yang besar sebelum kumpulan data pertama dapat dianalisis. Namun, ada banyak SaaS dan solusi swalayan yang tersedia di mana seseorang dapat memulai dengan uang receh. Selain itu, dengan alat dan teknik seperti AutoML yang tersedia di hampir semua penyedia, analitik data canggih kini tersedia untuk siapa saja.

Penjelasan AI

Model AI, terutama yang berhubungan dengan dimensi data dan data turunan yang lebih besar yang dikumpulkan dari berbagai titik kontak, sebagian besar adalah model kotak hitam pembelajaran mendalam. Data masuk dan keputusan (output) keluar. Ada sangat sedikit alasan di balik mengapa keputusan tertentu dibuat. Saat kita bergerak ke masa depan di mana AI digunakan dalam aplikasi seperti diagnosis medis, kendaraan self-driving, perdagangan otomatis, dan bahkan dalam perekrutan dan fungsi pengambilan keputusan lainnya, menjadi penting untuk memastikan transparansi dan visibilitas tentang mengapa mesin tertentu -model yang dipelajari mencapai keputusan tertentu. Ada banyak alat dan kerangka kerja sumber terbuka yang telah memberikan hasil awal yang baik dalam interpretasi model AI.

AI yang Bertanggung Jawab Dan Etis

Jika mobil self-driving dihadapkan pada dua pilihan, yang keduanya mengakibatkan kerugian bagi manusia, keputusan mana yang harus diambil oleh model tersebut? Haruskah itu didasarkan pada data ATAU haruskah ada aturan penggantian?

Jika kemajuan AI yang sangat baru telah dibuat, apakah boleh digunakan dalam aplikasi militer yang pada akhirnya akan digunakan dalam peperangan?

Ini adalah beberapa pertanyaan, bersama dengan bias, perlindungan data, diskriminasi, dll., yang coba ditangani oleh AI yang bertanggung jawab dan etis. Ada gerakan besar seputar penggunaan etis AI, dan banyak perusahaan menciptakan gugus tugas dan koalisi khusus yang menangani hal ini.

Data Warehousing Dan Platform Manajemen Data

Pergudangan telah ada sejak lama, dan telah menjadi langkah utama bagi organisasi untuk mengumpulkan dan menyusun data sedemikian rupa sehingga mulai masuk akal. Beberapa tahun terakhir telah terlihat munculnya banyak layanan dan platform pergudangan yang dapat digunakan oleh tim teknik data untuk memulai perjalanan pergudangan data dan data mereka.

Ilmu Data Sebagai Kompetensi Dasar Bagi Organisasi

Bertahun-tahun yang lalu, analisis statistik dan data besar dipandang sebagai keterampilan "ahli" yang dikembangkan untuk tim analitik, tetapi ini berubah beberapa tahun yang lalu. Saat ini, banyak tim bisnis lebih suka anggota tim mereka menggunakan alat analitik untuk menganalisis data.

Demikian pula, saat ini, ada gerakan di mana keterampilan ilmu data sedang dibangun dalam tim bisnis. Tim bisnis sedang mempelajari cara mengelola proyek, ekspektasi, dan jadwal ilmu data, serta bagaimana keterampilan dan manajemen tim berbeda dari tim pengembangan perangkat lunak tradisional.

Singkatnya, 2020 dan beberapa tahun ke depan akan sangat menarik bagi bisnis dan tim yang mengadopsi ilmu data dan bidang kerja terkait.