สถานะของการเรียนรู้เชิงลึก: จากมุมมองของนักพัฒนาและ VC

เผยแพร่แล้ว: 2017-09-05

Nikhil Kapur กล่าวถึงสถานะของการเรียนรู้เชิงลึก ครั้งแรกในฐานะนักพัฒนานักศึกษา และตอนนี้เป็น VC

ฉันใช้เวลาหนึ่งวันเสาร์ในการเรียนรู้เชิงลึกและเวิร์กช็อป TensorFlow ที่สำนักงานขนาดใหญ่ระดับ 3 ของ Unilever Foundry และ Padang.co มันเป็นวันที่สนุกที่ได้ดำดิ่งสู่โลกแห่งนักพัฒนาอีกครั้ง และฉันสนุกกับการสนทนาทั้งหมดกับเพื่อนร่วมโต๊ะของฉัน หนึ่งในนั้นทำธุรกิจของครอบครัวและเรียนรู้ ML/deep learning เป็นงานอดิเรก (เขาเป็นคนที่ชอบเขียนโปรแกรม) และอีกคนมาจาก ฝ่ายการตลาดของ Zalora ต้องการใช้ AI ในการทำงานของเธอ

เราเริ่มต้นด้วยการตั้งค่า TensorFlow และ Keras (สิ่งที่เป็นนามธรรมเหนือ TensorFlow) ในเครื่องของเรา จากนั้นจึงเริ่มแก้ไขปัญหาและตัวอย่างการเรียนรู้เชิงลึกทั่วไปบางอย่าง เช่น การใช้ชุดข้อมูล MNIST เริ่มต้นด้วยโมเดล NLP เล็กๆ น้อยๆ สำหรับการจดจำข้อความ เราได้เจาะลึกไปที่ Convolutional Neural Networks ซึ่งกลายเป็นว่าสนุกมากที่จะเล่นด้วย

เราใช้โมเดลที่ได้รับการฝึกฝนล่วงหน้านอกชั้นวาง เช่น Inception V3 แต่กำลังเล่นกับชุดข้อมูลของเราเองและฝึกโมเดลใหม่เพื่อแก้ปัญหาต่างๆ เช่น "นี่แมวหรือสุนัข" เป้าหมายของชั้นเรียนคือการทำความเข้าใจพื้นฐานของการเรียนรู้เชิงลึกและทดลองกับพารามิเตอร์และคุณลักษณะต่างๆ หากคุณรู้สึกอิจฉาในตอนนี้ เราขอแนะนำให้คุณไปเล่นกับ playground.tensorflow.org มันเป็นส่วนที่ง่ายที่สุดของเวิร์กชอป!

Sam Witteveen และ Martin Andrews ขอแสดงความชื่นชมอย่างมากในการจัดงานนี้ ฉันเล่าถึงมุมมองบางส่วนที่ฉันได้รับ และจุดที่ฉันเห็นการเรียนรู้เชิงลึกและ AI ในหัวข้อทั่วไป โดยเฉพาะจากมุมมองของ VC

การเรียนรู้เชิงลึกจากมุมมองของนักพัฒนา

เพื่อให้ทราบความเป็นมา ฉันได้สัมผัสกับ "AI" ในระดับที่พอเหมาะพอดี ในปีที่สองของวิทยาลัย ฉันได้ฝึกงานในสายงานที่ปรึกษาเทคโนโลยีของ Deloitte ร่วมกับเพื่อนของฉัน Ujjwal Dasgupta ซึ่งภายหลังจบลงด้วยการทำปริญญาโทใน ML และตอนนี้อยู่ที่ Google ฉันใช้เวลาสองสามเดือนในการสร้างกระบวนการ ETL (Extract-Transform-Load) ที่ได้รับการปรับปรุงบน IBM Datastage ซึ่งเป็นซอฟต์แวร์ Data Warehousing ในเวลานั้น Ujjwal ผู้ซึ่งมองไปข้างหน้ามากกว่าฉันเสมอ แนะนำให้ฉันรู้จักการทำเหมืองข้อมูล และฉันเริ่มติดตามการบรรยายและหลักสูตรออนไลน์ของ Andrew Ng

ฤดูร้อนหน้าเมื่อฉันได้ใช้เวลากับเรื่องนี้แล้ว ฉันอยากจะดำดิ่งลึกลงไปใน ML ฉันโชคดีที่ได้รับมอบหมายให้ทำงานในโครงการที่ Mozilla เพื่อปรับปรุงประสิทธิภาพของ Firefox โดยใช้คอมไพเลอร์ที่ใช้การเรียนรู้ของเครื่อง - Milespot GCC เมื่อใช้คอมไพเลอร์ ML นี้ ฉันสามารถคอมไพล์โค้ดของ Mozilla Firefox เพื่อให้เวลาในการโหลดโปรแกรมดีขึ้นประมาณ 10%

และสำหรับวิทยานิพนธ์สุดท้ายของฉัน ไม่มีทางที่ฉันจะเลิกเรียน ML ได้ ฉันร่วมมือกับ DFKI สถาบันปัญญาประดิษฐ์แห่งเยอรมนีเพื่อทำงานในโครงการที่ท้าทายอย่างยิ่ง โดยใช้เว็บแคมธรรมดาสำหรับการติดตามดวงตา ทีมที่ DFKI ใช้สิ่งนี้สำหรับแอปพลิเคชันเฉพาะ Text 2.0 พวกเขาใช้กล้อง HD พิเศษเพื่อติดตามดวงตาของคุณและเสริมข้อความด้วยคุณสมบัติสุดเจ๋ง เช่น การเลื่อนอัตโนมัติ การแปลอัตโนมัติ พจนานุกรมป๊อปอัป ฯลฯ

เราตัดสินใจทำเช่นเดียวกันกับเว็บแคมธรรมดาๆ เพราะไม่มีใครในอินเดียมีเงินซื้อกล้อง HD พิเศษนั้น เพื่อความชัดเจน เราล้มเหลวในเรื่องนี้ โดยบรรลุความแม่นยำเพียง 70% ในการติดตามของเรา แต่มันเป็นหนึ่งในโครงการที่น่าตื่นเต้นที่สุดที่ฉันเคยทำ

แนะนำสำหรับคุณ:

Metaverse จะพลิกโฉมอุตสาหกรรมยานยนต์อินเดียได้อย่างไร

Metaverse จะพลิกโฉมอุตสาหกรรมยานยนต์อินเดียได้อย่างไร

บทบัญญัติต่อต้านการแสวงหากำไรสำหรับสตาร์ทอัพในอินเดียมีความหมายอย่างไร?

บทบัญญัติต่อต้านการแสวงหากำไรสำหรับสตาร์ทอัพในอินเดียมีความหมายอย่างไร?

วิธีที่ Edtech Startups ช่วยเพิ่มทักษะและทำให้พนักงานพร้อมสำหรับอนาคต

Edtech Startups ช่วยให้แรงงานอินเดียเพิ่มพูนทักษะและเตรียมพร้อมสู่อนาคตได้อย่างไร...

หุ้นเทคโนโลยียุคใหม่ในสัปดาห์นี้: ปัญหาของ Zomato ยังคงดำเนินต่อไป, EaseMyTrip Posts Stro...

สตาร์ทอัพอินเดียใช้ทางลัดในการไล่ล่าหาทุน

สตาร์ทอัพอินเดียใช้ทางลัดในการไล่ล่าหาทุน

Logicserve Digital สตาร์ทอัพด้านการตลาดดิจิทัลรายงานว่าได้ระดมทุน INR 80 Cr จากบริษัทจัดการสินทรัพย์อื่น Florintree Advisors

แพลตฟอร์มการตลาดดิจิทัล Logicserve ระดมทุน INR 80 Cr รีแบรนด์เป็น LS Dig...

ทำไมฉันถึงเบื่อคุณกับรายละเอียดของเรื่องนี้? ส่วนใหญ่เพื่อให้คุณทราบประวัติเล็กน้อยว่า AI อยู่ที่ไหนเมื่อฉันกำลังบดขยี้วิศวกรรมของฉัน แม้กระทั่งเมื่อหลายสิบปีก่อน การเรียนรู้เชิงลึกและ ML ก็มีอยู่แล้ว แต่ในช่วง 10 ปีที่ผ่านมาเท่านั้นที่วงการนี้จะได้เห็นการมาถึง สิ่งที่เปลี่ยนแปลงไปอย่างแน่นอนในไม่กี่ปีที่ผ่านมา?

ประการหนึ่ง กฎของมัวร์นำเราไปสู่จุดที่ต้นทุนการจัดเก็บและการประมวลผลต่ำลงสำหรับคนที่ติดตั้ง ML ที่บ้านของพวกเขา ตอนนี้คุณสามารถเรียกใช้โมเดลพื้นฐานเกือบทั้งหมดบนเครื่องของคุณเองได้ และหากคุณซื้อ GPU ที่ดี (ซึ่งไม่แพงขนาดนั้นอีกต่อไป) ก็จะสามารถเพิ่มประสิทธิภาพเวลาในการประมวลผลของคุณเกือบ 10 เท่าเพื่อให้สามารถเรียกใช้โมเดลที่ซับซ้อนได้

นิตยสารแบบมีสายมีส่วนสำคัญในการเปลี่ยนแปลงนี้

นิตยสารแบบมีสาย-การเรียนรู้เชิงลึก

จำนวนทรานซิสเตอร์ในชิปตลอดทั้งปี (โปรดทราบว่าแกน Y เป็นมาตราส่วนบันทึก!) ที่มา: Assured-Systems

cb Insights-การเรียนรู้เชิงลึก

อีกสิ่งหนึ่งที่เปลี่ยนแปลงไปคือธุรกิจต่างๆ ได้ตระหนักถึงความจำเป็นในการทำให้เป็นระบบอัตโนมัติ ด้วยเหตุนี้ ในขณะที่กิจกรรม M&A ในภาคสนามเพิ่มขึ้นอย่างมาก VCs ได้ทุ่มเงินเข้าสู่ภาคสนามในช่วง 5 ปีที่ผ่านมา

มุมมองของนักลงทุนเกี่ยวกับการเรียนรู้เชิงลึก

ตอนนี้เรายืนอยู่ตรงไหน และนักลงทุนหรือบริษัทสตาร์ทอัพควรมอง AI ที่ฉวัดเฉวียนนี้อย่างไร? อย่างที่ผมเห็น มีปัจจัยสำคัญสี่ประการในการเริ่มต้น AI ซึ่งทั้งหมดนี้จำเป็นต้องมารวมกันเพื่อสร้างบริษัทที่แข็งแกร่ง

  • ความ สามารถ: ทุกอย่างเริ่มต้นที่นี่ ในขณะที่สตาร์ทอัพ เห็นได้ชัดว่าทีมเป็นส่วนที่สำคัญที่สุด ในสตาร์ทอัพ AI มันคือกลไกที่แท้จริงของบริษัท การเข้าถึงวิทยาการข้อมูลที่แข็งแกร่งและความสามารถด้านวิศวกรรมคอมพิวเตอร์เพื่อปรับแต่งโมเดลที่สร้างไว้ล่วงหน้าเหล่านั้นจะเป็นกุญแจสำคัญสำหรับสตาร์ทอัพ AI และนี่คือเหตุผลที่สตาร์ทอัพในสหรัฐฯ และจีนมีแนวโน้มที่จะเป็นผู้นำในภูมิภาคอื่นๆ สิงคโปร์มีความสามารถด้านวิทยาศาสตร์ข้อมูลเพียงเล็กน้อย และน่าจะเป็นสถานที่ที่ดีในการจัดตั้งบริษัท AI ของคุณ ที่กล่าวว่าพรสวรรค์ที่ดีที่สุดมักจะจบลงที่ยักษ์ใหญ่ด้านเทคโนโลยีทั้งแบบอินทรีย์และแบบอนินทรีย์ การเข้าซื้อกิจการ DeepMind ของ Google นั้นเป็นการเล่นเพื่อให้ได้มาซึ่งความคิดที่ดีที่สุดในการเรียนรู้เชิงลึก
  • ข้อมูล: หากทีมคือเครื่องยนต์ ข้อมูลก็คือน้ำมันในการสตาร์ทอัพของ AI หากไม่มีข้อมูลที่สะอาดและมีโครงสร้างจำนวนมาก คุณไม่น่าจะได้รับความแม่นยำจากระบบที่ผ่านการฝึกอบรมของคุณซึ่งขัดขวางแอปพลิเคชันทางธุรกิจ เนื่องจากการพึ่งพาหลักของความสามารถในการคาดการณ์ของแบบจำลองกับข้อมูลที่ป้อนเข้าไป บริษัทขนาดใหญ่จึงมีแนวโน้มที่จะมีข้อได้เปรียบที่สำคัญกว่าบริษัทสตาร์ทอัพขนาดเล็กในการสร้างระบบที่ดีและแม่นยำยิ่งขึ้น นี่เป็นความคิดที่น่าหนักใจและวิธีเดียวที่จะทำลายแม่พิมพ์คือการสร้างและใช้ประโยชน์จากข้อมูลที่เป็นกรรมสิทธิ์ของคุณเอง ระบบบันทึกเช่น Salesforce จะมีความสำคัญอย่างมากในด้านนี้
  • โมเดล: ยักษ์ใหญ่ด้านเทคโนโลยีรายใหญ่ทั้งหมดกำลังเปิดตัวระบบ AI ของตนเอง (แพลตฟอร์มสำหรับนักพัฒนา ไลบรารี โมเดลที่ผ่านการฝึกอบรม) เพื่อสร้างแพลตฟอร์มสำหรับการพัฒนา AI ในอนาคต ยังไม่เป็นที่แน่ชัดว่าใครจะเป็นผู้ชนะในสงคราม แต่ความจำเป็นในการสร้างแบบจำลองตั้งแต่เริ่มต้นไม่ช้าก็เร็วจะสิ้นสุดลง เฉพาะสำหรับระบบที่ซับซ้อนจริงๆ เท่านั้นที่จำเป็นต้องเริ่มสร้างแบบจำลองของคุณจากพื้นฐาน แต่ในกรณีส่วนใหญ่ นักวิทยาศาสตร์ด้านข้อมูลของคุณจะสามารถนำแบบจำลองนอกชั้นวางมาใช้ซ้ำ และฝึกแบบจำลองใหม่โดยใช้ข้อมูลของตัวเอง คุณรู้ได้อย่างไรว่าคุณมาถึงโมเดลที่ดีที่สุดแล้ว? Numerai ซึ่งได้รับการสนับสนุนจาก Union Square Ventures กำลังแก้ไขปัญหานี้อย่างชาญฉลาด โดยการระดมมวลชนให้กับผู้เชี่ยวชาญ ML และจูงใจให้พวกเขาสร้างแบบจำลองที่ดีขึ้น
  • ปัญหาทางธุรกิจ: นี่คือสิ่งที่น่าสนใจ ประการแรก ผู้ใช้ไม่สนใจว่าระบบของคุณเป็นแบบอัตโนมัติหรือไม่ ระบบ AI มีไว้เพื่อเพิ่มประสิทธิภาพองค์กรของคุณเอง และให้เครื่องทำงานเหมือนมนุษย์ ไม่ได้สร้างความประทับใจให้ผู้ใช้ ดังนั้น การแก้ปัญหาทางธุรกิจโดยเฉพาะจึงเป็นกุญแจสำคัญในการมอบประสบการณ์การใช้งานที่ดีแก่ผู้ใช้และด้วยเหตุนี้จึงเพิ่มความเหนียว

ประการที่สอง ยักษ์ใหญ่ด้านเทคโนโลยีส่วนใหญ่จะจำกัดตัวเองให้สร้างแพลตฟอร์มที่กว้างและทั่วถึง ในขณะที่บริษัทเทคโนโลยีเช่น Salesforce, Hubspot และอื่น ๆ กำลังกระโดดเข้าสู่ AI แต่มีแนวโน้มว่าจะเป็นเส้นทางการเข้าซื้อกิจการ Salesforce ได้ประกาศ Einstein แล้ว (แม้ว่าจะยังไม่ได้ปฏิบัติตามคำประกาศอย่างถูกต้อง) และ Hubspot กำลังเขียนเกี่ยวกับ AI ทุกสัปดาห์ในบล็อก มันแสดงให้เห็นเพียงว่าพวกเขาสนใจในสนามมากเพียงใด แต่ยังแสดงให้เห็นว่าพวกเขากำหนดเป้าหมายปัญหาเฉพาะได้ยากเพียงใด นี่คือช่องว่างที่สตาร์ทอัพสามารถใช้ประโยชน์ได้ และบริษัทพอร์ตโฟลิโอ Saleswhal ของเรากำลังดำเนินการตามเส้นทางนี้

ในสายตาของฉัน หากการเริ่มต้นแก้ปัญหาด้วยระบบอัตโนมัติซึ่งเป็นปัญหาที่ตรงเป้าหมายมาก ซึ่งส่งผลกระทบต่อผู้คนจำนวนมากพอที่ใช้ข้อมูลที่เป็นกรรมสิทธิ์ซึ่งระบบรวบรวมไว้ระหว่างทาง ก็มีแนวโน้มว่าจะเป็นธุรกิจที่ทำกำไรได้มากและมีอุปสรรคในการเข้ามาอย่างมาก อย่างไรก็ตาม เท่าที่ฉันเห็น นี่ไม่น่าจะใช่โอกาสขนาดยูนิคอร์นในภูมิภาคนี้ ไม่ใช่ในขณะที่ยักษ์ใหญ่ด้านเทคโนโลยียังมีชีวิตอยู่


[โพสต์นี้โดย Nikhil Kapur ปรากฏตัวครั้งแรกบนสื่อและทำซ้ำโดยได้รับอนุญาต]