คุณจะเริ่มต้นใช้งานแมชชีนเลิร์นนิงในด้านการตลาดได้อย่างไร
เผยแพร่แล้ว: 2021-06-20กุญแจสำคัญเบื้องหลังอัลกอริธึม ML ที่ดีทั้งหมดคือข้อมูลที่ดีและดึงข้อมูลนี้จากฐานข้อมูลเชิงสัมพันธ์เช่นเดียวกับที่บริษัทของคุณอาจใช้อยู่มากที่สุด คุณจะต้องมีความรู้เกี่ยวกับ SQL
การวิเคราะห์การตลาดในบริษัทส่วนใหญ่ยังคงจำกัดเฉพาะการสร้างรายงานใน Google ชีต และใช้การคาดการณ์อนุกรมเวลาอย่างง่าย (หรือการคาดเดา) เพื่อขายโครงการ
ในขณะที่บางบริษัทกำลังมีความซับซ้อนอย่างมากในการจัดการข้อมูลขนาดใหญ่ดังกล่าวและรวมเข้ากับกลุ่มลูกค้าและผู้ใช้ในตลาดที่ดีขึ้น
ทุก ๆ ครั้งเราทุกคนได้ยินว่าแมชชีนเลิร์นนิงจะเข้ามาแทนที่งานทางโลกของเราอย่างไรและ AI จะเป็นอย่างไรในอนาคต แต่ในปัจจุบัน Machine Learning และ Algorithm นั้นไม่ใช่เรื่องของอนาคต สิ่งเหล่านี้มีอยู่ทุกที่ ตั้งแต่การค้นหาโดย Google ไปจนถึงคำแนะนำ Netflix ของคุณ
ในขณะที่เริ่มมีอาการ คุณอาจไม่สามารถรับรู้ถึงความฉลาดที่ซ่อนอยู่ในระบบรอบตัวคุณ แต่ระบบเหล่านี้ได้รับการออกแบบมาเพื่อให้คุณได้รับประสบการณ์ที่ราบรื่นจนรู้สึกเหมือนเป็น "เวทมนตร์"
แมชชีนเลิร์นนิงเป็นส่วนย่อยของปัญญาประดิษฐ์ และเราจะพูดถึงเฉพาะแมชชีนเลิร์นนิงเท่านั้นในตอนนี้
แมชชีนเลิร์นนิงใช้คอมพิวเตอร์เพื่อทำความเข้าใจข้อมูลที่ซับซ้อนและมีขนาดใหญ่ ซึ่งเราในฐานะมนุษย์อาจเข้าใจยาก
วันนี้เมื่อเรานึกถึงการตลาด เราอดไม่ได้ที่จะนึกถึง “Digital Marketing” ด้วยการประดิษฐ์คำนำหน้านี้ จึงมีข้อมูลดิจิทัลจำนวนมาก ข้อมูลเกี่ยวกับวิธีที่เราได้รับลูกค้าจากข้อมูลพฤติกรรมผู้ใช้ในผลิตภัณฑ์ของเรา
ในขณะที่บางบริษัทกำลังมีความซับซ้อนอย่างมากในการจัดการข้อมูลขนาดใหญ่ดังกล่าวและรวมเข้ากับกลุ่มลูกค้าและผู้ใช้ในตลาดที่ดีขึ้น
การวิเคราะห์การตลาดในบริษัทส่วนใหญ่ยังคงจำกัดเฉพาะการสร้างรายงานใน Google ชีต และใช้การคาดการณ์อนุกรมเวลาอย่างง่าย (หรือการคาดเดา) กับการขายโครงการ
แม้ว่าผู้บริหารระดับสูงด้านการตลาดส่วนใหญ่จะรู้ว่าการเรียนรู้ด้วยเครื่องอาจมีประโยชน์ในด้านการตลาด แต่มีเพียงไม่กี่คนที่รู้อย่างแน่นอน และหากไม่รู้จริงๆ ว่าคุณจะให้ Data Scientist ในบริษัทช่วยคุณได้อย่างไร
ไม่ต้องกังวล ในบทความนี้ ฉันจะให้กรอบการทำงานแก่คุณในการเริ่มต้นเส้นทางการเป็นนักวิทยาศาสตร์การตลาด และใช้การเรียนรู้ของเครื่องเพื่อส่งเสริมกิจกรรมทางการตลาดของคุณ
เริ่มต้นอย่างไร
- เรียนรู้ SQL พื้นฐาน: กุญแจสำคัญเบื้องหลังอัลกอริธึม ML ที่ดีทั้งหมดคือข้อมูลที่ดีและดึงข้อมูลนี้จากฐานข้อมูลเชิงสัมพันธ์เช่นเดียวกับที่บริษัทของคุณอาจใช้อยู่มากที่สุด คุณจะต้องมีความรู้เกี่ยวกับ SQL เพียงทำความคุ้นเคยกับไวยากรณ์พื้นฐาน เพื่อให้คุณสามารถดึงข้อมูลที่เกี่ยวข้องและเก็บไว้ใน CSV
- เรียนรู้ Python: เมื่อพูดถึงปัญญาประดิษฐ์หรือแมชชีนเลิร์นนิงหรืออะไรก็ตามที่เกี่ยวข้องกับหัวข้อเหล่านี้จากระยะไกล Python เป็นภาษามาตรฐานระดับโกลด์สำหรับมัน ขอบเขตของทรัพยากรและความช่วยเหลือนั้นไร้ขีดจำกัด และเมื่อคุณเริ่มต้น คุณควรเขียนโค้ดในเวลาไม่นาน
ทำความคุ้นเคยกับ Python พื้นฐานและแพ็คเกจต่างๆ เช่น pandas และ numpy เรียนรู้วิธีล้างข้อมูลและประมวลผลล่วงหน้าสำหรับโมเดล ML ซึ่งอาจเกี่ยวข้องกับการจัดการค่า Null การจัดโครงสร้างข้อมูลให้ดี และการเลือกคุณลักษณะบางส่วนและวิศวกรรมคุณลักษณะ
เมื่อคุณจัดการและล้างข้อมูลเสร็จแล้ว และเลือกคุณสมบัติที่เหมาะสมทั้งหมดเพื่อสร้างแบบจำลอง คุณจะแบ่งข้อมูลของคุณออกเป็นชุด "ทดสอบ" และ "ฝึกอบรม" ชุดรถไฟช่วยให้แบบจำลองของคุณเรียนรู้ในขณะที่ชุดทดสอบช่วยทดสอบความแม่นยำของแบบจำลองของคุณ
แนะนำสำหรับคุณ:
Machine Learning มี 2 สาขาหลักที่คุณสามารถใช้งานได้
- การเรียนรู้ของเครื่องภายใต้การดูแล: ตามชื่อที่แนะนำโมเดลการเรียนรู้ของเครื่องประเภทนี้จะใช้เมื่อเราสอนอัลกอริทึมด้วยข้อมูลที่ติดป้ายกำกับเพื่อคาดการณ์ผลลัพธ์หรือจัดประเภทข้อมูลเป็นหมวดหมู่
เช่น; คุณสามารถใช้อัลกอริธึมการเรียนรู้ของเครื่องภายใต้การดูแลเพื่อคาดการณ์งบประมาณการตลาดที่จำเป็นโดยพิจารณาจากปัจจัยต่างๆ เช่น การใช้จ่ายในช่วงเวลาที่ผ่านมา เป้าหมายการขาย ฯลฯ
- Unsupervised Machine Learning: แม้ว่าแมชชีนเลิร์นนิงภายใต้การดูแลต้องการให้คุณฝึกอัลกอริทึมด้วยข้อมูลที่ติดป้ายกำกับ แต่อัลกอริธึมแมชชีนเลิร์นนิงที่ไม่ได้รับการดูแลจะค้นพบรูปแบบที่ซ่อนอยู่ในข้อมูลโดยไม่มีการแทรกแซงจากมนุษย์
เช่น แมชชีนเลิร์นนิงโดยไม่ได้รับการดูแลจะเป็นประโยชน์ต่อกลุ่มลูกค้าที่มีคุณลักษณะบางอย่างสำหรับลูกค้าเหล่านั้น
ข้อควรระวัง: ไม่ว่าการเรียนรู้แบบ unsupervised จะฟังดูหรูหราเพียงใด โดยทั่วไปแล้วเป็นเรื่องยากมากที่จะอธิบายการทำงานของรูปแบบการเรียนรู้แบบ unsupervised แก่ผู้มีส่วนได้ส่วนเสียทางธุรกิจ จะดีกว่าถ้าใช้ Supervised Machine Learning อย่างน้อยก็ในตอนเริ่มต้น
หมวดหมู่ของอัลกอริทึมในการเรียนรู้ของเครื่องภายใต้การดูแล
มีอัลกอริธึม 2 ประเภทใน Supervised Machine Learning;
1. การจัดประเภท : การจัดประเภทจะช่วยให้คุณคาดการณ์ป้ายกำกับได้ เช่น การแบ่งกลุ่มลูกค้าตามตัวแปรตามอื่นๆ เช่น รายได้ ความถี่ในการซื้อ ความใหม่ในการซื้อสินค้า เวลาที่ใช้บนเว็บไซต์ เป็นต้น
โมเดลการจำแนกประเภทยอดนิยม: Logistic Regression (ในขณะที่ชื่อบ่งบอกว่าเป็นการถดถอย แต่จริงๆ แล้วใช้สำหรับปัญหาการจำแนกประเภท), Stochastic Gradient Descent, K-Nearest Neighbours ต้นไม้การตัดสินใจ ป่าสุ่ม. สนับสนุนเครื่องเวกเตอร์
- การถดถอย : ปัญหาการถดถอยช่วยในการทำนายปริมาณของตัวแปร เช่น; ยอดขายในเดือนหน้า
แบบจำลองการถดถอยยอดนิยม: การถดถอยเชิงเส้น การถดถอยริดจ์ การถดถอยของ Lasso การถดถอยของ ElasticNet
เมื่อคุณทราบแล้วว่าปัญหาที่คุณกำลังพยายามแก้ไขคือหนึ่งในการจัดประเภทหรือการถดถอย การเลือกรุ่นจะขึ้นอยู่กับกรณีการใช้งานของคุณเป็นอย่างมาก มีเมตริกที่คุณต้องการเพิ่มประสิทธิภาพ (เช่น ค่าคลาดเคลื่อนกำลังสองเฉลี่ย) เพื่อเลือกรูปแบบที่ดีที่สุดสำหรับกรณีการใช้งานของคุณ
เริ่มต้นด้วยปัญหา:
บางสิ่งบางอย่างถ้าเรียนรู้และไม่ได้นำไปใช้จะถูกลืมในบางเวลา ดังนั้นจึงแนะนำให้คำนึงถึงกรณีการใช้งานในขณะที่คุณทำความคุ้นเคยกับโลกของการเรียนรู้ของเครื่อง สิ่งนี้จะไม่เพียงแต่ทำให้คุณสนใจในการเรียนรู้โมเดลใหม่ๆ เท่านั้น แต่คุณยังสามารถแสดงทักษะที่เรียนรู้ใหม่ได้อีกด้วย
ในขณะที่คุณคืบหน้า คุณควรเริ่มต้นด้วยปัญหาที่ต้องแก้ไข นี่อาจเป็นอะไรก็ได้ตั้งแต่การพยายามแบ่งกลุ่มผู้ใช้ของคุณด้วยการจัดกลุ่ม KMeans ไปจนถึงการคาดการณ์ยอดขายด้วยการถดถอยเชิงเส้น ไปจนถึงการทำนายการปั่นป่วนด้วยตัวแยกประเภท KNN
เมื่อคุณได้เรียนรู้เพียงพอที่จะปรับใช้โมเดลที่พร้อมสำหรับการผลิตแล้ว คุณสามารถลองใช้โมเดลอื่นๆ และปรับแต่งคุณลักษณะเพื่อเพิ่มความแม่นยำของโมเดลของคุณ ความแม่นยำของแบบจำลองของคุณอาจเปลี่ยนแปลงไปตามกาลเวลา ดังนั้นจึงแนะนำให้กลับไปดูแบบจำลองของคุณอีกครั้งในภายหลังเช่นกัน
คำแนะนำอย่างมืออาชีพ: มีโมเดลใน Python เช่น SARIMAX ที่ไม่อยู่ภายใต้การเรียนรู้ของเครื่องแต่เป็นโมเดลที่มีประโยชน์มากสำหรับการพยากรณ์อนุกรมเวลา อย่าจำกัดตัวเองให้อยู่กับ Machine Learning มีโมเดลอื่นๆ ที่จะเป็นประโยชน์เมื่อคุณเรียนรู้ Python
และโปรดจำไว้ว่า โมเดลการเรียนรู้ของเครื่องทั้งหมดนั้นดีพอ ๆ กับข้อมูลที่คุณป้อนในการฝึกอบรม แบบจำลองในการทำนายตัวบ่งชี้ที่ดีที่สุดสำหรับการจัดอันดับ SERP ของคุณจะพิจารณาจากความครบถ้วนสมบูรณ์และสมเหตุสมผลของรายการคุณสมบัติของคุณ ความรู้เกี่ยวกับโดเมนมีความสำคัญมากในขณะที่คุณสร้างโมเดลการเรียนรู้ของเครื่อง