AI สร้างสรรค์ของวันนี้และพรุ่งนี้ | AI ในธุรกิจ #20
เผยแพร่แล้ว: 2022-10-03ปัญญาประดิษฐ์สร้างภาพที่ดีอย่างน่าประหลาดใจ ถึงจุดที่มันทำให้คุณตั้งคำถามถึงลักษณะทางกลของมัน มันเขียนประโยคและย่อหน้าด้วยเนื้อหาที่มีอยู่บนอินเทอร์เน็ต โดยอาศัยเบาะแสและคำถามเพิ่มเติม ในทำนองเดียวกัน มันแปล ถอดความ และแปลงบันทึกการประชุมเป็นบันทึกที่เรียบร้อย แล้วบริษัทจะใช้ประโยชน์จากศักยภาพมหาศาลของโซลูชัน AI เชิงสร้างสรรค์ที่ล้ำสมัยได้อย่างไร
Creative AI ของวันนี้และพรุ่งนี้ – สารบัญ:
- Creative AI – บทนำ
- จากข้อความสู่รูปภาพ DALL-E 2 และแอพพลิเคชั่นทางธุรกิจที่มีศักยภาพ
- GPT-3, Leta และนักเขียนแห่งอนาคต
- Creative AI – บทสรุป
Creative AI – บทนำ
การสร้างเนื้อหาจะกลายเป็นโดเมนเฉพาะของปัญญาประดิษฐ์หรือไม่? AI จะสร้างมัลติมีเดียตามความต้องการหรือไม่? สนับสนุนเราในการสร้างสรรค์ผลงานด้วยวิดีโอต้นฉบับ รูปภาพ พร้อมข้อความที่มีคุณภาพและความเฉลียวฉลาดอย่างที่ไม่เคยมีมาก่อน ไม่มีใครรู้ว่า. อย่างไรก็ตาม ในข้อความต่อไปนี้ เราอยากจะดู ว่า AI สร้างสรรค์จัดการกับการสร้างภาพและข้อความอย่างไร รวมถึงการตอบคำถามที่ซับซ้อนได้อย่างไร นอกจากนี้เรายังจะกล่าวถึงวิธีที่ธุรกิจต่างๆ สามารถควบคุมความสามารถเหล่านี้และขยายได้
จากข้อความสู่รูปภาพ DALL-E 2 และแอพพลิเคชั่นทางธุรกิจที่มีศักยภาพ
เมื่อเร็ว ๆ นี้ โซลูชันหนึ่งได้กระตุ้นจินตนาการของผู้ที่ชื่นชอบปัญญาประดิษฐ์ โมเดล DALL-E 2 จาก OpenAI Foundation มันสร้างภาพที่เหมือนจริงตามคำอธิบายภาษาธรรมชาติ และไม่ใช่แค่ภาพใดๆ
มูลนิธิเพิ่งประกาศราคาแพ็คเกจของรูปภาพที่สร้างขึ้น หลังจากใช้ข้อความค้นหาฟรี 50 รายการจนหมด คุณต้องจ่าย 15 ดอลลาร์เพื่อรับรูปภาพอื่นอีก 460 รูป ถั่ว.
สิ่งนี้จะทำให้สาขาอุตสาหกรรมสร้างสรรค์สั่นคลอนอย่างแน่นอน ไม่กีดกันคนที่สร้างสื่อภาพด้วย โดยเฉพาะผู้ที่ยังไม่ได้พัฒนาสไตล์ที่เป็นที่รู้จักและแบรนด์ส่วนบุคคล โดยเฉพาะอย่างยิ่ง OpenAI ไม่ใช่องค์กรเดียวที่ดำเนินงานอย่างเข้มข้นเกี่ยวกับเทคนิคการสร้างภาพ AI คู่แข่งของ DALL-E 2 เช่น Disco Diffusion และ Image เป็นคู่แข่งที่โดดเด่นที่สุด แม้ว่าผู้ติดตามจะปรากฏตัวขึ้นอย่างแน่นอน เนื่องจากพวกเขากำลังพัฒนาโซลูชันเพื่อผลักดันซองจดหมายให้ก้าวไปอีกขั้น
นอกจากนี้ยังอาจหมายถึงการปฏิวัติรูปลักษณ์ของเว็บไซต์ที่ เต็มไปด้วยภาพถ่ายสต็อกซ้ำๆ โดยเฉพาะอย่างยิ่ง เนื่องจาก DALL-E 2 ไม่เพียงแต่สามารถเขียน “ภาพถ่าย” เดียวหรือภาพที่มีสไตล์ในสไตล์เฉพาะเท่านั้น แต่ยังนำเสนอรูปแบบต่างๆ ในธีมที่กำหนดอีกด้วย ดังนั้นจึงเป็นไปได้ที่จะสร้างภาพความละเอียดสูงจำนวนมากด้วยต้นทุนที่ต่ำมาก แล้วเลือกภาพที่เหมาะสมกับความต้องการของบริษัทมากที่สุด แทนที่จะจ้างนางแบบและนักออกแบบ และจ่ายเงินให้เอเจนซี่มัลติมีเดียสำหรับการถ่ายภาพ สิ่งที่คุณต้องมีคือเวลาเพียงเล็กน้อยในการระบุข้อความของภาพ
หลังจากปลอมแปลงรูปภาพจากข้อความแล้ว เวลาจะมาถึงสำหรับวิดีโอและโมเดล 3 มิติโดยอิงจากภาพหรือข้อความ มีงานมากมายในการแก้ปัญหาดังกล่าว ตัวอย่างหนึ่งคือ GANverse3D ที่สร้างโดย Nvidia เป็นเครื่องมือสำหรับสร้างแบบจำลองสามมิติโดยใช้ภาพเดียว เช่น ภาพวาดมังกร ซอฟต์แวร์จะเรียนรู้รูปร่างของวัตถุที่ปรากฎจากคลังภาพหรือภาพประกอบที่มีให้ จากนั้นจึงสร้างแบบจำลองสามมิติที่สอดคล้องกัน
อุปสรรคที่ยิ่งใหญ่ที่สุดเกี่ยวข้องกับการสร้างแบบจำลองชิ้นส่วนที่ไม่ค่อยได้ถ่ายไว้ในภาพ ตัวอย่างเช่น ในกรณีของมังกร ปัญหาอาจอยู่ที่หลังหรือระนาบหน้าท้องส่วนล่าง ถึงกระนั้น โมเดล 3 มิติดังกล่าวจะไปถึงมาตรฐานการผลิตโดยใช้ความพยายามน้อยกว่าโมเดลที่สร้างขึ้นโดยศิลปิน 3 มิติ นี่เป็นคำแนะนำที่สำคัญอย่างยิ่งสำหรับบริษัทเหล่านั้นที่ตั้งใจจะเข้าสู่ตลาดเสมือนจริงและการแสดงตนของ Metaverse
GPT-3, Leta และนักเขียนแห่งอนาคต
กิจกรรมการเขียนเป็นหนึ่งในสาขาปัญญาประดิษฐ์เชิงสร้างสรรค์ที่เติบโตเร็วที่สุด ในขณะที่สร้างคำอธิบายที่ไม่ซ้ำกันโดยอัตโนมัติของผลิตภัณฑ์ที่คล้ายกันและย่อหน้าถอดความสำหรับการเผยแพร่บนโซเชียลมีเดียนั้นไม่ใช่เรื่องแปลกอีกต่อไป แต่ความเป็นไปได้ของ AI นั้นไปไกลกว่านั้นมาก และเราเป็นเพียงจุดเริ่มต้นของการเดินทางที่สร้างสรรค์นี้เท่านั้น อีกแง่มุมที่สำคัญของ AI เชิงสร้างสรรค์ที่เราอยากจะพูดถึงในวันนี้คืออนาคตของปัญญาประดิษฐ์โดยใช้ภาษาธรรมชาติ ซึ่งรวมถึงผู้ช่วยเสมือน
ในเดือนเมษายน พ.ศ. 2565 หนังสือพิมพ์เดอะนิวยอร์กไทมส์เขียนว่า ปัญญาประดิษฐ์มีความสามารถในการสร้างถ้อยคำที่เป็นต้นฉบับซึ่งแยกไม่ออกจากข้อความที่มนุษย์สร้างขึ้น คำแถลงนี้กล่าวถึงโมเดล GPT-3 โดยเฉพาะ ซึ่งปัจจุบันเป็นหนึ่งในโซลูชั่นที่น่าสนใจที่สุดสำหรับการแปลงข้อมูลจำนวนมากที่ประมวลผลโดยปัญญาประดิษฐ์ให้เป็นคำพูดที่มนุษย์สามารถเข้าใจได้ Generative Pre-trained Transformer 3 ซึ่งเป็นตัวย่อ GPT-3 ที่ขยายออกไป เป็นรูปแบบภาษาที่ใช้ Deep Learning เพื่อใช้ภาษา รวมถึงการตอบคำถาม
วิธีที่น่าสนใจที่สุดวิธีหนึ่งในการสาธิตการทำงานของ GPT-3 คือชุดวิดีโอที่ Dr. Alan D. Thompson พูดคุยกับอวาตาร์ชื่อ Leta Leta ตอบคำถามอย่างสร้างสรรค์และน่าประหลาดใจ - ทั้งเกี่ยวกับความรู้ของเธอเกี่ยวกับโลกและเกี่ยวกับตัวเธอเอง ดูเหมือนว่าจะไม่มีอะไรขัดขวางไม่ให้โมเดลที่ได้รับการฝึกฝนในลักษณะเดียวกันนั้นพูดคุยกับลูกค้าเกี่ยวกับผลิตภัณฑ์หรือบริการของบริษัทในทุกแง่มุม
อย่างไรก็ตาม การใช้งานเชิงพาณิชย์ของ GPT-3 มักจะเกี่ยวข้องกับการสร้างเนื้อหา เครื่องมือบางอย่างที่มีอยู่แล้วในปัจจุบันที่สามารถเขียนข้อความต้นฉบับได้ ได้แก่:
- แจสเปอร์
- คำว่า AI
- ช่างทำสำเนา
- Writesonic
- Copy.ai
พวกเขาส่งข้อความต้นฉบับผ่านหลักเกณฑ์ เช่น หัวเรื่องที่กำหนดไว้และข้อกำหนดของเครื่องมือค้นหาที่ปรับให้เหมาะสม
โมเดล GPT-3 ยังถูกใช้โดยแชทบ็อต วอยซ์บอท และแม้กระทั่งเพื่อสร้างแนวคิดทางธุรกิจ นอกจากนี้ยังจัดการคู่มือสำหรับซอฟต์แวร์หรือเครื่องมือในการออกแบบแอปพลิเคชันโดยไม่ต้องเขียนโปรแกรม สามารถแปลคำพูดภาษาธรรมชาติเป็น SQL ได้เช่นกัน
ความสามารถพิเศษอย่างหนึ่งที่มีคุณค่าสำหรับธุรกิจคือ ความสามารถในการสรุปข้อความ ซึ่งรวมถึงบทสนทนาที่บันทึกไว้ซึ่งแปลงเป็นข้อความ เนื่องจากเครื่องมือที่ใช้ GPT-3 จะดึงบันทึกสรุปการประชุมในพริบตา แล้วแปลเป็นภาษาแม่ของผู้เข้าร่วมการประชุมแต่ละคน หากจำเป็น
Creative AI – บทสรุป
หากเราเพิ่มความสามารถในการทำเพลงประกอบให้กับปัญญาประดิษฐ์ที่สร้างภาพ โมเดล 3 มิติ วิดีโอ ตอบคำถามอย่างสร้างสรรค์ สรุปการประชุม และเขียนข้อความ... เช่น กรณีของโครงการ Jukebox ปรากฎว่า ว่า กิจกรรมสร้างสรรค์ของปัญญาประดิษฐ์ครอบคลุมพื้นที่ส่วนใหญ่ของเนื้อหาที่เป็นที่ต้องการมากที่สุด
โชคดีสำหรับศิลปินในขณะนี้ AI เชิงสร้างสรรค์ที่มีจำหน่ายทั่วไปเป็นเครื่องมือในการสร้างความคิดและภาพร่าง แต่ยังต้องการข้อมูลจากมนุษย์จำนวนมาก อย่างไรก็ตาม ขั้นตอนล่าสุดหรือที่อยากจะพูดก็คือ ปัญญาประดิษฐ์แบบก้าวกระโดดครั้งใหญ่ ทำให้เราพิจารณาอนาคตของธุรกิจที่เกี่ยวข้องโดยตรงกับการสร้างและการใช้เนื้อหาดิจิทัลอย่างจริงจัง
นั่นก็เพราะว่าในแง่หนึ่ง AI หมายถึงการลดต้นทุนการผลิตเนื้อหาที่มีลักษณะเฉพาะลงอย่างมาก และในอีกด้านหนึ่ง ความจำเป็นในการจ้างพนักงานที่มีทักษะสูงกว่าซึ่งจะสามารถใช้เครื่องมือที่รองรับ AI และทำงานให้เสร็จได้ในภายหลัง กล่าวคือ ปรับแต่งวัสดุให้ตรงตามความคาดหวังของบริษัทและความต้องการของลูกค้าที่เพิ่มขึ้น
หากคุณชอบเนื้อหาของเรา เข้าร่วมชุมชนผึ้งที่วุ่นวายบน Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest
AI ในธุรกิจ:
- ปัญญาประดิษฐ์ในธุรกิจ - บทนำ
- ภัยคุกคามและโอกาสของ AI ในธุรกิจ (ตอนที่ 1)
- ภัยคุกคามและโอกาสของ AI ในธุรกิจ (ตอนที่ 2)
- แอปพลิเคชั่น AI ในธุรกิจ - ภาพรวม
- NLP คืออะไรหรือการประมวลผลภาษาธรรมชาติในธุรกิจ
- การประมวลผลเอกสารอัตโนมัติ
- AI และโซเชียลมีเดีย – พวกเขาพูดถึงเราว่าอย่างไร?
- นักแปลอัตโนมัติ การแปลผลิตภัณฑ์ดิจิทัลอย่างชาญฉลาด
- แชทบอทข้อความที่ใช้ AI
- การใช้งานและธุรกิจของวอยซ์บอท
- เทคโนโลยีผู้ช่วยเสมือนหรือวิธีการพูดคุยกับ AI?
- ธุรกิจ NLP วันนี้และพรุ่งนี้
- ปัญญาประดิษฐ์สามารถช่วย BPM ได้อย่างไร
- ปัญญาประดิษฐ์จะเข้ามาแทนที่นักวิเคราะห์ธุรกิจหรือไม่?
- บทบาทของ AI ในการตัดสินใจทางธุรกิจ
- ข่าวกรองธุรกิจคืออะไร?
- กำหนดการโพสต์โซเชียลมีเดีย AI จะช่วยได้อย่างไร?
- โพสต์โซเชียลมีเดียอัตโนมัติ
- ปัญญาประดิษฐ์ในการจัดการเนื้อหา
- AI สร้างสรรค์ของวันนี้และพรุ่งนี้
- Multimodal AI และการประยุกต์ใช้ในธุรกิจ
- ปฏิสัมพันธ์ใหม่ AI เปลี่ยนแปลงวิธีการใช้งานอุปกรณ์อย่างไร?
- RPA และ API ในบริษัทดิจิทัล
- บริการและผลิตภัณฑ์ใหม่ที่ทำงานด้วย AI
- ตลาดงานในอนาคตและอาชีพที่จะเกิดขึ้น
- AI สีเขียวและ AI สำหรับโลก
- เอ็ดเทค ปัญญาประดิษฐ์ในการศึกษา