AI สร้างสรรค์ของวันนี้และพรุ่งนี้ | AI ในธุรกิจ #20

เผยแพร่แล้ว: 2022-10-03

ปัญญาประดิษฐ์สร้างภาพที่ดีอย่างน่าประหลาดใจ ถึงจุดที่มันทำให้คุณตั้งคำถามถึงลักษณะทางกลของมัน มันเขียนประโยคและย่อหน้าด้วยเนื้อหาที่มีอยู่บนอินเทอร์เน็ต โดยอาศัยเบาะแสและคำถามเพิ่มเติม ในทำนองเดียวกัน มันแปล ถอดความ และแปลงบันทึกการประชุมเป็นบันทึกที่เรียบร้อย แล้วบริษัทจะใช้ประโยชน์จากศักยภาพมหาศาลของโซลูชัน AI เชิงสร้างสรรค์ที่ล้ำสมัยได้อย่างไร

Creative AI ของวันนี้และพรุ่งนี้ – สารบัญ:

  1. Creative AI – บทนำ
  2. จากข้อความสู่รูปภาพ DALL-E 2 และแอพพลิเคชั่นทางธุรกิจที่มีศักยภาพ
  3. GPT-3, Leta และนักเขียนแห่งอนาคต
  4. Creative AI – บทสรุป

Creative AI – บทนำ

การสร้างเนื้อหาจะกลายเป็นโดเมนเฉพาะของปัญญาประดิษฐ์หรือไม่? AI จะสร้างมัลติมีเดียตามความต้องการหรือไม่? สนับสนุนเราในการสร้างสรรค์ผลงานด้วยวิดีโอต้นฉบับ รูปภาพ พร้อมข้อความที่มีคุณภาพและความเฉลียวฉลาดอย่างที่ไม่เคยมีมาก่อน ไม่มีใครรู้ว่า. อย่างไรก็ตาม ในข้อความต่อไปนี้ เราอยากจะดู ว่า AI สร้างสรรค์จัดการกับการสร้างภาพและข้อความอย่างไร รวมถึงการตอบคำถามที่ซับซ้อนได้อย่างไร นอกจากนี้เรายังจะกล่าวถึงวิธีที่ธุรกิจต่างๆ สามารถควบคุมความสามารถเหล่านี้และขยายได้

จากข้อความสู่รูปภาพ DALL-E 2 และแอพพลิเคชั่นทางธุรกิจที่มีศักยภาพ

เมื่อเร็ว ๆ นี้ โซลูชันหนึ่งได้กระตุ้นจินตนาการของผู้ที่ชื่นชอบปัญญาประดิษฐ์ โมเดล DALL-E 2 จาก OpenAI Foundation มันสร้างภาพที่เหมือนจริงตามคำอธิบายภาษาธรรมชาติ และไม่ใช่แค่ภาพใดๆ

มูลนิธิเพิ่งประกาศราคาแพ็คเกจของรูปภาพที่สร้างขึ้น หลังจากใช้ข้อความค้นหาฟรี 50 รายการจนหมด คุณต้องจ่าย 15 ดอลลาร์เพื่อรับรูปภาพอื่นอีก 460 รูป ถั่ว.

สิ่งนี้จะทำให้สาขาอุตสาหกรรมสร้างสรรค์สั่นคลอนอย่างแน่นอน ไม่กีดกันคนที่สร้างสื่อภาพด้วย โดยเฉพาะผู้ที่ยังไม่ได้พัฒนาสไตล์ที่เป็นที่รู้จักและแบรนด์ส่วนบุคคล โดยเฉพาะอย่างยิ่ง OpenAI ไม่ใช่องค์กรเดียวที่ดำเนินงานอย่างเข้มข้นเกี่ยวกับเทคนิคการสร้างภาพ AI คู่แข่งของ DALL-E 2 เช่น Disco Diffusion และ Image เป็นคู่แข่งที่โดดเด่นที่สุด แม้ว่าผู้ติดตามจะปรากฏตัวขึ้นอย่างแน่นอน เนื่องจากพวกเขากำลังพัฒนาโซลูชันเพื่อผลักดันซองจดหมายให้ก้าวไปอีกขั้น

นอกจากนี้ยังอาจหมายถึงการปฏิวัติรูปลักษณ์ของเว็บไซต์ที่ เต็มไปด้วยภาพถ่ายสต็อกซ้ำๆ โดยเฉพาะอย่างยิ่ง เนื่องจาก DALL-E 2 ไม่เพียงแต่สามารถเขียน “ภาพถ่าย” เดียวหรือภาพที่มีสไตล์ในสไตล์เฉพาะเท่านั้น แต่ยังนำเสนอรูปแบบต่างๆ ในธีมที่กำหนดอีกด้วย ดังนั้นจึงเป็นไปได้ที่จะสร้างภาพความละเอียดสูงจำนวนมากด้วยต้นทุนที่ต่ำมาก แล้วเลือกภาพที่เหมาะสมกับความต้องการของบริษัทมากที่สุด แทนที่จะจ้างนางแบบและนักออกแบบ และจ่ายเงินให้เอเจนซี่มัลติมีเดียสำหรับการถ่ายภาพ สิ่งที่คุณต้องมีคือเวลาเพียงเล็กน้อยในการระบุข้อความของภาพ

หลังจากปลอมแปลงรูปภาพจากข้อความแล้ว เวลาจะมาถึงสำหรับวิดีโอและโมเดล 3 มิติโดยอิงจากภาพหรือข้อความ มีงานมากมายในการแก้ปัญหาดังกล่าว ตัวอย่างหนึ่งคือ GANverse3D ที่สร้างโดย Nvidia เป็นเครื่องมือสำหรับสร้างแบบจำลองสามมิติโดยใช้ภาพเดียว เช่น ภาพวาดมังกร ซอฟต์แวร์จะเรียนรู้รูปร่างของวัตถุที่ปรากฎจากคลังภาพหรือภาพประกอบที่มีให้ จากนั้นจึงสร้างแบบจำลองสามมิติที่สอดคล้องกัน

อุปสรรคที่ยิ่งใหญ่ที่สุดเกี่ยวข้องกับการสร้างแบบจำลองชิ้นส่วนที่ไม่ค่อยได้ถ่ายไว้ในภาพ ตัวอย่างเช่น ในกรณีของมังกร ปัญหาอาจอยู่ที่หลังหรือระนาบหน้าท้องส่วนล่าง ถึงกระนั้น โมเดล 3 มิติดังกล่าวจะไปถึงมาตรฐานการผลิตโดยใช้ความพยายามน้อยกว่าโมเดลที่สร้างขึ้นโดยศิลปิน 3 มิติ นี่เป็นคำแนะนำที่สำคัญอย่างยิ่งสำหรับบริษัทเหล่านั้นที่ตั้งใจจะเข้าสู่ตลาดเสมือนจริงและการแสดงตนของ Metaverse

GPT-3, Leta และนักเขียนแห่งอนาคต

กิจกรรมการเขียนเป็นหนึ่งในสาขาปัญญาประดิษฐ์เชิงสร้างสรรค์ที่เติบโตเร็วที่สุด ในขณะที่สร้างคำอธิบายที่ไม่ซ้ำกันโดยอัตโนมัติของผลิตภัณฑ์ที่คล้ายกันและย่อหน้าถอดความสำหรับการเผยแพร่บนโซเชียลมีเดียนั้นไม่ใช่เรื่องแปลกอีกต่อไป แต่ความเป็นไปได้ของ AI นั้นไปไกลกว่านั้นมาก และเราเป็นเพียงจุดเริ่มต้นของการเดินทางที่สร้างสรรค์นี้เท่านั้น อีกแง่มุมที่สำคัญของ AI เชิงสร้างสรรค์ที่เราอยากจะพูดถึงในวันนี้คืออนาคตของปัญญาประดิษฐ์โดยใช้ภาษาธรรมชาติ ซึ่งรวมถึงผู้ช่วยเสมือน

ในเดือนเมษายน พ.ศ. 2565 หนังสือพิมพ์เดอะนิวยอร์กไทมส์เขียนว่า ปัญญาประดิษฐ์มีความสามารถในการสร้างถ้อยคำที่เป็นต้นฉบับซึ่งแยกไม่ออกจากข้อความที่มนุษย์สร้างขึ้น คำแถลงนี้กล่าวถึงโมเดล GPT-3 โดยเฉพาะ ซึ่งปัจจุบันเป็นหนึ่งในโซลูชั่นที่น่าสนใจที่สุดสำหรับการแปลงข้อมูลจำนวนมากที่ประมวลผลโดยปัญญาประดิษฐ์ให้เป็นคำพูดที่มนุษย์สามารถเข้าใจได้ Generative Pre-trained Transformer 3 ซึ่งเป็นตัวย่อ GPT-3 ที่ขยายออกไป เป็นรูปแบบภาษาที่ใช้ Deep Learning เพื่อใช้ภาษา รวมถึงการตอบคำถาม

วิธีที่น่าสนใจที่สุดวิธีหนึ่งในการสาธิตการทำงานของ GPT-3 คือชุดวิดีโอที่ Dr. Alan D. Thompson พูดคุยกับอวาตาร์ชื่อ Leta Leta ตอบคำถามอย่างสร้างสรรค์และน่าประหลาดใจ - ทั้งเกี่ยวกับความรู้ของเธอเกี่ยวกับโลกและเกี่ยวกับตัวเธอเอง ดูเหมือนว่าจะไม่มีอะไรขัดขวางไม่ให้โมเดลที่ได้รับการฝึกฝนในลักษณะเดียวกันนั้นพูดคุยกับลูกค้าเกี่ยวกับผลิตภัณฑ์หรือบริการของบริษัทในทุกแง่มุม

อย่างไรก็ตาม การใช้งานเชิงพาณิชย์ของ GPT-3 มักจะเกี่ยวข้องกับการสร้างเนื้อหา เครื่องมือบางอย่างที่มีอยู่แล้วในปัจจุบันที่สามารถเขียนข้อความต้นฉบับได้ ได้แก่:

  • แจสเปอร์
  • คำว่า AI
  • ช่างทำสำเนา
  • Writesonic
  • Copy.ai

พวกเขาส่งข้อความต้นฉบับผ่านหลักเกณฑ์ เช่น หัวเรื่องที่กำหนดไว้และข้อกำหนดของเครื่องมือค้นหาที่ปรับให้เหมาะสม

โมเดล GPT-3 ยังถูกใช้โดยแชทบ็อต วอยซ์บอท และแม้กระทั่งเพื่อสร้างแนวคิดทางธุรกิจ นอกจากนี้ยังจัดการคู่มือสำหรับซอฟต์แวร์หรือเครื่องมือในการออกแบบแอปพลิเคชันโดยไม่ต้องเขียนโปรแกรม สามารถแปลคำพูดภาษาธรรมชาติเป็น SQL ได้เช่นกัน

ความสามารถพิเศษอย่างหนึ่งที่มีคุณค่าสำหรับธุรกิจคือ ความสามารถในการสรุปข้อความ ซึ่งรวมถึงบทสนทนาที่บันทึกไว้ซึ่งแปลงเป็นข้อความ เนื่องจากเครื่องมือที่ใช้ GPT-3 จะดึงบันทึกสรุปการประชุมในพริบตา แล้วแปลเป็นภาษาแม่ของผู้เข้าร่วมการประชุมแต่ละคน หากจำเป็น

Creative AI of today and tomorrow

Creative AI – บทสรุป

หากเราเพิ่มความสามารถในการทำเพลงประกอบให้กับปัญญาประดิษฐ์ที่สร้างภาพ โมเดล 3 มิติ วิดีโอ ตอบคำถามอย่างสร้างสรรค์ สรุปการประชุม และเขียนข้อความ... เช่น กรณีของโครงการ Jukebox ปรากฎว่า ว่า กิจกรรมสร้างสรรค์ของปัญญาประดิษฐ์ครอบคลุมพื้นที่ส่วนใหญ่ของเนื้อหาที่เป็นที่ต้องการมากที่สุด

โชคดีสำหรับศิลปินในขณะนี้ AI เชิงสร้างสรรค์ที่มีจำหน่ายทั่วไปเป็นเครื่องมือในการสร้างความคิดและภาพร่าง แต่ยังต้องการข้อมูลจากมนุษย์จำนวนมาก อย่างไรก็ตาม ขั้นตอนล่าสุดหรือที่อยากจะพูดก็คือ ปัญญาประดิษฐ์แบบก้าวกระโดดครั้งใหญ่ ทำให้เราพิจารณาอนาคตของธุรกิจที่เกี่ยวข้องโดยตรงกับการสร้างและการใช้เนื้อหาดิจิทัลอย่างจริงจัง

นั่นก็เพราะว่าในแง่หนึ่ง AI หมายถึงการลดต้นทุนการผลิตเนื้อหาที่มีลักษณะเฉพาะลงอย่างมาก และในอีกด้านหนึ่ง ความจำเป็นในการจ้างพนักงานที่มีทักษะสูงกว่าซึ่งจะสามารถใช้เครื่องมือที่รองรับ AI และทำงานให้เสร็จได้ในภายหลัง กล่าวคือ ปรับแต่งวัสดุให้ตรงตามความคาดหวังของบริษัทและความต้องการของลูกค้าที่เพิ่มขึ้น

หากคุณชอบเนื้อหาของเรา เข้าร่วมชุมชนผึ้งที่วุ่นวายบน Facebook, Twitter, LinkedIn, Instagram, YouTube, Pinterest

Creative AI of today and tomorrow | AI in business #20 robert whitney avatar 1background

ผู้เขียน: โรเบิร์ต วิทนีย์

ผู้เชี่ยวชาญ JavaScript และผู้สอนที่โค้ชแผนกไอที เป้าหมายหลักของเขาคือการยกระดับประสิทธิภาพการทำงานของทีมโดยการสอนผู้อื่นถึงวิธีการร่วมมืออย่างมีประสิทธิภาพขณะเขียนโค้ด

AI ในธุรกิจ:

  1. ปัญญาประดิษฐ์ในธุรกิจ - บทนำ
  2. ภัยคุกคามและโอกาสของ AI ในธุรกิจ (ตอนที่ 1)
  3. ภัยคุกคามและโอกาสของ AI ในธุรกิจ (ตอนที่ 2)
  4. แอปพลิเคชั่น AI ในธุรกิจ - ภาพรวม
  5. NLP คืออะไรหรือการประมวลผลภาษาธรรมชาติในธุรกิจ
  6. การประมวลผลเอกสารอัตโนมัติ
  7. AI และโซเชียลมีเดีย – พวกเขาพูดถึงเราว่าอย่างไร?
  8. นักแปลอัตโนมัติ การแปลผลิตภัณฑ์ดิจิทัลอย่างชาญฉลาด
  9. แชทบอทข้อความที่ใช้ AI
  10. การใช้งานและธุรกิจของวอยซ์บอท
  11. เทคโนโลยีผู้ช่วยเสมือนหรือวิธีการพูดคุยกับ AI?
  12. ธุรกิจ NLP วันนี้และพรุ่งนี้
  13. ปัญญาประดิษฐ์สามารถช่วย BPM ได้อย่างไร
  14. ปัญญาประดิษฐ์จะเข้ามาแทนที่นักวิเคราะห์ธุรกิจหรือไม่?
  15. บทบาทของ AI ในการตัดสินใจทางธุรกิจ
  16. ข่าวกรองธุรกิจคืออะไร?
  17. กำหนดการโพสต์โซเชียลมีเดีย AI จะช่วยได้อย่างไร?
  18. โพสต์โซเชียลมีเดียอัตโนมัติ
  19. ปัญญาประดิษฐ์ในการจัดการเนื้อหา
  20. AI สร้างสรรค์ของวันนี้และพรุ่งนี้
  21. Multimodal AI และการประยุกต์ใช้ในธุรกิจ
  22. ปฏิสัมพันธ์ใหม่ AI เปลี่ยนแปลงวิธีการใช้งานอุปกรณ์อย่างไร?
  23. RPA และ API ในบริษัทดิจิทัล
  24. บริการและผลิตภัณฑ์ใหม่ที่ทำงานด้วย AI
  25. ตลาดงานในอนาคตและอาชีพที่จะเกิดขึ้น
  26. AI สีเขียวและ AI สำหรับโลก
  27. เอ็ดเทค ปัญญาประดิษฐ์ในการศึกษา