GPT อยู่ที่นี่เพื่อคงอยู่ มันจะพาเราไปไหน?

เผยแพร่แล้ว: 2023-02-03

GPT กำลังเปิดเผยต่อหน้าเรา และเราไม่พลาดจังหวะ ขณะที่เราสำรวจศักยภาพและข้อจำกัดของเทคโนโลยีใหม่นี้ จะเป็นไปตามโฆษณาหรือไม่

นับตั้งแต่เปิดตัวเมื่อปลายเดือนพฤศจิกายน ChatGPT ได้ดึงดูดใจและความคิดของผู้คนทั่วโลกจากความสามารถในการสร้างการตอบสนองที่เหมือนมนุษย์ อย่างไรก็ตาม เช่นเดียวกับเทคโนโลยีใหม่ๆ มักจะมีช่องว่างระหว่างโฆษณาเกินจริงกับความเป็นจริง และโดยเฉพาะอย่างยิ่ง AI กำเนิดนั้นค่อนข้างเป็นเครื่องจักรโฆษณาตามธรรมชาติ

เราเข้าใจถึงความกังขา – โมเดลภาษาขนาดใหญ่นั้นยอดเยี่ยมเมื่อดูน่าเชื่อถือ แม้ว่ามันจะผิดก็ตาม แต่บอกตามตรงว่าเราเป็นคนมองโลกในแง่ดี ในช่วงแปดสัปดาห์ที่ผ่านมา เราได้สร้างฟีเจอร์ที่ขับเคลื่อนด้วย AI และส่งมอบให้กับลูกค้ารุ่นเบต้า 160 ราย และผลตอบรับก็มีแนวโน้มที่ดีอย่างท่วมท้น มากเสียจนเมื่อต้นสัปดาห์นี้ ผู้อำนวยการฝ่ายแมชชีนเลิร์นนิงของเรา Fergal Reid และฉันได้ออกตอนพิเศษในพอดแคสต์เพื่อแบ่งปันข้อมูลเชิงลึกเกี่ยวกับสิ่งที่เราสร้างขึ้นและสิ่งที่เราได้เรียนรู้

ในครั้งนี้ เรากำลังก้าวไปไกลกว่าอินเตอร์คอม และไปไกลกว่าการบริการลูกค้า ในตอนนี้ เราจะเจาะลึกทุกสิ่งที่ GPT ตั้งแต่ความกังขาไปจนถึงบทบาทในการสื่อสารทางธุรกิจ ตั้งแต่การหยุดชะงักของงานสร้างสรรค์ไปจนถึงอนาคตของอินเทอร์เฟซผู้ใช้

นี่คือประเด็นสำคัญบางประการ:

  • ไม่ใช่แค่เทคโนโลยีเท่านั้นที่พัฒนาขึ้น – เรากำลังเข้าใจมากขึ้นว่าจะสร้างอะไร วิธีปรับแต่งและผสานรวมเข้าด้วยกัน และการเปลี่ยนแปลงทั้งหมดเหล่านี้กำลังขับเคลื่อนอุตสาหกรรมไปข้างหน้า
  • บางทีอนาคตของส่วนต่อประสานระหว่างมนุษย์กับเครื่องจักรจะได้รับการอำนวยความสะดวกโดยบอทที่ขับเคลื่อนด้วย AI ส่วนบุคคลที่เข้าใจความตั้งใจของผู้ใช้และเป็นสื่อกลางในการโต้ตอบของพวกเขา
  • โมเดลเหล่านี้ได้ปลดล็อกความสามารถใหม่ๆ มากมายและหลอกใครบางคนได้ในพริบตา แต่ก็ยังขาดสามัญสำนึกในการให้เหตุผลเพื่อให้ผ่านการทดสอบของทัวริง
  • GPT อาจทำให้อุตสาหกรรมการบริการลูกค้าหยุดชะงัก แต่ถ้าระบบอัตโนมัติเพิ่มประสิทธิภาพการทำงานของตัวแทน ก็จะสามารถปลดล็อกความสามารถที่ช่วยเพิ่มมูลค่าให้กับธุรกิจได้ในที่สุด

ไม่พลาดทุกไฮไลท์โดยติดตาม Intercom on Product บน Apple Podcasts, Spotify, YouTube หรือคว้าฟีด RSS ในเครื่องเล่นที่คุณเลือก สิ่งต่อไปนี้คือการถอดเทปของตอนนี้เล็กน้อย


นอกเหนือจากการโฆษณา

Des Traynor: สวัสดี และยินดีต้อนรับสู่พอดคาสต์อินเตอร์คอม ฉันเข้าร่วมอีกครั้งโดย Fergal และเราจะพูดคุยเกี่ยวกับทุกสิ่งที่ GPT Fergal เป็นเวลาแปดสัปดาห์เต็มแล้วตั้งแต่ ChatGPT เปิดตัว ก่อนหน้านี้ผู้คนได้สร้างผลิตภัณฑ์ที่มีประโยชน์เพื่อต่อต้านมัน และเราก็มีคลื่นแห่งความคลางแคลงใจที่บอกว่านี่คือของเล่น ยังไม่บรรลุนิติภาวะ มันไม่พร้อมสำหรับสิ่งใดเลย ซึ่งเป็นเพียงปฏิกิริยาของเทคโนโลยีใหม่แบบคลาสสิก หัวของคุณอยู่ที่ไหน? ตั้งข้อสงสัยหรือไม่? เราข้ามหน้าผาการรับรู้ที่สำคัญหรือไม่?

Fergal Reid: ใช่ ฉันคิดว่ามีความชอบธรรมบางประการสำหรับความกังขา สิ่งเหล่านี้เกือบจะเป็นเครื่องจักรโฆษณาตามธรรมชาติ มันง่ายมากที่จะมองดูและเห็นว่ามันทำอะไรที่ดูดี เว้นแต่คุณจะเจาะลึกลงไปจริงๆ มันดูยอดเยี่ยม จากนั้น เมื่อคุณเจาะลึกเข้าไป คุณจะรู้สึกว่า "อา มันผิด ฉันรู้สึกหลงทาง" เครื่องจักรเหล่านี้ได้รับการออกแบบมาเพื่อสร้างสิ่งที่เป็นไปได้ และถ้าเป็นไปได้ แต่ผิดเป็นปัญหาสำหรับคุณ มันอาจจะน่าผิดหวังมาก ดังนั้นฉันจึงเข้าใจตำแหน่งเริ่มต้นของความสงสัยที่ผู้คนจำนวนมากมาที่เทคโนโลยีนี้

“ChatGPT เหมือนที่อยู่บนอินเทอร์เน็ตทุกวันนี้ อาจเป็นของเล่น แต่นั่นไม่ได้หมายความว่าเราไม่สามารถใช้เทคโนโลยีพื้นฐานและสร้างฟีเจอร์ทางธุรกิจที่มีคุณค่าอย่างไม่น่าเชื่อจากสิ่งนั้น”

อย่างไรก็ตาม เรามักจะมั่นใจใน generative AI เสมอ และตั้งแต่ที่เราพูดไปเมื่อคราวที่แล้ว เราได้สร้างคุณสมบัติบางอย่าง เราได้ส่งมันไปยังรุ่นเบต้า เรามีลูกค้า 160 รายในรุ่นเบต้าของเราที่ใช้คุณสมบัติเหล่านี้: การสรุป บางส่วน คุณสมบัติในการแต่งเพลงทดลองมากขึ้นเพื่อพยายามทำให้ผู้คนเร็วขึ้น จากนั้นเรามีคุณสมบัติอื่น ๆ ในรูปแบบต้นแบบที่ยังไม่ค่อยมี - สิ่งที่คุ้มค่ามาก - แต่เราคิดว่าเราเห็นแนวทางดังกล่าว ดังนั้นเราจึงเข้าใจความกังขา เรามองโลกในแง่ดี และตอนนี้เรามีข้อมูลแล้ว – การใช้งานจริงของลูกค้า ลูกค้าจริงบอกเราว่ามีงานเฉพาะที่พวกเขาต้องการทำ พวกเขาทำทั้งวันทุกวัน และมันเปลี่ยนแปลงสำหรับ นั่น. และสำหรับฉันแล้ว ท่าทีของความสงสัยเริ่มสั่นคลอนเล็กน้อย

Des: ความจริงที่ว่าผู้คนกำลังใช้สิ่งนั้นเพื่อทำงานส่วนต่าง ๆ ในชีวิตประจำวัน

เฟอร์กัล: ใช่ นั่นคือผู้ตัดสินขั้นสูงสุดของเรื่องนี้ เป็นเรื่องยากมากที่จะสงสัยเมื่อมีคนใช้มันจริงๆ ไม่ใช่เป็นแค่ของเล่น มีตรรกะอยู่ตรงนั้น เราเคยเห็นบทความบางบทความใน The Atlantic และสถานที่ทำนองนั้นที่ผู้คนพูดว่า “นี่ ดูสิ สิ่งนี้เป็นของเล่นมากกว่าเป็นของมีค่าจริงๆ” และ ChatGPT ซึ่งอยู่บนอินเทอร์เน็ตทุกวันนี้อาจเป็นของเล่น แต่นั่นไม่ได้หมายความว่าเราไม่สามารถใช้เทคโนโลยีพื้นฐานและสร้างคุณสมบัติทางธุรกิจที่มีค่าอย่างไม่น่าเชื่อจากสิ่งนั้น

ทีมของฉันอาจเป็นหนึ่งในหลายๆ ทีมที่จะทำเช่นนั้นในช่วงสองสามเดือนที่ผ่านมา เช่น "ว้าว นี่คือการส่งมอบคุณค่าที่แท้จริง" และฉันคิดว่าเราน่าจะเป็นหนึ่งในบริษัทที่ใหญ่กว่าในด้านบริการลูกค้าที่ประสบความสำเร็จ มีวัฏจักรการพัฒนาที่เราได้รับสิ่งนี้จริง ๆ แล้วอยู่ในมือของลูกค้าหลายร้อยราย และได้รับคำติชมจากมัน และพวกเขาบอกเราว่า “ใช่ นี่ช่วยฉันประหยัดเวลาจริงๆ สิ่งนี้ทำให้งานของฉันเร็วขึ้น” ใช่ ความคลางแคลงใจยากขึ้นที่จะรักษาไว้ นั่นเป็นข้อโต้แย้งอย่างหนึ่ง ฉันคิดว่าคุณสามารถโจมตีความสงสัยจากมุมมองอื่นได้: เราได้เห็นกระทู้ทวีตและบทความจำนวนมากที่สงสัยเกี่ยวกับเทคโนโลยีนี้เพราะคนรุ่นก่อนไม่ได้ข้ามช่องว่างและไม่ได้เปลี่ยนแปลง และพวกเขาไม่เชื่อเพราะเทคโนโลยีใหม่ ๆ นั้นเกินจริงอยู่เสมอ แต่นั่นไม่ใช่ข้อโต้แย้งที่ดี สิ่งเหล่านี้เป็นข้อโต้แย้งที่ถูกต้องชั่วขณะแล้วกลายเป็นผิดมหันต์ คุณสามารถล้มเหลวที่นี่ได้ด้วยการมองโลกในแง่ดีมากเกินไป แต่คุณสามารถล้มเหลวได้มากพอๆ กันโดยการ-

Des: ว่างเปล่าและมองโลกในแง่ร้าย

เฟอร์กัล: แน่นอน ว่างเปล่าและมองโลกในแง่ร้าย

“มีไดนามิกมากมายเกิดขึ้นพร้อมๆ กัน ซึ่งจะป้อนกลับและขยายซึ่งกันและกัน”

Des: คู่ขนานที่คุณเห็นคือคนที่ทิ้งไอเดียสตาร์ทอัพใหม่ๆ ที่พวกเขาเคยได้ยิน และสิ่งนี้คือ 90% ของสตาร์ทอัพไม่ได้ผล ดังนั้น 90% ของเวลาทั้งหมด คุณจะโดดเด่นและดูฉลาดจริงๆ แล้วคุณก็ทิ้งขยะที่กลายเป็นธุรกิจมูลค่าล้านล้านดอลลาร์ และทุกคนก็แบบว่า "ใช่ ปรากฎว่า..." ฉันคิดว่าเป็นแนท ฟรีดแมนที่พูดว่า "คนมองโลกในแง่ร้ายฟังดูฉลาด คนมองโลกในแง่ดีก็รวยได้" หรืออะไรทำนองนั้น . และมีความจริงบางอย่างเมื่อคุณให้น้ำหนักกับความคิดเห็นแต่ละข้อ: ระดับที่คุณผิดเมื่อคุณผิดจะทำให้ระดับที่คุณถูกต้องเล็กน้อยเพียงแค่ไม่เชื่อในเทคโนโลยี

เฟอร์กัล: ใช่ 100% ฉันเชื่อใน AI และคุณค่าของมัน ฉันคิดว่าเรามีหลักฐานเพียงพอของมูลค่าที่แท้จริง ในช่วงทศวรรษที่ผ่านมา เราเห็นแนวโน้มของแมชชีนเลิร์นนิงและ AI โดยทั่วไปเพิ่มขึ้นเรื่อยๆ เรามีความสามารถใหม่ ฉันรู้สึกว่าทีมของฉันมีหลักฐานเพียงพอว่ามีความสามารถบางอย่างที่ปลดล็อกเป็นอย่างน้อยสำหรับ GPT-3.5 และสำหรับโมเดลภาษาขนาดใหญ่อื่นๆ ที่ไม่มีเมื่อหกเดือนก่อน ฉันเชื่อว่ามีสิ่งที่ยื่นออกมา มีผลิตภัณฑ์อีกมากมายที่เราสามารถสร้างได้ในขณะนี้ที่ยังไม่ได้สร้างมากกว่าที่เป็นอยู่ ใช่ เรากำลังรั้น และเรากำลังเริ่มเห็นลูกค้าที่เราจัดส่งรุ่นเบต้ามาบอกเราว่า "ใช่ วิธีนี้ได้ผล เยี่ยมมาก"

เรายังไม่ได้ข้ามส่วนสุดท้ายของมัน เราทราบดีว่านี่เป็นการเปลี่ยนแปลงในแง่ของคุณค่าหลักสำหรับงานที่ลูกค้าของเราใช้เวลา 99% ในการทำ ดังนั้นเราจึงจัดส่งคุณลักษณะการสรุปและคุณลักษณะอื่นๆ เพื่อประหยัดเวลาในกล่องจดหมาย แต่มีสิ่งใหญ่กำลังมาถึงที่นี่ที่เรายังไม่ได้สร้าง นั่นคือภายใน เรากำลังดำเนินการอยู่ แต่เราไม่เห็นสิ่งเหล่านั้นในตลาด ดังนั้นเราจึงคิดว่าความตื่นเต้นที่แท้จริงของสิ่งนี้ยังคงมา

Des: มีลำดับชั้นของการเปลี่ยนแปลงบางอย่างที่ฉันแน่ใจว่าจะมีคนแก้ไขฉันในความคิดเห็น แต่เราได้ใส่ฟีเจอร์สดเพื่อแปลงเวิร์กโฟลว์เฉพาะแล้ว และโดยการแปลง เราหมายถึงการลดค่าใช้จ่ายในการดำเนินการนี้ถึง 5% ของ สิ่งที่เคยเป็น ในกรณีของการสรุป จากนั้นอาจเปลี่ยนขั้นตอนการทำงานทั่วไป จากนั้นอาจเปลี่ยนแปลงงาน เปลี่ยนแปลงองค์กร และที่เหนือสุด อาจเป็นการเปลี่ยนแปลงธุรกิจ แต่ค่อนข้างชัดเจนเมื่อเราระบุกรณีการใช้งานมากขึ้นเรื่อยๆ ที่เราสามารถมอบคุณค่ามากมายที่เรากำลังสานต่อสิ่งนี้ สำหรับผมแล้ว การเปลี่ยนแปลงที่หลีกเลี่ยงไม่ได้ของโลกแห่งการบริการลูกค้า

“เราไปหาลูกค้าเป็นการภายในและต้องปิดการรับสมัครเบต้าเร็วกว่าที่เราต้องการมาก เพราะเป็นหนึ่งในคำตอบที่ใหญ่ที่สุดที่เราเคยได้รับ”

เฟอร์กัล: แน่นอน มีหลายวิธีที่สิ่งนี้เปลี่ยนแปลงควบคู่กันไป มีไดนามิกมากมายเกิดขึ้นพร้อมๆ กัน ซึ่งจะป้อนกลับและขยายซึ่งกันและกัน สิ่งแรกนั้นชัดเจน: เทคโนโลยีที่มีอยู่นั้นดีขึ้นเรื่อยๆ นั่นไม่หยุด OpenAI และผู้เล่นรายอื่นอย่าง Anthropic กำลังสร้างโมเดลใหม่ๆ อยู่ตลอดเวลา และพวกเขาก็น่าตื่นเต้น นั่นไม่หยุด นั่นเป็นไดนามิกอย่างหนึ่ง และยังมีอีกหนึ่งไดนามิก ซึ่งก็คือเรากำลังพัฒนาผลิตภัณฑ์จากสิ่งเหล่านั้นให้ดีขึ้น เรากำลังพัฒนาแบบจำลองเหล่านั้นให้ดีขึ้นและค้นหาประเภทของสิ่งที่พวกเขาทำได้ดี และยังมีอีกหนึ่งไดนามิก ซึ่งก็คือเรากำลังปรับปรุงให้ดีขึ้นในการปรับแต่ง สร้างพรอมต์ที่เหมาะสม และผสานรวมเข้ากับระบบที่มีอยู่ของเรา จากนั้นความคาดหวังของลูกค้าของเราก็สูงขึ้นเรื่อย ๆ

เราพบว่าตั้งแต่ ChatGPT เป็นต้นมา ลูกค้าของเราได้รับความสนใจเป็นอย่างมาก พวกเขาสามารถเห็นสัญญาและเชื่อว่ามีบางอย่างอยู่ที่นี่ ในรุ่นเบต้า เราไปหาลูกค้าเป็นการภายในและต้องปิดการรับสมัครรุ่นเบต้าเร็วกว่าที่เราต้องการมาก เนื่องจากเป็นการตอบสนองครั้งใหญ่ที่สุดครั้งหนึ่งที่เราเคยได้รับ ผู้คนต้องการที่จะอยู่ในนั้น ดังนั้น สิ่งเหล่านี้ทั้งหมดรวมกันจะขยายใหญ่ขึ้นกว่าสิ่งใดสิ่งหนึ่งเพียงอย่างเดียว ในความคิดของฉัน

Des: มันน่าสนใจว่าคุณแยกมันออกมาได้อย่างไร เทคโนโลยีกำลังพัฒนา ความสามารถของธุรกิจกำลังดีขึ้น และนั่นเป็นเพียงการนำมันมาใช้ในกรณีท้องถิ่น จากนั้นความสามารถของธุรกิจในการคิดหรือสร้างแนวคิดเกี่ยวกับผลิตภัณฑ์และโอกาสใหม่ๆ โดยใช้เทคโนโลยีนั้นกำลังดีขึ้น เช่นเดียวกับความคาดหวังของลูกค้าที่มีต่อเทคโนโลยี เราอาจเหลือเวลาเพียงหนึ่งปีจากที่ผู้คนคาดหวังว่าจะสามารถขยายข้อความภายในช่องข้อความได้ ดังตัวอย่างง่ายๆ คุณเห็นสิ่งเหล่านี้ปรากฏขึ้นทุกที่

Fergal: ถ้าแม้แต่ปีเดียว เห็นได้ชัดว่าพวกเราหลายคนได้เห็นการประกาศของ Microsoft เกี่ยวกับการนำคุณสมบัติเหล่านี้เข้าสู่ Word และสิ่งต่างๆ และจะเปลี่ยนไปอย่างรวดเร็วหากเครื่องมือเพิ่มประสิทธิภาพในสำนักงานขนาดใหญ่ทั่วไปทำเช่นนี้ มันอาจจะเร็วมาก

การเพิ่มขึ้นของผู้ช่วย AI

Des: นี่คือความสงสัยประเภทต่างๆ ที่ฉันจะเรียกเก็บ – หนึ่งที่สะท้อนกับฉันเล็กน้อยอย่างไรก็ตาม ฉันคิดว่า Kevin Cannon มีทวีตตลกๆ ที่เขากล่าวว่า "อนาคตประกอบด้วยคนที่ใช้ GPT เพื่อขยายสิ่งต่างๆ เช่น 'ฉันต้องการงาน' เป็นจดหมายที่น่ารัก เช่น 'Dear Sir' หรือ 'Madame' บลา บลา , บลาๆ... แล้วผู้รับก็คลิกปุ่มสรุปเพื่อดูว่าคนๆ นั้นเพิ่งพูดว่า 'ฉันต้องการงาน นี่คือเรซูเม่ของฉัน' หรืออะไรก็ตาม ในแง่หนึ่ง คุณคงถูกล่อลวงให้มองดูพวกเขาแล้วคิดว่า ทั้งหมดนี้มันคืออะไรกันแน่? ภาษาที่เป็นทางการ การเขียนแบบมืออาชีพ และภาษาอังกฤษเพื่อธุรกิจกลายเป็นสื่อกลางที่ไร้ความหมายสำหรับวิธีการแสดงละครที่เราทุกคนสื่อสารกัน ในอนาคต ฉันจะส่งข้อความแจ้งให้คุณทราบ และคุณจะตอบกลับด้วยข้อความแจ้ง เช่น “ฉันต้องการ งาน." “คุณไม่สามารถมีงานทำ”

เฟอร์กัล: ใช่ คำถามยาก. เป็นการเก็งกำไรอย่างจริงจัง ฉันจะให้ความเห็นบางอย่างแก่คุณ คงมีบริบทบางอย่างใช่ไหม? สมมติว่าเป็นเอกสารทางกฎหมาย คุณสามารถพูดกับคนในทีมกฎหมายของคุณว่า “เฮ้ ฉันต้องการสัญญา มันต้องทำ X, Y และ Z” คำขอนั้นจะกลายเป็น 10 หน้าของเนื้อหาทางกฎหมาย ผู้รับจะแบบว่า “โอ้ เขาทำสามอย่างที่ว่าไว้หรือเปล่า” และทีมกฎหมายของพวกเขาจะตอบว่า “ใช่ เป็นเช่นนั้น” นี่คือจุดสิ้นสุดของสุดโต่งที่มีการขยายและบีบอัดขนาดใหญ่ แต่ในบางกรณีขอบที่แปลก ข้อ 13 ในหน้าสองสามารถเปิดขึ้นในศาลได้ และอื่นๆ เห็นได้ชัดว่าเป็นเรื่องสำคัญ เราไม่สามารถกำจัดมันได้ เราไม่สามารถมีสัญลักษณ์แสดงหัวข้อย่อยทั้งสี่ข้อได้ เราต้องการทั้งหมดนั้น คุณอาจจะไม่คิดว่ามันเป็นสาระสำคัญเมื่อคุณเขียนมัน แต่มันอาจจะกลายเป็นสาระสำคัญในภายหลัง นั่นให้ความรู้สึกเหมือนสุดโต่งตรงที่มันเหมือนกับว่า “ไม่ มันให้ความรู้สึกว่าต้องอยู่ตรงนั้น” บางอย่างที่ต้องจัดการกับเคสขอบเหล่านั้นทั้งหมด

และอีกอย่างที่รุนแรงที่สุดน่าจะเป็นสถานการณ์ที่ผู้ให้และผู้รับไม่ใส่ใจในรายละเอียดเหล่านั้น ทั้งคู่ไม่เคยสนใจรายละเอียดเหล่านั้นเลย และพวกเขาแค่สังเกตมารยาททางสังคมหรือพิธีการบางอย่างของ “นี่คือวิธีที่คุณเขียนจดหมายธุรกิจ ฉันกำลังเขียนถึงบริษัทใหญ่ ฉันควรเขียนจดหมายธุรกิจดีกว่า” และบางทีสิ่งนั้นอาจจะหายไป

Des: ในทำนองเดียวกัน ฉันคิดว่าสิ่งที่คล้ายคลึงกันสำหรับฉันก็คือเมื่อการสนทนาทางอีเมลถูกย้ายไปยัง SMS, iMessage หรือ WhatsApp คิดถึงเรื่องไร้สาระทั้งหมดที่คุณไม่ได้พูดอีกต่อไป “หวังว่านี่จะพบคุณดี” หรืออะไรก็ตาม ไอ้นั่นหายไปหมดแล้ว

Fergal: ข้อจำกัดของ Twitter, รูปแบบ, สื่อ อนุญาตให้คุณพูดน้อยได้ ฉันคิดว่านั่นเป็นพลังที่แท้จริง วิธีที่เราสื่อสารและวิธีที่เราเขียนบทความในศูนย์ช่วยเหลืออาจไม่ใช่วิธีที่ดีที่สุดในการเขียน บางทีเราควรจะสั้นกว่านี้ ในทีมแมชชีนเลิร์นนิง มีวิธีคิดอีกแบบหนึ่งเกี่ยวกับเรื่องนี้ อนาคตของโลกกำลังจะถูกตัวแทนเป็นตัวกลาง และกาลครั้งหนึ่งนานมาแล้ว นี่เป็นสิ่งที่ชัดเจนสำหรับทุกคน เว็บเบราว์เซอร์ของคุณมีตัวแทนผู้ใช้ที่สตริงและสิ่งต่างๆ และอย่างที่ฉันพูด ตัวแทนของคุณกำลังนำทางอินเทอร์เน็ตแปลกๆ ที่มีลิงก์และสิ่งต่างๆ เหล่านี้ให้คุณ มันจะทำสิ่งต่างๆ ให้คุณ กลับมาและบอกคุณหลายอย่าง จากนั้น ทุกสิ่งนั้นก็รวมศูนย์ และตอนนี้คุณก็มีเสิร์ชเอ็นจิ้นและอื่นๆ

“คงเป็นเรื่องหนึ่งถ้าสิ่งที่เราเห็นคือการสร้างภาพ DALL·E 2 แต่ไม่เลย เราเห็นการเปลี่ยนแปลงในการสังเคราะห์เสียง การสังเคราะห์ภาพ การทำความเข้าใจข้อความ การสังเคราะห์ข้อความ และการบีบอัดข้อความ”

มีความคิดเก่า ๆ ในเรื่องเทคโนโลยีแห่งอนาคตและนิยายวิทยาศาสตร์และอื่น ๆ ว่าคุณน่าจะมีตัวแทนที่เข้าใจคุณ ความตั้งใจของคุณ สิ่งที่คุณต้องการ และฉลาดพอที่จะรู้ว่าอะไรควรดึงดูดความสนใจของคุณ และอะไรที่ไม่ใช่ ถึง. เป็นไปได้ว่าในอนาคต แนวทางนี้จะเป็นแบบนั้นมากขึ้น หากคุณต้องการทราบรายละเอียดเฉพาะเจาะจง ซอฟต์แวร์ในฝั่งของคุณก็ฉลาดพอที่จะใส่ไว้ในเวอร์ชันสรุปของมัน แต่ก็ฉลาดพอที่จะรู้ว่าคุณไม่ต้องการรู้รายละเอียดนั้นเช่นกันและไม่ต้องสนใจมัน

บางทีเราอาจจะอยู่ในอนาคตที่ส่วนต่อประสานกับผู้ใช้เปลี่ยนไป โดยที่ส่วนต่อประสานผู้ใช้ของฉันกับธุรกิจหรืองานใดงานหนึ่งไม่ได้ถูกควบคุมโดยธุรกิจนั้นหรืองานนั้นจริง ๆ เหมือนที่เป็นอยู่ในปัจจุบัน แต่เป็นส่วนตัวสำหรับฉัน ฟังดูแฟนซีมาก แต่ฉันคิดว่ามันจะเกิดขึ้นเร็ว โมเดลภาษาเหล่านี้มีประสิทธิภาพมาก เริ่มถูกใช้ในการเขียนโค้ดและอื่นๆ และจากที่นี่ไปเพียงสั้นๆ เพื่อดำเนินการจากฉัน เราได้เห็นต้นแบบบางส่วนที่ผู้คนกำลังสร้างแบบจำลองที่เข้าใจเว็บไซต์ดีพอที่จะใช้ประโยคภาษาอังกฤษและนำทางเว็บไซต์ให้คุณ แล้วเรากำลังมุ่งหน้าสู่อนาคตที่ทุกคนมีปฏิสัมพันธ์กับเว็บไซต์อย่างไร? คุณต้องการเว็บไซต์อีกต่อไปหรือไม่?

Des: นี่คือ SEO ใหม่หรือไม่? ตรวจสอบให้แน่ใจว่า GPT ของคุณเข้าใจคุณหรือไม่

เฟอร์กัล: ใช่ บางทีเว็บไซต์อาจกลายเป็นบางสิ่งที่ดูเหมือน API ที่เปิดเผยต่อสาธารณะมากกว่า และนั่นคือบางอย่างที่มี UI และการจัดรูปแบบ เนื่องจาก UI ได้รับการจัดรูปแบบโดยตัวแทน

Des: เราทุกคนแค่คุยกับ Siri หรืออะไรก็ตาม

“บางทีนั่นอาจเป็นลักษณะของอนาคตที่มีบอท เราทุกคนมีบอทที่ปรับแต่งให้เหมาะกับเราซึ่งจัดการส่วนต่อประสานและคุณไม่จำเป็นต้องกังวลมากนักเกี่ยวกับชั้นกลางนั้น”

Fergal: ใช่ และฉันคิดว่า Google และ Apple สามารถเห็นอนาคตนี้ได้ เราไม่ทราบลำดับเวลา แต่อีกครั้ง เครื่องมือคิดที่ฉันใช้อยู่เสมอคือ: จะเป็นอย่างไรถ้าคุณมีมนุษย์ที่ฉลาดมากที่เข้าใจคุณ ผู้ที่ทำงานร่วมกับคุณ อาจจะเป็นผู้ช่วยส่วนตัว และคุณกำลังติดต่อกับพวกเขา และ คุณต้องการจองวันหยุดหรือไม่? พวกเขาจะถามคุณเกี่ยวกับเรื่องนั้นว่าอย่างไร? และครึ่งหนึ่งของข้อมูลที่คุณเห็นบน booking.com หรืออะไรก็ตาม พวกเขาจะไม่ถามคุณแบบนั้น พวกเขาแค่จะจองวันหยุดให้คุณ และอาจจะกลับมาพร้อมคำถามที่ชัดเจน: "โอ้ คุณต้องการ ไปพักในอพาร์ตเมนต์ แต่ไม่มีที่ว่าง โรงแรมจะทำไหม” แต่นั่นคืออินเทอร์เฟซผู้ใช้ที่ปรับเปลี่ยนได้ อีกครั้ง ฉันไม่ได้ให้ความสำคัญกับ ChatGPT และสิ่งที่เพิ่งจัดส่งมากเกินไป คุณใช้เวลาหนึ่งปีหรือสองปี มันเคลื่อนไหวเร็วเกินไป หากคุณไม่เชื่อเพราะข้อจำกัดในปัจจุบัน คุณจะ-

Des: ความสงสัยของคุณจะพลาดเครื่องหมาย

เฟอร์กัล: แน่นอน Transformers นั้นทรงพลังอย่างมาก และสถาปัตยกรรมของ Transformers ที่ผู้คนใช้นั้นทรงพลังอย่างมาก เราได้เห็นการปรับปรุงหลายรูปแบบที่นี่ คงเป็นเรื่องหนึ่งหากสิ่งที่เราเห็นคือการสร้างภาพ DALL·E 2 แต่ไม่เลย เราเห็นการเปลี่ยนแปลงในการสังเคราะห์เสียง การสังเคราะห์ภาพ การทำความเข้าใจข้อความ การสังเคราะห์ข้อความ การบีบอัดข้อความ เราเห็นความก้าวหน้าแบบคู่ขนานมากมาย สามารถเขียนโค้ดได้ มันอาจจะสามารถทำงานเว็บไซต์ได้ในไม่ช้า ดังนั้นนั่นอาจเป็นลักษณะของอนาคตของบอท เราทุกคนมีบอตที่ปรับแต่งให้เหมาะกับเราซึ่งจัดการส่วนต่อประสานและคุณไม่จำเป็นต้องกังวลมากนักเกี่ยวกับชั้นกลางนั้น

Des: ฉากต้นแบบที่ยอดเยี่ยมฉากหนึ่งที่ฉันเห็นบน Twitter คือคนที่ฝึกบอทให้พูดด้วยเสียงของเขาเอง ผมเชื่อว่าสามารถโทรหาหมายเลขและนำทางสายโทรศัพท์ธนาคาร ติดต่อตัวแทนได้อย่างมีประสิทธิภาพ ขอมีทั้งหมดของพวกเขา ธุรกรรมแลกเปลี่ยนเงินตราต่างประเทศคืนเงินหรือบางอย่าง สิ่งที่เป็นมาตรฐานที่คุณเพียงแค่ต้องถามและพวกเขาทำ มันดำเนินมาจนถึงที่สุดแล้ว พวกเขาแค่พูดว่า “ไป” แล้วก็เดินจากไป เห็นได้ชัดว่ามีการวางแผนขั้นสูง อาจจะปิดมาก แต่ก็ยังเป็นกรณีการใช้งานจริงแบบ end-to-end ที่ดำเนินการโดยอัตโนมัติ

Fergal: ฉันคิดว่ามันเป็นพื้นที่ที่น่าสนใจจริงๆ เราพูดคุยกันมากมายเกี่ยวกับวิธีการบริการลูกค้าที่จะเปลี่ยนแปลง และการที่เรามักจะนึกถึงสิ่งที่จะเกิดขึ้นเมื่อคุณมีบอทเช่น ChatGPT แต่ได้รับการปรับแต่งให้เหมาะกับธุรกิจของคุณ และตอบคำถามได้ดีมาก และค่าใช้จ่ายในการแก้ไขปัญหาการบริการลูกค้าจะลดลง แต่มีอีกด้านหนึ่ง ฝ่ายบริการลูกค้าจะเปลี่ยนไปอย่างไรเมื่อผู้ใช้มีบอทที่สามารถจัดการการโต้ตอบกับฝ่ายบริการลูกค้าและไม่ยอมแพ้หรือเหนื่อยล้า? และอาจมีการเปลี่ยนแปลงครั้งใหญ่ที่นั่น

Des: B2B ใหม่จะเป็นแบบ bot-to-bot โดยพื้นฐานแล้ว

เฟอร์กัล: อาจจะ อาจใช้เวลาสักครู่ก่อนที่ผู้ใช้จะมีเทคโนโลยีประเภทนั้น แต่เป็นสิ่งที่น่าสนใจที่ควรพิจารณา

ปริศนาความถูกต้อง

Des: โดยทั่วไปแล้วคุณคิดอย่างไรเกี่ยวกับโลกแห่งการสร้างสรรค์ที่มีสองด้านนี้ และท้ายที่สุด สิ่งที่อาจถูกมองว่าเป็นการหลอกลวง – มันดูเหมือนภาพวาด แต่ไม่ใช่ภาพวาด มันถูกสร้างขึ้น – เทียบกับการตรวจจับ ความคิดที่ผู้คนสามารถพูดได้ , “เฮ้ ฉันเป็นคนเขียนโค้ดนั้นจริงๆ มันไม่ใช่โค้ดที่สร้างขึ้นมา” มนุษยชาติมีความสำคัญเพียงใดในการนำทางโลกใบนี้? มีฉากที่โด่งดังใน Westworld ซึ่งเป็นโรงงานหุ่นยนต์ของตะวันตก ที่ชายคนหนึ่งต้องการที่จะ-

Fergal: เป็นการรีเมคของเก่า

เดส: อ๋อเหรอ? ข่าวถึงฉัน ฉันไม่รู้ว่ามันเป็นการรีเมคของเก่า แต่ใน Westworld มีฉากหนึ่งที่ผู้ชายเดินชนผู้หญิงคนหนึ่ง คุยกับเธอ แล้วในตอนท้าย เขาพูดว่า “ฉันต้องถามว่าคุณเป็นตัวจริงหรือเปล่า” คำตอบของเธอคือ “ถ้าคุณต้องถาม ทำไมมันถึงสำคัญ?” และฉันคิดว่ามีบางอย่างอยู่ที่นั่น การแซงหน้าความสามารถในการตรวจจับของเราจะถูกมองว่าเป็นคำจำกัดความของของแท้หรือไม่? ความถูกต้องเป็นสิ่งอีกต่อไปหรือไม่? ในตัวอย่างการธนาคาร คนจะพูดว่า "เฮ้ เฟอร์กัล นี่คือคุณจริงๆ หรือเป็นบอทที่คุณฝึกมา" โดยเฉพาะอย่างยิ่งถ้าคุณได้ฝึกฝนวิธีการตอบคำถามนั้น

Fergal: มีคำถามใหญ่ๆ อยู่ตรงนั้น มีคำถามอย่างน้อยห้าข้อที่ฉันอาจหลงทาง คุณสามารถพูดคุยเกี่ยวกับการทดสอบของทัวริง ซึ่งเป็นบทความเกี่ยวกับวิธีการที่เราจะสามารถบอกได้ว่าเมื่อใดที่คอมพิวเตอร์มีความฉลาดอย่างเหมาะสม และจากนั้นการทดสอบหนึ่งก็เป็นการทดสอบที่ผิดปกติ หากผู้พิพากษาที่เป็นมนุษย์สามารถแยกแยะระหว่างสองสิ่งนี้ได้อย่างน่าเชื่อถือ ผ่านทางข้อความหรืออะไรก็ตาม เราอาจพูดได้ว่ามันไม่ฉลาดเลย และเมื่อผ่านช่วงเวลานั้นไป เราก็ควรยอมรับว่ามันมีความชาญฉลาดในการใช้งาน มีการบิดเบือนความจริงมากมาย แต่งานเขียนของเขาเป็นแบบว่า “มันกำลังทำสิ่งที่น่าสนใจจริงๆ ถ้าถึงจุดนั้น” และนั่นเป็นวิธีหนึ่งในการเข้าถึงสิ่งต่าง ๆ ตามหน้าที่

“เล่าเรื่องที่เกิดขึ้นมากมาย แล้วถามคำถามที่ซับซ้อนและเป็นผลสืบเนื่องกับเรื่องนั้น แล้วมันก็จะสะดุด”

Des: และเราผ่านจุดนั้นมาแล้ว ฉันจะบอกว่า ประมาณนั้น.

Fergal: มักจะมีหัวข้อข่าวเกี่ยวกับสิ่งที่ผ่านการทดสอบของทัวริง ฉันคิดว่าสูตรดั้งเดิมเป็นเหมือนผู้ซักถามที่มีทักษะหรืออะไรซักอย่าง เรายังไม่ถึงจุดนั้น หากมีใครได้รับการฝึกฝนให้ถามคำถามที่ถูกต้อง สิ่งนี้จะพังทลายลงอย่างรวดเร็ว ไม่มีแบบจำลองโลกลึกที่มนุษย์ทำ

เดส: ถูกต้อง คุณจะทำอย่างไรในการถามคำถามอ้างอิงตนเอง? คุณจะขอให้ใครซักคนทำให้มันสะดุดทางภาษา?

Fergal: เทคโนโลยีนี้ดีขึ้นเรื่อยๆ แต่เป็นเหมือนการตั้งค่าโดเมนที่ซับซ้อนมากกว่า เล่าเรื่องที่มีหลายสิ่งหลายอย่างเกิดขึ้น แล้วถามคำถามที่ซับซ้อนและเป็นผลสืบเนื่องกับเรื่องนั้น และมันก็จะยังสะดุดอยู่ มันจะสะดุดในแบบที่เด็กไม่ทำ แต่ฉันคิดว่าวิธีคิดที่ถูกต้องเกี่ยวกับเรื่องนี้ก็คือ คุณกำลังจัดการกับหน่วยสืบราชการลับของมนุษย์ต่างดาว คุณต้องการเรียกมันว่าความฉลาด แต่มันจะมีรูปร่างที่ต่างออกไป ดังนั้น มีหลายสิ่งหลายอย่างที่เด็กอายุ 7 ขวบไม่สามารถเขียนได้ ฉันจะเขียนโปรแกรมคอมพิวเตอร์ได้ แต่สิ่งที่คุณอาจเรียกว่าการใช้เหตุผลแบบสามัญสำนึกนั้นยังไม่มี ที่พูดในเชิงปรัชญา นั่นคือการพูดถึงว่าสิ่งนี้มีชีวิตหรือไม่ และเป็นสิ่งที่สัมผัสได้ และไม่ ไม่ชัดเจน ด้วยคำจำกัดความส่วนใหญ่ที่คนส่วนใหญ่จะใช้ แต่นั่นเป็นการเบี่ยงเบนไปสู่ปรัชญาของคำถาม AI

หากต้องการกลับไปสู่จุดเดิม ถ้าคุณต้องการสร้าง CAPTCHA สำหรับระบบเหล่านี้ล่ะ มันมีลักษณะอย่างไร? ใช่ ผู้คนมีวิธีใส่ลายน้ำและตรวจหาว่าข้อความนั้นสร้างโดยโมเดลเหล่านี้หรือไม่ แต่ฉันไม่รู้ว่ามันจะเชื่อถือได้ไหมถ้าคุณมีโมเดลที่ส่งเสียงรบกวนในปริมาณที่เหมาะสมจริงๆ

สิ่งหนึ่งที่ฉันอยากจะเตือนทุกคนในสาขานี้คือมีระบบการเรียนรู้ของเครื่องและมีอยู่เช่น "ฉันจะทำให้ระบบการเรียนรู้ของเครื่องมีคุณภาพที่ดีพอที่จะถึงเกณฑ์การตรวจจับภาพที่ 99% ในชีวิตจริงได้อย่างไร" นั่นเป็นมาตรฐานเดียว และยังมีมาตรฐานอื่นทั้งหมด: ฉันจะสร้างระบบแมชชีนเลิร์นนิงให้ทำงานได้ดีเมื่อเทียบกับอินพุตของฝ่ายตรงข้ามได้อย่างไร นั่นเป็นเกมบอลที่แตกต่างอย่างสิ้นเชิง

“อย่างน้อยสักระยะหนึ่ง ผู้เล่นรายใหญ่ที่มีโมเดลภาษาขนาดใหญ่จะพยายามหยุดคุณ หากคุณใช้งานมันเพื่องานที่ชั่วร้ายเช่นนั้น”

Des: การออกแบบการป้องกัน

Fergal: การออกแบบการป้องกัน ฉันจะป้องกันการป้อนข้อมูลของฝ่ายตรงข้ามได้อย่างไร โดยทั่วไปแล้วมันยากมาก ถ้าคุณบอกฉันว่า “โอ้ ฉันมีระบบแมชชีนเลิร์นนิงแบบใหม่ที่จะตรวจจับการฉ้อโกงหรือปกป้องระบบของฉันในสภาพแวดล้อมที่ซับซ้อน” ฉันคงจะไม่เชื่ออย่างมาก มีระบบตรวจจับการฉ้อโกง แต่นั่นแตกต่างจากคนที่พยายามโจมตีระบบแมชชีนเลิร์นนิง

ฉันคิดว่าปัญหาทั้งหมดของการตรวจจับเมื่อคุณกำลังพูดคุยกับบอท เมื่อคุณกำลังพูดคุยกับโมเดลภาษาขนาดใหญ่ในขณะที่มันไม่ต้องการให้คุณทำ นั่นจะเป็นเรื่องยาก และถ้าเราจบลงด้วยสถานการณ์ในอนาคตที่การบริการลูกค้าถูกบ็อตหลอกว่าเป็นผู้ใช้ท่วมท้น นั่นก็เป็นเรื่องยุ่งยากในการจัดการ แต่ฉันคิดว่าอย่างน้อยสักระยะหนึ่ง ผู้เล่นรายใหญ่ที่มีโมเดลภาษาขนาดใหญ่จะพยายามหยุดคุณหากคุณใช้มันเพื่องานที่เลวร้ายเช่นนั้น และจะมีการควบคุมบางอย่างที่นั่นเนื่องจากโมเดลเหล่านี้มีคุณภาพสูงนั้นยากต่อการโฮสต์และรันด้วยตัวคุณเองบนฮาร์ดแวร์โมเดลสำหรับผู้บริโภคทุกประเภท สามารถมีความรับผิดชอบบางอย่าง

การหยุดชะงักที่ปรากฏ

Des: หากเราซูมขึ้นอีกนิด เราคงอยู่ไม่ไกลเกินความสามารถที่จะสร้างเพลงที่ฟังดูมีเหตุผล เพลงล็อบบี้ อะไรแบบนั้น

เฟอร์กัล: ใช่ มูซัค.

Des: Muzak แน่นอน และในระดับหนึ่ง มันก็มีเพลงสูตรสำเร็จอยู่ทั่วไป ฉันคิดว่าประมาณว่าเพลงอันดับหนึ่ง 65 เพลงมีสี่คอร์ดเหมือนกันหรืออะไรทำนองนั้น หรือเพลงที่ติดชาร์ตอันดับต้น ๆ และแน่นอนว่านวนิยายของแดน บราวน์ทั้งหมดมีรูปแบบที่เรียบง่าย นั่นไม่ได้หมายความว่ามันไม่ดี แต่สังคมจะเปลี่ยนไปในระดับไหนเมื่อสิ่งใดก็ตามที่แสดงออกมาในลักษณะที่เป็นสูตรสำเร็จสามารถทำซ้ำได้ และท้ายที่สุด คุณจะได้รับเวอร์ชัน $0 หรือไม่ The Da Vinci Code ยังคงเป็น The Da Vinci Code เป็นหนังสือที่ค่อนข้างดีตามคำนิยามทั่วไป แต่ตอนนี้คุณสามารถซื้อเวอร์ชันชั้นใต้ดินที่ต่อรองราคาได้ในราคา $0 หรือ 5 เซนต์ หรืออะไรก็ตาม จากนั้นคุณคิดว่าสิ่งนี้เกิดขึ้นกับความคิดสร้างสรรค์ทุกประเภท อีกครั้ง นี่ไม่ได้หมายความว่าผลลัพธ์ของเทคโนโลยีเหล่านี้จะเทียบเคียงได้ แต่อาจเท่ากับ 1% ของราคา คุณคิดว่าโลกเปลี่ยนไปอย่างไรในอนาคตแบบนั้น?

“มันเป็นความขัดแย้งของ Jevons บางครั้งการทำบางอย่างให้ถูกกว่าหมายความว่าคุณต้องทำมากกว่านั้นมาก พลวัตเหล่านั้นคาดเดาได้ยากจริงๆ”

Fergal: ฉันคิดในหลากหลายวิธี คุณสามารถดูการเปรียบเทียบจากอดีต คุณสามารถดูภาพวาด จากนั้นการถ่ายภาพก็เข้ามา และทันใดนั้น การถ่ายภาพทิวทัศน์ก็เป็นเรื่องง่าย แต่-

Des: ฉันแน่ใจว่าจิตรกรไม่ชอบใช่ไหม?

Fergal: ฉันไม่รู้ประวัติศาสตร์ดีพอ แต่โดยทั่วไปแล้ว มีบางคนที่อารมณ์เสียทุกครั้งที่มีการหยุดชะงัก

Des: ฉันคิดว่ามันเหมือนกันกับวิทยุหรือเทปคาสเซ็ท - นักดนตรีสดชอบ "อืม โย่ นี่เป็นงานของเรา"

เฟอร์กัล: ใช่ โรงภาพยนตร์ทุกแห่งเคยมีนักเปียโนที่จะเล่นซาวด์แทร็ก และนั่นก็หายไป เครื่องเล่นแผ่นเสียงและเปียโน เครื่องทอผ้า และเครื่องลูดไดท์... มีตัวอย่างมากมายในเรื่องนี้ และฉันคิดว่ายังมีพื้นที่อื่นๆ ที่เผชิญกับการหยุดชะงักที่ใกล้เข้ามา และจะมีการพูดคุยกันอย่างหนักเกี่ยวกับสิ่งที่มีค่า ในทำนองเดียวกัน ด้วยการสนับสนุนลูกค้า คุณต้องมีความละเอียดอ่อน มีผลลัพธ์ที่ดีกว่าและผลลัพธ์ที่แย่กว่าเสมอ ผู้คนอาจมองว่าโมเดลภาษาขนาดใหญ่เริ่มเขียนโค้ดได้ดีขึ้นและพูดว่า “เฮ้ ในฐานะโปรแกรมเมอร์ ทักษะอันมีค่านี้ที่ฉันลงทุนหลายปีเพื่อเรียนรู้ เอ้ย มันไม่มีประโยชน์อีกต่อไปแล้ว”

“จะมีตัวแทนฝ่ายสนับสนุนลูกค้าน้อยลงไหมในโลกที่มีระบบอัตโนมัติจำนวนมาก หรือจะมีมากกว่านี้เพราะมูลค่าที่พวกเขาสามารถมอบให้กับธุรกิจได้เพิ่มขึ้นหรือไม่”

มีวิธีคิดที่แตกต่างกันเกี่ยวกับเรื่องนี้ คุณสามารถคิดในแง่ของ AWS เราใช้ Amazon บ่อยมากที่ Intercom และบางทีถ้าเราต้องทำทุกอย่างที่ทำโดยไม่มี AWS มันจะทำให้เราเสียเวลามากขึ้นตามขนาดของโปรแกรมเมอร์ในการทำ หมายความว่าเราจ้างโปรแกรมเมอร์น้อยลงใช่หรือไม่ อาจหมายความว่าเราไม่สามารถทำธุรกิจได้หากปราศจากเทคโนโลยีที่เปิดใช้งาน มันคือความขัดแย้งของ Jevons - บางครั้งการทำสิ่งที่ถูกกว่าหมายความว่าคุณต้องทำมากกว่านั้นมาก การเปลี่ยนแปลงเหล่านั้นยากที่จะคาดเดาได้ จะมีตัวแทนฝ่ายสนับสนุนลูกค้าน้อยลงไหมในโลกที่มีระบบอัตโนมัติจำนวนมาก หรือจะมีมากกว่านี้เพราะมูลค่าที่พวกเขาสามารถมอบให้กับธุรกิจได้เพิ่มขึ้นหรือไม่

Des: เมื่อเราเอาของจริงมาทั้งหมด เราจะเห็นคุณค่าที่พวกเขานำมา และคุณก็จะแบบว่า “ฉันต้องการมากกว่านี้”

Fergal: คุณต้องการมากกว่านี้ คุณต้องการมากกว่านี้ จู่ๆ มันก็เหมือนกับว่า “ว้าว เราจะปลดล็อกอะไรในแง่ของมูลค่าให้กับธุรกิจของเราได้บ้าง ถ้าเรามีพนักงานเหล่านั้นจำนวนมาก” แต่ละคนสามารถทำได้มากกว่าปัจจุบันถึง 10 เท่า คุณไม่เคยรู้. ฉันคิดว่านั่นเป็นสิ่งที่พลาดไปในบางครั้ง ผู้คนมักตอบสนองต่อการหยุดชะงักทางเทคโนโลยีและมักจะพูดว่า “โอ้ คุณสามารถไต่ระดับคุณค่าและได้งานที่ดีขึ้น คุณสามารถเป็นผู้จัดการผลิตภัณฑ์ได้หากต้องการทุกที่ที่คุณต้องการ” และนั่นอาจเป็นวิธีหนึ่ง แต่อีกวิธีหนึ่งคือการทำให้สิ่งที่คุณทำอยู่มีประสิทธิผลมากขึ้นสามารถเปลี่ยนจำนวนเงินที่คุณต้องทำได้

Des: หรือธุรกิจอื่น ๆ เป็นไปได้เพราะมัน

Fergal: สามารถทำธุรกิจได้มากขึ้น นั่นคือสิ่งที่ดีที่สุด ฉันคิดว่าทั้งหมดนี้จะเกิดขึ้นกับสิ่งต่าง ๆ เช่นศิลปะ AI เห็นได้ชัดว่ามีการถกเถียงกันเกี่ยวกับการลอกเลียนแบบและการละเมิดลิขสิทธิ์ ถ้ามีคนไปฝึก DALL·E 2 กับรูปภาพทั้งชุด นั่นเป็นการละเมิดลิขสิทธิ์หรือไม่? แล้วถ้าพวกเขาเรียนรู้สไตล์ของศิลปิน แล้วคุณขอให้เขาผลิตงานแบบพวกเขาล่ะ? เป็นการละเมิดลิขสิทธิ์หรือไม่? และอาจมีหลายสิ่งหลายอย่างที่ระบบกฎหมายและสังคมจำเป็นต้องค้นหา สิ่งหนึ่งที่ฉันคิดว่าขาดหายไปจากการโต้เถียงกันในบางครั้งก็คือ แม้ว่าคุณจะตัดสินว่าการฝึกอบรมโมเดลปัจจุบันเป็นการละเมิดลิขสิทธิ์ และเราไม่ยอมรับสิ่งนั้นกับมนุษย์ มนุษย์ได้รับอนุญาตให้ดูสิ่งต่าง ๆ และคัดลอกสไตล์ของพวกเขา - บางคนจะยังคงสร้างแบบจำลองที่ได้รับการฝึกฝนจากงานที่เปิดกว้างและได้รับอนุญาต และพวกเขาจะสร้างภาพได้ค่อนข้างดี ฉันคิดว่าเรือลำนั้นแล่นไปในระดับหนึ่งแล้ว

จะไปได้ขนาดไหน

Des: ในการโยนเข็มสองสามข้อที่นี่ คุณอ้างถึง AWS เป็นตัวอย่างหนึ่งที่เราไม่มีทีมเซิร์ฟเวอร์จำนวนมากที่นี่ เราไม่มีตู้เก็บเอกสารที่เต็มไปด้วยเซิร์ฟเวอร์ ทีม AI ของคุณเล็กลงเนื่องจากการมีอยู่ของ OpenAI, Anthropic และทั้งหมดนั้นหรือไม่ หากไม่มีอยู่ คุณจะสร้างทีมเซิร์ฟเวอร์เวอร์ชัน AI หรือไม่

Fergal: ใช่ ฉันหมายถึง นั่นเป็นคำถามที่แย่มาก มีหลายวิธีในการดู ทีม AI ถูกรบกวนหรือไม่? และเราได้กลับไปกลับมาในเรื่องนี้ มาดูโมเดลภาษาขนาดใหญ่เวอร์ชันปัจจุบันกัน เมื่อเร็ว ๆ นี้ฉันเล่นกับ GPT ในฐานะผู้แนะนำภาพยนตร์ ประมาณว่า "เฮ้ ฉันชอบดู X และ Y แนะนำอะไรให้ฉันหน่อยสิ" และมันก็ไม่เลว ฉันแน่ใจว่ามันไม่ได้ดีเท่ากับโปรแกรมแนะนำที่ได้รับการปรับแต่งอย่างดีซึ่งมีข้อมูลที่ดีที่สุดทั้งหมด แต่มันทำได้ดีกว่าการเลือกภาพยนตร์แบบสุ่มมาก แล้วมันก็จะคายออกมาเหมือนกำลังใช้เหตุผล และเหตุผลก็เหมือนกับทุกสิ่งที่มันทำ แต่ก็ไม่เลว อีกครั้ง แม้ว่าเทคโนโลยีจะยังไม่ดีนัก – ฉันคงไม่รีบเร่งสร้างโปรแกรมแนะนำภาพยนตร์จากเทคโนโลยีนี้หรืออะไรก็ตาม – จะเป็นอย่างไรหากเทคโนโลยีนี้ดีขึ้น 10 เท่าหรือ 100 เท่า จะเกิดอะไรขึ้นถ้าคุณป้อนข้อมูลการฝึกอบรมมากขึ้นหรือวิธีการฝึกอบรมที่ดีขึ้น

“มีโอกาสมากมายในการผสมผสานความสามารถใหม่นี้ในสิ่งเฉพาะซึ่งทำได้ดีด้วยโครงร่างจำนวนมาก ผลิตภัณฑ์จำนวนมากช่วยแก้ปัญหานั้น”

Des: แค่รอ GPT-4

Fergal: ใช่ GPT-6 หน้าตาแบบไหน ใช่ไหม? ไม่ว่าเงิน 1 หมื่นล้านดอลลาร์จะซื้อคอมพิวเตอร์และการเสริมกำลังให้คุณ เรียนรู้ความคิดเห็นจากมนุษย์ หากเป็นเช่นนั้นจริง จะเกิดอะไรขึ้น แล้วถ้าเกิดขึ้นล่ะ? คุณยังไปสร้างระบบผู้แนะนำอยู่ไหม? มีคนขอระบบผู้แนะนำคุณ คุณจะไปทำไหม? Sam Altman ได้พูดคุยเกี่ยวกับเรื่องนี้ ลองนึกภาพว่าเราจะได้รับสิ่งนี้ในระดับมนุษย์ If you had something that was human-level general intelligence, would you need a machine learning team anymore? Or would you just sit down like, “Hi, how's it going? Today I'm going to teach you how to be a movie recommender.” You've got to give lots of examples, and it's got to be able to consume a data set about movies. But maybe it's just like, “Hey, AI system, write the code to consume the data set about movies.” ฉันไม่รู้.

“You're getting into big questions, Des. And maybe that's just where all our heads are going at the moment. But you can get into big questions about, like, by the time that's disrupted, what percentage of current human economic activity is disrupted?”

Des: Yeah, totally correct.

Fergal: But that's a very bullish case. Maybe we hit some asymptote before then, and I certainly don't think we're near that point at the moment. I think you still need your machine learning team. And I think we're certainly in this happy Jevons Paradox for a while where a lot of stuff is unlocked, and maybe we're doing slightly different work than we were before – we're certainly doing a lot more prompt engineering – but these systems are not yet good enough to just train-

Des: Yeah. To outsource the whole thing to OpenAI, and they'll solve our problems.

“If you put 100X more resources into model training or dataset creation, what return do you get? Is it 10X, a 100X, a 1000X? I don't know if anyone knows that”

Fergal: Right, yeah. I really hesitate to speculate about when. Just to give you one super concrete limitation. All these models have a prompt size. The amount of context you can pass to it with a prompt is limited. And that limit is baked in pretty low down. And so, a lot of the stuff the team is doing at the moment is around, “Hey, how do we work around that? How do we give them a relevant article?” And we're using more traditional machine learning techniques – traditional as in, invented five years ago. The classic stuff.

There are tons of opportunities with the marriage of this new capability in specific things it's good at with a lot of scaffolding, a lot of product work around that. I think there will be disruption, and it feels like extremely disruptive tech to me, particularly when you project a few years out. But we don't know how big it'll be. And I don't think anyone knows how big it'll be yet. Maybe the folks in OpenAI do. But if you put 100X more resources into model training or dataset creation, what return do you get? Is it 10X, a 100X, a 1000X? I don't know if anyone knows that. There's certainly no consensus on it.

Des: There was that quote from Sam Altman where he was asked something – I think it was some irrelevant question about challenges in San Francisco or something like that – and his answer was, “When you believe that artificial general intelligence is as close as I do, you struggle to think about any other problem.” When I read that, I was like, “Okay, well, he's certainly leaned a certain way.” Now, he could still be thinking in 20 years, but some societal problems are kind of irrelevant against the greater potential wave of what could be happening here.

“There's clearly a pitfall to avoid and an attractive pitfall to fall into”

Fergal: Yeah. Full disclaimer mode now. I think there's a lot of merit to that style of thinking, personally. I remembered there were times in the history of computation when it was like, “Oh, if you've got a million dollars to solve a computing problem and you need to solve it as soon as possible, what you need to do is sit with the million dollars for two years and then buy the fastest computer that the million could buy.

Des: I remember my own career. In 2006 or 2007, mobile websites were all the thing. Pre-iPhone, right? And people were talking about WAP and JMI files or JNI files, and everyone hyped up their mobile strategy. And literally, by the time I finished working out what I thought was the right recommendation for a client, the iPhone had launched. And I was like, “You know what? ไม่ต้องกังวลเกี่ยวกับมัน Sit on your hands. Apple's going to solve this entire problem.” And sure enough, two months later, “Hey, it turns out all our websites are mobile-ready.” Sometimes, a tech wave can be so big that any temporal thing you do will just be irrelevant against the magnitude of what's going to happen.

Fergal: Yeah, if you believe AGI is close, I guess I can logically see that position. Now, clearly, it seems like there's a terrible mistake to make there where-

Des: Yeah, where we're wrong, and you've probably just been sitting on your hands.

Fergal: You've given yourself a license to ignore terrible, terrible things. So obviously, you've got to wait, and I'm not making any judgment on that. But yeah, there's clearly a pitfall to avoid and an attractive pitfall to fall into. I think it's very hard to bet against increasingly general intelligence. And I don't know timelines and stuff, but I think there are big questions for people to think about. Now, that's definitely way outside customer support or customer service.

Des: No, yeah. Well, look, thank you very much. We'll check in in six weeks to find out that this podcast is yet again out of date. We'll see where we're at again. But for now, thank you very much.

Fergal: Thanks, Des.

CTA-Intercom-on-Product