GPT هنا لتبقى. إلى أين يأخذنا؟

نشرت: 2023-02-03

GPT تتكشف أمامنا ، ولا يفوتنا أي شيء. بينما نستكشف إمكانات هذه التقنية الجديدة وقيودها ، هل سترتقي إلى مستوى الضجيج؟

منذ إطلاقه في أواخر نوفمبر ، استحوذ ChatGPT على قلوب وعقول الناس في جميع أنحاء العالم لقدرته على توليد استجابات شبيهة بالبشر. ومع ذلك ، كما هو الحال مع أي تقنية جديدة ، غالبًا ما تكون هناك فجوة بين الضجيج والواقع. والذكاء الاصطناعي التوليدي ، على وجه الخصوص ، هو آلة الضجيج الطبيعية.

نحن نتفهم الشك - نماذج اللغة الكبيرة جيدة في الظهور بشكل معقول ، حتى عندما تكون خاطئة. لكن الحقيقة تقال ، نحن متفائلون للغاية. على مدار الأسابيع الثمانية الماضية ، قمنا ببناء ميزات مدعومة بالذكاء الاصطناعي وشحنناها إلى 160 عميلًا تجريبيًا ، وكانت التعليقات واعدة للغاية. لدرجة أنه في وقت سابق من هذا الأسبوع ، أصدرنا أنا ومدير التعلم الآلي ، Fergal Reid ، حلقة خاصة على البودكاست لمشاركة رؤيتنا حول ما بنيناه وما تعلمناه.

هذه المرة ، نتجاوز الاتصال الداخلي ، بل ونتجاوز خدمة العملاء. في حلقة اليوم ، نتعمق في كل شيء GPT - من الشك إلى دورها في اتصالات الأعمال ، من تعطيل العمل الإبداعي إلى مستقبل واجهات المستخدم.

فيما يلي بعض النقاط الرئيسية:

  • لا يقتصر التحسن على التكنولوجيا فحسب - بل إننا نتحسن في فهم ما يجب بناؤه ، وكيفية تخصيصه ودمجه ، وكل هذه الديناميكيات تدفع الصناعة إلى الأمام.
  • ربما يتم تسهيل مستقبل واجهات الإنسان والآلة من خلال الروبوتات المخصصة التي تعمل بالذكاء الاصطناعي والتي تفهم نوايا المستخدمين وتتوسط في تفاعلاتهم.
  • لقد فتحت هذه النماذج العديد من القدرات الجديدة وخدعت شخصًا في لمحة ، لكنها لا تزال تفتقر إلى المنطق المنطقي اللازم لاجتياز اختبار تورينج.
  • قد تعطل GPT صناعة خدمة العملاء ، ولكن إذا زادت الأتمتة من إنتاجية الوكيل ، فيمكنها في النهاية إطلاق العنان للقدرات التي تعزز قيمتها للأعمال.

تأكد من عدم تفويت أي من النقاط البارزة باتباع Intercom on Product على Apple Podcasts أو Spotify أو YouTube أو الحصول على موجز RSS في المشغل الذي تختاره. ما يلي هو نسخة منقحة قليلاً من الحلقة.


ما وراء الضجيج

ديس تراينور: مرحبًا ومرحبًا بكم في بودكاست الاتصال الداخلي. انضم إليّ ، مرة أخرى ، فيرغال ، وسنتحدث عن كل ما يتعلق بـ GPT. Fergal ، لقد مرت ثمانية أسابيع كاملة منذ إطلاق ChatGPT. بالفعل ، كان الناس يبنون منتجات مفيدة ضدها ، ولدينا بالفعل موجة من المتشككين يقولون إن هذه لعبة ، إنها غير ناضجة ، وليست جاهزة لأي شيء على الإطلاق ، وهي مجرد تفاعلات تقنية كلاسيكية جديدة. أين رأسك في؟ هل الشكوكية قائمة؟ هل عبرنا بعض الجرف الإدراكي الذي يهم حقًا؟

فيرغال ريد: أجل ، أعتقد أن هناك شرعية معينة للشك. هذه الأشياء تكاد تكون آلات ضجيج طبيعية. من السهل جدًا النظر إليها ورؤيتها تفعل شيئًا يبدو جيدًا. ما لم تحفر فيه حقًا ، يبدو رائعًا. وبعد ذلك ، عندما تبحث في الأمر ، فأنت مثل ، "آه ، هذا خطأ ، أشعر بالتضليل." تم تصميم هذه الآلات لتوليد أشياء معقولة ، وإذا كان ذلك ممكنًا ، ولكن الخطأ يمثل مشكلة بالنسبة لك ، فقد يكون الأمر مخيبًا للآمال للغاية. لذلك أنا أفهم الموقف الافتراضي للشك الذي يأتي به الكثير من الناس إلى هذه التقنية.

"قد تكون ChatGPT ، كما هو الحال على الإنترنت اليوم ، لعبة ، لكن هذا لا يعني أننا لا نستطيع الاستفادة من التكنولوجيا الأساسية وبناء ميزات أعمال ذات قيمة لا تصدق من ذلك"

ومع ذلك ، لطالما كنا متفائلين للغاية بشأن الذكاء الاصطناعي التوليدي ، ومنذ أن تحدثنا أخيرًا ، قمنا ببناء بعض الميزات ، وشحنناها إلى الإصدار التجريبي ، وكان لدينا 160 عميلًا في الإصدار التجريبي الخاص بنا باستخدام هذه الميزات: التلخيص ، بعض الميزات الموجودة في الملحن أكثر تجريبية لمحاولة جعل الأشخاص أسرع. ومن ثم لدينا موجة من الميزات الأخرى في شكل نموذج أولي لم تكن موجودة بعد - أشياء ذات قيمة باهظة - لكننا نعتقد أننا نرى خط رؤية لذلك. وهكذا ، نحن نتفهم الشكوك ، كنا متفائلين ، والآن لدينا بيانات - استخدام حقيقي للعملاء ، عملاء حقيقيون يخبروننا أن هناك وظيفة معينة يريدون القيام بها ، وأنهم يقومون بها طوال اليوم كل يوم ، وهي تحويلية من أجل الذي - التي. وهذا ، بالنسبة لي ، يجعل موقف الشك يبدو مهتزًا بعض الشيء.

ديس: حقيقة أن الناس يستخدمون الشيء فعليًا للقيام بأجزاء من عملهم بشكل يومي.

فيرجال: أجل. هذا هو الحكم النهائي لهذا. من الصعب جدًا أن تكون متشككًا عندما يستخدمه الناس بالفعل ، وليس مجرد لعبة. هناك خط منطقي هناك. لقد رأينا بعض المقالات في The Atlantic وأماكن مثل تلك حيث يقول الناس ، "مرحبًا ، انظروا ، هذا الشيء هو لعبة أكثر من كونه منتجًا ذو قيمة حقيقية." و ChatGPT ، كما هو الحال على الإنترنت اليوم ، قد يكون لعبة ، لكن هذا لا يعني أنه لا يمكننا أخذ التكنولوجيا الأساسية وبناء ميزات أعمال قيمة بشكل لا يصدق من ذلك.

ربما كان فريقي واحدًا من عدة فرق قامت بذلك خلال الأشهر القليلة الماضية ، ليكون مثل ، "رائع ، هذا يقدم قيمة حقيقية" ، وأعتقد أننا على الأرجح واحدة من أكبر الشركات في خدمة العملاء التي نجحت كان لدينا دورة تطوير حيث حصلنا بالفعل على هذا في أيدي مئات العملاء وحصلنا على تعليقات منه. وقد قالوا لنا حقًا ، "نعم ، هذا يوفر لي الوقت حقًا ؛ هذا يجعل وظيفتي أسرع ". نعم ، يصبح الحفاظ على الشك أكثر صعوبة. هذه حجة واحدة. أعتقد أنه يمكنك أيضًا مهاجمة الشكوك من موقع مختلف: لقد رأينا الكثير من التغريدات والمقالات المشككة في هذه التقنية لأن الجيل السابق لم يتجاوز الهوة ولم يكن تحويليًا. وهم متشككون لأن التكنولوجيا الجديدة دائمًا ما يتم المبالغة فيها. لكن هذه الحجج ليست جيدة. هذه الحجج صحيحة لبعض الوقت ثم تصبح خاطئة بشكل رهيب. يمكنك أن تفشل هنا من خلال الإفراط في التفاؤل ، ولكن يمكنك أن تفشل بنفس القدر بكونك-

ديس: فارغ ومتشائم.

فيرغال: بالضبط. فارغ ومتشائم.

"هناك الكثير من الديناميكيات التي تحدث في نفس الوقت والتي من شأنها أن تغذي وتضخم بعضها البعض"

ديس: التشابه الذي تراه هو الأشخاص الذين يتخلصون من كل فكرة جديدة لمشروع ناشئ سمعوا عنها من قبل. والشيء هو أن 90٪ من الشركات الناشئة لا تعمل. لذلك ، 90٪ من الوقت ، أنت في المكان المناسب وتبدو ذكيًا حقًا. ثم تقوم بتدمير أحد الأعمال التجارية التي تبلغ قيمتها تريليون دولار ، ويوافق الجميع ، "حسنًا ، اتضح ..." أعتقد أن نات فريدمان هو الذي قال ، "يبدو المتشائمون أذكياء ، والمتفائلون يزدادون ثراءً" أو شيء من هذا القبيل . وهناك بعض الحقيقة في ذلك عندما تضع ثقلًا وراء كل رأي: الدرجة التي تكون مخطئًا بها عندما تكون مخطئًا تهدم الدرجة التي تكون على صواب طفيفًا بها فقط من خلال كونك متشككًا في التكنولوجيا.

Fergal: نعم ، 100٪. انظر ، أنا مؤمن بالذكاء الاصطناعي وقيمته. أعتقد أن لدينا أدلة كافية على القيمة الحقيقية. على مدار العقد الماضي ، نشهد اتجاه التعلم الآلي والذكاء الاصطناعي بشكل عام يتزايد ويتزايد. لدينا قدرات جديدة. أشعر أن فريقي لديه أدلة كافية على أن هناك على الأقل بعض الإمكانات غير مقفلة لـ GPT-3.5 ونماذج اللغات الكبيرة الأخرى التي لم تكن موجودة منذ ستة أشهر. أعتقد أن هناك عبئا. هناك طريقة أكثر من المنتجات التي يمكننا بناؤها الآن والتي لم يتم بناؤها بعد مما كانت عليه. حسنًا ، نحن متفائلون ، وبدأنا نرى العملاء الذين قمنا بشحن الإصدار التجريبي منهم ليخبرونا ، "نعم ، هذا يعمل ، هذا رائع."

لم نعبر آخر قطعة منه. نحن نعلم أن هذا أمر تحويلي من حيث القيمة الأساسية للمهام التي يقضي عملاؤنا 99٪ من وقتهم في القيام بها. لذلك ، نقوم بشحن ميزة التلخيص والميزات الأخرى لتوفير الوقت في البريد الوارد. لكن هناك أشياء كبيرة قادمة إلى هنا لم نقم ببنائها بعد ، داخليًا ، نعمل عليها ، لكننا لم نراها موجودة في السوق. ولذا ، نعتقد أن الإثارة الحقيقية لهذا ما زالت قادمة.

ديس: هناك بعض التسلسل الهرمي للتحول الذي أنا متأكد من أن شخصًا ما سوف يصححني في التعليقات ، لكننا وضعنا بالفعل ميزات مباشرة لتحويل تدفقات عمل محددة ، ومن خلال التحويل ، فإننا نعني تقليل تكلفة القيام بذلك إلى 5٪ من ما كان عليه من قبل. في حالة التلخيص على سبيل المثال. بعد ذلك ، قد يؤدي ذلك إلى تحويل مهام سير العمل الشائعة جدًا. بعد ذلك ، قد يكون ذلك بمثابة تغيير في الوظيفة ، ثم تحويل المؤسسة ، وفي القمة ، يمكن تغيير العمل. ولكن من الواضح تمامًا عندما نحدد المزيد والمزيد من حالات الاستخدام حيث يمكننا تقديم الكثير من القيمة التي ننسجها من خلال هذا ، بالنسبة لي ، التحول الحتمي لعالم خدمة العملاء.

"لقد ذهبنا داخليًا إلى عملائنا واضطررنا إلى إغلاق التوظيف التجريبي في وقت أبكر بكثير مما أردناه لأنه كان أحد أكبر الردود التي تلقيناها على الإطلاق"

فيرغال: بالتأكيد. هناك العديد من الطرق التي يمكن من خلالها أن يتغير هذا بالتوازي. هناك الكثير من الديناميكيات التي تحدث في نفس الوقت والتي سوف تغذي وتضخم بعضها البعض. الأول واضح نوعًا ما: التكنولوجيا المتاحة تتحسن. هذا لا يتوقف. يقوم OpenAI ولاعبون آخرون مثل Anthropic ببناء نماذج جديدة طوال الوقت ، وهم مثيرون. هذا لا يتوقف. إذن ، هذه ديناميكية واحدة. وهناك ديناميكية أخرى ، وهي أننا نتحسن في بناء منتجات حول هؤلاء. نحن نتحسن في أخذ تلك النماذج ومعرفة نوع الشيء الذي يجيدونه. وهناك ديناميكية أخرى ، وهي أننا نتحسن في تخصيصها ، وبناء التوجيهات الصحيحة ، ودمجها في أنظمتنا الحالية. ومن ثم تزداد توقعات عملائنا أعلى وأعلى.

لقد وجدنا بالفعل أنه منذ ChatGPT ، كانت هناك موجة كبيرة من الاهتمام من عملائنا. يمكنهم رؤية الوعد ويعتقدون أن هناك شيئًا ما هنا. مع الإصدار التجريبي ، ذهبنا داخليًا إلى عملائنا واضطررنا إلى إغلاق التوظيف التجريبي في وقت أبكر بكثير مما أردناه لأنه كان أحد أكبر الردود التي تلقيناها على الإطلاق. أراد الناس أن يكونوا عليه. لذا ، فإن كل هذه الأشياء معًا سوف تتضخم أكثر بكثير من أي واحد منها بمفردها ، في رأيي.

Des: من المثير للاهتمام كيفية تقسيم ذلك. التكنولوجيا تتحسن ، قدرات الشركات تتحسن ، وهذا مجرد تبنيها في الحالات المحلية. ومن ثم تتحسن قدرة الشركات على التفكير أو تصور المنتجات والفرص الجديدة باستخدام تلك التكنولوجيا. نفس الشيء مع توقعات العملاء من التكنولوجيا. ربما لا يفصلنا سوى عام واحد عن الأشخاص الذين يتوقعون أن يكونوا قادرين على التوسع في النص داخل حقل نصي ، كمثال بسيط واحد. أنت ترى نوعًا ما هذه الأشياء تظهر في كل مكان.

فيرغال: ولو سنة. من الواضح أن الكثير منا قد شاهد إعلان Microsoft حول جلب هذه الميزات إلى Word والأشياء. وسيتغير سريعًا إذا قامت أدوات الإنتاجية المكتبية الكبيرة بهذا. يمكن أن يكون سريعًا حقًا.

صعود مساعد الذكاء الاصطناعي

ديس: ها هو نوع مختلف من الشك الذي سأتحمله - نوع يتردد صداه معي قليلاً على أي حال. أعتقد أن كيفن كانون كان لديه تغريدة مضحكة حيث قال: "المستقبل يتكون من أشخاص يستخدمون GPT للتوسع في أشياء مثل ،" أريد الوظيفة "في حرف جميل مثل" سيدي العزيز "أو" سيدتي "، بلاه ، بلاه ، بلاه ... ثم المستلم ، الذي ينقر على زر التلخيص ، ليرى أن الشخص قال للتو ، "أريد الوظيفة ، ها هي سيرتي الذاتية" ، أو أيا كان. بمعنى ما ، قد تميل إلى النظر إليهم وأن تكون مثل ، ما الهدف من كل هذا؟ لديه لغة رسمية وكتابة احترافية ، وأصبحت اللغة الإنجليزية للأعمال قناة لا طائل من ورائها للطريقة المسرحية التي نتواصل بها جميعًا ، عندما سأرسل إليك في المستقبل موجه الأوامر ، وسترد بموجبه ، مثل ، "أريد مهنة." "لا يمكنك الحصول على الوظيفة."

فيرجال: أجل. سؤال صعب. إنه تخميني بجدية. سأعطيك بعض الآراء. ربما هناك سياقات معينة ، أليس كذلك؟ دعنا نقول وثيقة قانونية. يمكنك أن تقول لشخص في فريقك القانوني ، "مرحبًا ، أحتاج إلى عقد. يجب أن تفعل X و Y و Z. " سيتحول هذا الطلب إلى 10 صفحات من المواد القانونية. سيقول المستلم ، "أوه ، هل يقوم بالأشياء الثلاثة التي قال إنه سيفعلها؟" وسيكون فريقهم القانوني ، "نعم ، إنه كذلك." هذه إحدى نهايات الحد الأقصى حيث يوجد توسع وضغط كبيران ، ولكن في بعض الحالات ذات الحافة الغريبة ، يمكن أن تظهر الفقرة رقم 13 في الصفحة الثانية في المحكمة ، وما إلى ذلك. من الواضح أن هذا مهم. لا يمكننا التخلص منه. لا يمكننا الحصول على تلك النقاط الأربع فقط. نحن بحاجة إلى كل ذلك. قد لا تعتبرها جوهرية عند كتابتها ، لكنها قد تصبح جوهرية لاحقًا. هذا يبدو وكأنه أحد المتطرفين حيث يكون مثل ، "لا ، يبدو أنه يجب أن يكون هناك ،" شيء للتعامل مع كل تلك الحالات المتطورة.

ومن المحتمل أن يكون الطرف الآخر هو الموقف الذي لا يهتم فيه المدافع والمتلقي بتلك التفاصيل. كلاهما لن يهتم أبدًا بهذه التفاصيل ، وهم فقط يلاحظون بعض النعم الاجتماعية أو الشكليات "هذه هي الطريقة التي تكتب بها خطاب عمل. أنا أكتب إلى شركة كبيرة ، من الأفضل أن أكتب خطاب عمل "، وربما تختفي هذه الأشياء.

ديس: بالطريقة نفسها ، أعتقد أن التشبيه الموجود بالنسبة لي سيكون عندما تنتقل محادثات البريد الإلكتروني إلى الرسائل القصيرة أو iMessage أو WhatsApp. فكر في كل الهراء الذي لم تعد تقوله. "أتمنى أن يجدك هذا في حالة جيدة" ، أو أيا كان. ذهب كل هذا القرف.

Fergal: قيود Twitter ، التنسيق ، الوسيط ، يمنحك الإذن بأن تكون أكثر توتيرًا. أعتقد أن هذه ديناميكية حقيقية. قد لا تكون الطريقة التي نتواصل بها والطريقة التي نكتب بها مقالة مركز المساعدة هي الطريقة المثلى لكتابتها. ربما يجب أن نكون أكثر إيجازًا. في فريق التعلم الآلي ، هناك طريقة أخرى للتفكير في هذا الأمر. مستقبل العالم سوف يكون وسيط من قبل الوكلاء. وذات مرة ، كان هذا واضحًا للجميع. متصفح الويب الخاص بك يحتوي على وكيل مستخدم يقوم بتوتيره وأشياء أخرى. وكما أقول ، فإن وكيلك يذهب ويتصفح هذا الإنترنت الغريب بكل هذه الروابط والأشياء من أجلك. ستفعل أشياء من أجلك وتعود وتخبرك بأشياء. وبعد ذلك ، كل هذه الأشياء مركزية والآن لديك محرك بحث وما إلى ذلك.

"سيكون شيئًا واحدًا إذا كان كل ما رأيناه هو إنشاء صورة DALL · E 2. لكن لا ، نحن نشهد تحولات في تركيب الصوت ، وتركيب الصور ، وفهم النص ، وتركيب النص ، وضغط النص "

هناك فكرة قديمة في مستقبل التكنولوجيا والخيال العلمي وما إلى ذلك ، أنه من المحتمل أن يكون لديك وكيل يفهمك ويفهم ما تريده وما تريده ، وذكيًا بما يكفي لمعرفة ما يلفت انتباهك وما لا يجذب انتباهك. ل. لذا من المحتمل ، في المستقبل ، أن تكون الطريقة التي يسير بها هذا الأمر أشبه بذلك. إذا كنت تريد معرفة تفاصيل معينة ، فإن البرنامج الموجود بجانبك ذكي بما يكفي لوضع ذلك في النسخة الموجزة منه. لكن من الذكاء أن تعرف أنك لا تريد أن تعرف هذه التفاصيل أيضًا وتتجاهلها.

ربما سنعيش في المستقبل حيث تتغير واجهات المستخدم ، حيث لا يتم التحكم في واجهة المستخدم الخاصة بي لعمل أو مهمة معينة من خلال هذا العمل أو تلك المهمة كما هي اليوم. بدلاً من ذلك ، إنه مخصص لي. هذا يبدو خياليًا جدًا ، لكنني أعتقد أنه سيحدث بسرعة. نماذج اللغة هذه قوية جدًا ، لقد بدأ استخدامها لكتابة التعليمات البرمجية وما إلى ذلك ، وهي قفزة قصيرة جدًا من هنا لاتخاذ إجراء مني. لقد رأينا بعض النماذج الأولية حيث يعمل الأشخاص على نماذج تفهم موقع الويب جيدًا بما يكفي لتتعرف على جملة باللغة الإنجليزية وتتصفح الموقع نيابة عنك. وبعد ذلك ، هل نتجه نحو مستقبل يتفاعل فيه الجميع مع مواقع الويب بهذه الطريقة؟ هل تحتاج إلى موقع على شبكة الإنترنت بعد الآن؟

Des: هل هذا هو تحسين محركات البحث الجديد؟ هل تتأكد من أن GPT الخاص بك يمكنه فهمك؟

فيرجال: أجل. ربما تتحول مواقع الويب إلى شيء يشبه إلى حد كبير واجهة برمجة تطبيقات يتم عرضها علنًا ، وهذا شيء به واجهة مستخدم وتنسيق لأن واجهة المستخدم يتم تنسيقها بواسطة الوكلاء.

Des: نحن جميعًا نتحدث فقط إلى Siri أو أي شيء آخر.

"ربما هذا ما سيبدو عليه مستقبل برامج الروبوت. لدينا جميعًا روبوت مخصص لنا يتعامل مع الواجهة ولا داعي للقلق كثيرًا بشأن تلك الطبقة المتوسطة "

فيرجال: نعم ، وأعتقد أن Google و Apple يمكنهما رؤية هذا المستقبل. لا نعرف الجدول الزمني ، ولكن مرة أخرى ، أداة التفكير التي أستخدمها دائمًا هي: ماذا لو كان لديك إنسان ذكي جدًا يفهمك ، وقد عمل معك ، ربما مساعدًا شخصيًا ، وكنت تتفاعل معه ، و كنت تريد حجز عطلة؟ ماذا سيسألك عن ذلك؟ وفي نصف الأشياء التي تراها على booking.com أو أي شيء آخر ، لن يطلبوا منك ذلك - سيحجزون لك العطلة فقط وربما يعودون بأسئلة توضيحية: "أوه ، لقد أردت اذهب وأقم في شقة ، لكن لا يوجد مكان هناك. هل سيفعل الفندق؟ " لكن هذه واجهة مستخدم قابلة للتكيف. مرة أخرى ، لا أركز كثيرًا على ChatGPT وما تم شحنه للتو. تأخذ سنة أو سنتين. إنها تتحرك بسرعة كبيرة. إذا كنت متشككًا بسبب القيود الحالية ، فستفعل-

Des: شكوكك ستفوت الهدف.

فيرغال: بالضبط. المحولات قوية للغاية ، وبنية المحولات التي يستخدمها الناس قوية للغاية. لقد رأينا طرائق متعددة تتحسن هنا. سيكون شيئًا واحدًا إذا كان كل ما رأيناه هو إنشاء صورة DALL · E 2. لكن لا ، نحن نشهد تحولات في تركيب الصوت ، وتركيب الصور ، وفهم النص ، وتركيب النص ، وضغط النص. نحن نشهد الكثير من التطورات المتوازية. يمكنه كتابة التعليمات البرمجية. من المحتمل أن يكون قادرًا على تشغيل موقع ويب قريبًا. لذلك ربما هذا ما سيبدو عليه المستقبل مع الروبوتات. لدينا جميعًا روبوت مخصص لنا يتعامل مع الواجهة ولا داعي للقلق كثيرًا بشأن تلك الطبقة المتوسطة.

ديس: كان أحد مشاهد النماذج الأولية الفائقة التي رأيتها على Twitter شخصًا قام بتدريب روبوت على التحدث بصوته ، كما أعتقد ، وللاتصال برقم والتنقل عبر شجرة هاتف مصرفي ، والوصول فعليًا إلى وكيل ، وطلب الحصول على كل ما لديهم رد معاملات الصرف الأجنبي أو شيء من هذا القبيل. شيء ما هذا هو نوع المعيار حيث تحتاج فقط أن تسأله ويفعلونه. وصلت إلى النهاية. وحرفيا ، قالوا فقط ، "اذهب ،" وابتعدوا. من الواضح أن هذا كان مفتعلًا بشكل فائق ، ربما كان مغلقًا للغاية ، لكنه كان لا يزال حالة استخدام حقيقية جدًا من البداية إلى النهاية يتم تنفيذها تلقائيًا.

فيرغال: أعتقد أنها منطقة مثيرة للاهتمام حقًا. نتحدث كثيرًا عن كيفية تغيير خدمة العملاء ، وأين تذهب رؤوسنا دائمًا هو ما سيحدث عندما يكون لديك روبوت مثل ChatGPT ولكنه مخصص لعملك ورائع حقًا في الإجابة على الأسئلة وستنخفض تكلفة مشكلات خدمة العملاء. لكن هناك جانب آخر لها. كيف ستتغير خدمة العملاء عندما يكون لدى المستخدم روبوت يمكنه التعامل مع تفاعلات خدمة العملاء ولا يستسلم أو يتعب؟ ومن المحتمل أن يكون هناك تغيير كبير هناك.

ديس: سيكون B2B الجديد أساسًا من نوع bot-to-bot.

فيرجال: ربما. قد يستغرق الأمر بعض الوقت قبل أن يحصل المستخدمون على هذا النوع من التكنولوجيا ، لكن من المثير للاهتمام التفكير فيه.

معضلة الأصالة

ديس: كيف تفكر عمومًا في عالم الخلق ذي الوجهين هذا ، وفي النهاية ، ما يمكن اعتباره خداعًا - يبدو هذا وكأنه لوحة ، ولكنه ليس لوحة ، لقد تم إنشاؤه - مقابل الاكتشاف ، الفكرة التي يمكن للناس قولها ، "مرحبًا ، لقد كتبت هذا الرمز يدويًا ، لم يتم إنشاء هذا الرمز." ما مدى أهمية أن تتنقل البشرية في هذا العالم؟ هناك مشهد مشهور في Westworld ، مصنع روبوتات غربي ، حيث يريد الرجل-

فيرغال: إنها إعادة صنع لشيء قديم.

Des: أوه ، أليس كذلك؟ أخبار لي. لم أكن أعلم أنها إعادة صنع لشيء قديم. لكن في Westworld ، هناك مشهد يصطدم فيه رجل بامرأة ، ويتحدث معها ، ثم في النهاية ، يقول ، "يجب أن أسأل ، هل أنت حقيقي؟" كان ردها: "إذا كان عليك أن تسأل ، فما أهمية ذلك؟" وأعتقد أن هناك شيئًا ما هناك. هل سيُنظر إلى تجاوز قدرتنا على الاكتشاف على أنه تعريف للمصادقة؟ هل الأصالة شيء بعد الآن؟ في المثال المصرفي ، كيف سيقول الشخص ، "مرحبًا ، Fergal ، هل هذا أنت بالفعل ، أم أن هذا روبوت قمت بتدريبه؟" خاصة إذا كنت قد دربته على كيفية الإجابة على هذا السؤال.

فيرجال: هناك بعض الأسئلة المهمة. هناك خمسة أسئلة على الأقل ربما فقدت أثرها. يمكنك التحدث عن اختبار تورينج ، وهو عبارة عن ورقة بحثية حكيمة للغاية حول كيف سنكون قادرين على معرفة متى أصبح الكمبيوتر ذكيًا بشكل صحيح ، ومن ثم كان أحد الاختبارات اختبارًا مختلًا وظيفيًا - إذا كان بإمكان القاضي البشري التمييز بشكل موثوق بين الاثنين عبر واجهة النص أو أيًا كان ، يمكننا القول أنه ليس ذكيًا. وعندما يمر ذلك ، يجب أن نقبل أنه ذكي وظيفيًا. لقد تم تحريفها كثيرًا ، لكن ورقته كانت أشبه ما يكون ، "إنه يفعل شيئًا مثيرًا للاهتمام حقًا إذا وصل إلى هذه النقطة." وهذه إحدى طرق التعامل مع الأشياء وظيفيًا.

"أخبر قصة حيث يوجد الكثير مما يحدث ، ثم اطرح عليها نوعًا من الأسئلة المعقدة والمتعلقة بذلك ، وستظل تتعثر"

ديس: وأود أن أقول أننا تجاوزنا ذلك. ما يقرب من ذلك.

فيرغال: هناك دائمًا عناوين رئيسية حول شيء يجتاز اختبار تورينج. أعتقد أن الصياغة الأصلية هي شيء مثل المحقق الماهر أو شيء من هذا القبيل. نحن لسنا في هذه المرحلة بعد. إذا تدرب شخص ما على طرح الأسئلة الصحيحة ، فسوف تنهار هذه الأشياء بسرعة. ليس لديها نموذج العالم العميق الذي يمتلكه الإنسان.

ديس: صحيح. كيف ستفعل خدعة طرح سؤال مرجعي ذاتي؟ هل ستطلب من شخص ما أن يفسد الأمر لغويًا؟

فيرجال: التكنولوجيا تتحسن في ذلك. لكن الأمر أشبه بإنشاء مجال معقد. أخبر قصة حيث يوجد الكثير مما يحدث ، ثم اطرح عليها نوعًا من الأسئلة المعقدة والمتعلقة بذلك ، وستظل تتعثر. سوف يتعثر بطريقة لن يفعلها الطفل. لكني أعتقد أن الطريقة الصحيحة للتفكير في هذا هي أنك تتعامل مع ذكاء فضائي. تريد أن تسميها ذكاء ، لكن ستتشكل بشكل مختلف. لذا ، ستكون مجموعة من الأشياء التي لن يتمكن طفل يبلغ من العمر سبع سنوات من كتابتها - سأكون قادرًا على كتابة برنامج كمبيوتر ، لكن ما يمكن أن تسميه التفكير المنطقي لم يتوفر بعد. ومع ذلك ، من الناحية الفلسفية ، هذا يتحدث عن ما إذا كان هذا الشيء حيًا ويستشعر الأشياء. ومن الواضح لا ، مع معظم التعريفات التي يستخدمها معظم الناس. لكن هذا نوع من الانحراف في فلسفة أسئلة الذكاء الاصطناعي.

للعودة إلى النقطة الأصلية ، ماذا لو كنت تريد إنشاء كابتشا لهذه الأنظمة؟ كيف يبدو ذلك؟ نعم ، يمتلك الأشخاص طرقًا لوضع العلامات المائية واكتشاف ما إذا كان هذا النص تم إنتاجه بواسطة هذه النماذج ، لكنني لا أعرف ما إذا كان ذلك سيكون موثوقًا إذا كان لديك نموذج جيد حقًا في ضخ الكمية المناسبة من الضوضاء.

هناك شيء واحد أحذره لأي شخص في هذا المجال وهو أن هناك أنظمة للتعلم الآلي وهناك مثل ، "كيف أجعل نظام التعلم الآلي الخاص بي يتمتع بجودة كافية بحيث يصل إلى حد اكتشاف الصور بنسبة 99٪ في الحياة الواقعية؟" هذا معيار واحد. وهناك هذا المعيار الآخر بالكامل: كيف يمكنني بناء نظام التعلم الآلي الخاص بي للعمل بشكل جيد مقارنة بالإدخال العدائي؟ هذه لعبة كرة مختلفة تمامًا.

"لفترة من الوقت ، على الأقل ، سيحاول أي لاعب كبير لديه نموذج لغة كبير إيقافك إذا كنت تستخدمه في مهام شائنة من هذا القبيل"

ديس: تصميم دفاعي.

Fergal: تصميم دفاعي. كيف يمكنني الدفاع ضد التدخلات العدائية؟ وبشكل عام ، هذا صعب حقًا. إذا أخبرتني ، "أوه ، لديّ نظام جديد للتعلم الآلي من شأنه أن يكتشف الاحتيال أو يحمي نظامي في بيئة معقدة ،" سأكون متشككًا للغاية. هناك أنظمة للكشف عن الاحتيال ، لكن هذا يختلف عن شخص يحاول مهاجمة نظام التعلم الآلي.

أعتقد أن هذه المشكلة برمتها تتعلق بالكشف عندما تتحدث إلى روبوت ، عندما تتحدث إلى نموذج لغة كبير عندما لا يريدك ذلك ، سيكون ذلك صعبًا. وإذا انتهى بنا المطاف في موقف في المستقبل حيث تغرق خدمة العملاء من قبل الروبوتات التي تتظاهر بأنها مستخدمين ، فسيكون من الصعب التعامل معها. لكني أتخيل أنه لفترة من الوقت ، على الأقل ، سيحاول أي لاعب كبير لديه نموذج لغوي كبير أن يمنعك إذا كنت تستخدمه في مهام شائنة من هذا القبيل. وسيكون هناك بعض التحكم هناك لأن هذه النماذج ذات الجودة العالية يصعب استضافتها وتشغيلها بنفسك على أي نوع من عناصر الأجهزة ذات الطراز الاستهلاكي. يمكن أن يكون هناك بعض المساءلة.

الاضطرابات التي تلوح في الأفق

ديس: إذا قمنا بالتكبير قليلاً ، فمن المحتمل أننا لسنا بعيدين جدًا عن القدرة على إنشاء موسيقى ذات صوت معقول. موسيقى اللوبي ، هذا النوع من الأشياء.

فيرجال: أجل. موزك.

Des: Muzak بالضبط. وإلى حد ما ، هناك أغانٍ ذات صيغة عامة - أعتقد أن شيئًا مثل 65 أغنية رقم واحد لها نفس الأوتار الأربعة أو شيء من هذا القبيل ، أو الأغاني الأكثر شهرة على أي حال. ومن الواضح أن روايات دان براون كلها تتبع تنسيقًا بسيطًا. هذا لا يعني أنه سيء ​​، ولكن إلى أي درجة يتغير المجتمع عندما يمكن تكرار أي شيء يتم التعبير عنه إلى حد ما في طبيعة معادلة ، وفي النهاية ، يمكنك الحصول على نسخة منه بقيمة 0 دولار؟ لا يزال كود دافنشي هو كود دافنشي ، إنه كتاب جيد جدًا بأي تعريف عادي ، ولكن يمكنك الآن الحصول على النسخة السفلية منه مقابل 0 دولار أو خمسة سنتات أو أي شيء آخر. وبعد ذلك ، تفكر في حدوث ذلك عبر كل نوع من أنواع الإبداع. مرة أخرى ، هذا لا يعني أن مخرجات هذه التقنيات ستكون قابلة للمقارنة ، لكن من المحتمل أن تكون 1٪ من السعر. كيف تعتقد أن العالم يتغير في هذا النوع من المستقبل؟

"إنها مفارقة جيفونز - في بعض الأحيان ، يعني جعل شيء ما أرخص أنك تفعل الكثير منه. من الصعب حقًا التنبؤ بهذه الديناميكيات "

فيرغال: أفكر بطرق مختلفة. يمكنك النظر إلى المقارنات من الماضي. يمكنك إلقاء نظرة على الرسم ، ثم جاء التصوير الفوتوغرافي ، وفجأة أصبح من السهل التقاط صورة طبيعية ولكن-

Des: أنا متأكد من أن الرسامين لم يعجبهم ، أليس كذلك؟

فيرغال: لا أعرف التاريخ جيدًا بما فيه الكفاية ، ولكن بشكل عام ، هناك بعض المسؤولين الحاليين الذين ينزعجون كلما حدث اضطراب.

ديس: أعتقد أنه كان الأمر نفسه مع الراديو أو شرائط الكاسيت - كان الموسيقيون الحيون مثل ، "حسنًا ، لقد كانت هذه هي مهمتنا."

فيرجال: أجل. كان في كل سينما عازف بيانو يعزف الموسيقى التصويرية ، وقد اختفى ذلك الأمر. أجهزة التوليف بالغراموفون والبيانو ، والنول واللوديت ... هناك أمثلة لا حصر لها على ذلك. وأعتقد أن هناك مناطق أخرى تواجه اضطرابًا وشيكًا ، وستكون هناك محادثات صعبة حول ما هو ذي قيمة. وبالمثل ، مع دعم العملاء ، يجب أن تكون حساسًا. هناك دائما نتائج أفضل ونتائج أسوأ. قد ينظر الناس إلى نماذج اللغة الكبيرة التي تتحسن في كتابة الكود ويقولون ، "مرحبًا ، كمبرمج ، هذه المهارة القيمة التي استثمرت سنوات في الحصول عليها ، يا إلهي ، لن تكون مفيدة بعد الآن."

"هل سيكون هناك عدد أقل من ممثلي دعم العملاء في عالم به الكثير من الأتمتة ، أم سيكون هناك المزيد لأن القيمة التي يمكن أن يضيفوها إلى الأعمال التجارية قد تضخمت؟"

هناك طرق مختلفة للتفكير في هذا. يمكنك التفكير في الأمر من حيث AWS. نحن نستخدم Amazon كثيرًا في Intercom ، وربما ، إذا اضطررنا إلى القيام بكل ما فعلناه بدون AWS ، فسوف يكلفنا ذلك المزيد من الطلبات الضخمة من وقت المبرمج للقيام بذلك. هل هذا يعني أننا نوظف عددًا أقل من المبرمجين نتيجة لذلك؟ حسنًا ، ربما يعني هذا أننا لن نكون مجديين كشركة تجارية بدون تلك التقنية التمكينية. إنها مفارقة Jevons - في بعض الأحيان ، يعني جعل شيء ما أرخص أنك تفعل الكثير منه. من الصعب حقا التنبؤ بهذه الديناميات. هل سيكون هناك عدد أقل من ممثلي دعم العملاء في عالم به الكثير من الأتمتة ، أم سيكون هناك المزيد لأن القيمة التي يمكن أن يضيفوها إلى الأعمال التجارية قد تضخمت؟

ديس: عندما نأخذ كل الأشياء الحقيقية ، فإننا نرى في الواقع القيمة التي يجلبونها ، وأنت مثل ، "أريد المزيد من ذلك."

فيرغال: تريد المزيد من ذلك ؛ أنت بحاجة إلى المزيد من ذلك. فجأة يبدو الأمر مثل ، "واو ، ما الذي يمكننا فتحه من حيث القيمة لأعمالنا إذا كان لدينا الكثير من هؤلاء المندوبين؟" كل واحد يمكن أن يفعل 10 مرات أكثر مما يفعل حاليا. أنت لا تعرف أبدا. أعتقد أن هذا شيء يتم تفويته أحيانًا. يستجيب الناس دائمًا للاضطراب التكنولوجي ويتحدثون دائمًا عن ، "أوه ، يمكنك تسلق سلم القيمة والحصول على وظيفة أفضل. يمكنك أن تصبح مدير منتج إذا كان هذا هو المكان الذي تريد الذهاب إليه ". ومن المحتمل أن تكون هذه طريقة واحدة. ولكن هناك طريقة أخرى وهي أن مجرد زيادة الإنتاجية فيما تفعله حاليًا يمكن أن يغير المقدار الذي تحتاج إلى القيام به.

Des: أو يصبح من الممكن المزيد من الأعمال بسبب ذلك.

فيرجال: المزيد من الأعمال التجارية أصبحت ممكنة. هذا أفضل شيء. أعتقد أن كل هذا سيتجلى مع أشياء مثل فن الذكاء الاصطناعي. من الواضح أن هناك نقاشًا حول الانتحال وانتهاك حقوق النشر. إذا ذهب شخص ما ودرب DALL · E 2 على مجموعة كاملة من الصور ، فهل كان ذلك انتهاكًا لحقوق الطبع والنشر؟ وماذا لو تعلموا أسلوب الفنان ثم طلبت منه إنتاج أعمال مثل أعمالهم؟ هل هذا التعدي على حق المؤلف؟ ومن المحتمل أن يكون هناك الكثير من الأشياء التي تحتاج الأنظمة القانونية والمجتمع إلى اكتشافها. أعتقد أن هناك شيئًا واحدًا يفتقده النقاش أحيانًا وهو أنه حتى لو قررت أن تدريب النماذج الحالية يعد انتهاكًا لحقوق الطبع والنشر - ونحن لا نقبل ذلك مع البشر ؛ يُسمح للبشر بالنظر إلى الأشياء ونسخ أسلوبهم - سيظل شخص ما يبني نماذج مدربة على عمل مفتوح ومسموح به ، وسيصبحون جيدًا جدًا في إنشاء الصور. أعتقد أن هذه السفينة قد أبحرت إلى حد ما.

ما هو حجمها؟

Des: للتخلص من بعض الإبر هنا ، أشرت إلى AWS كمثال واحد حيث لا يوجد لدينا فريق خوادم ضخم هنا. ليس لدينا خزانات لحفظ الملفات مليئة بالخوادم. هل فريق الذكاء الاصطناعي الخاص بك أصغر بسبب وجود OpenAI و Anthropic وكل ذلك؟ إذا لم تكن موجودة ، فهل ستنشئ نسخة AI من فريق الخادم؟

فيرغال: نعم ، أعني ، هذا سؤال جحيم. هناك طرق مختلفة للنظر إليه. هل يتعرض فريق الذكاء الاصطناعي للاضطراب؟ وقد ذهبنا في هذا الأمر ذهابًا وإيابًا. لنلقِ نظرة على الإصدار الحالي من نماذج اللغات الكبيرة. كنت ألعب مع GPT مؤخرًا كمرشح فيلم. إنه مثل ، "مرحبًا ، أحب مشاهدة X و Y. اقترح علي شيئًا؟" وهذا ليس سيئا. أنا متأكد من أنه ليس جيدًا مثل المُرشح الذي تم ضبطه جيدًا والذي حصل على أفضل البيانات ، لكنه يعمل بشكل أفضل بكثير من الاختيار العشوائي للأفلام. وسيخرج ، سيبصق كما لو كان المنطق. ومنطقه ، مثل كل ما يفعله ، معقول ، لكنه ليس سيئًا. لذا مرة أخرى ، حتى لو لم تكن التكنولوجيا رائعة الآن - لن أتسرع في إنتاج منتج أو أي شيء من هذا الفيلم - ماذا لو كانت أفضل 10 مرات أو 100 مرة؟ ماذا لو قمت بتزويدها بمزيد من بيانات التدريب أو طريقة أفضل لنظام التدريب؟

"هناك الكثير من الفرص مع تزاوج هذه القدرة الجديدة في أشياء محددة جيدة مع الكثير من السقالات ، والكثير من العمل حول ذلك المنتج"

Des: فقط انتظر GPT-4.

Fergal: نعم ، GPT-6 ، مهما كان شكله ، أليس كذلك؟ مهما كانت 10 مليارات دولار تشتريها من الحوسبة والتعزيزات ، تعلم ردود الفعل البشرية ، إذا كان هذا ، في الواقع ، ما يحدث. وماذا لو حدث ذلك؟ هل مازلت تقوم ببناء نظام التوصية؟ يسألك شخص ما عن نظام التوصية ، هل تذهب لتفعل ذلك؟ ألقى سام التمان محادثات حول هذا الموضوع. تخيل أننا يمكن أن نجعل هذا على المستوى البشري. If you had something that was human-level general intelligence, would you need a machine learning team anymore? Or would you just sit down like, “Hi, how's it going? Today I'm going to teach you how to be a movie recommender.” You've got to give lots of examples, and it's got to be able to consume a data set about movies. But maybe it's just like, “Hey, AI system, write the code to consume the data set about movies.” لا أعلم.

“You're getting into big questions, Des. And maybe that's just where all our heads are going at the moment. But you can get into big questions about, like, by the time that's disrupted, what percentage of current human economic activity is disrupted?”

Des: Yeah, totally correct.

Fergal: But that's a very bullish case. Maybe we hit some asymptote before then, and I certainly don't think we're near that point at the moment. I think you still need your machine learning team. And I think we're certainly in this happy Jevons Paradox for a while where a lot of stuff is unlocked, and maybe we're doing slightly different work than we were before – we're certainly doing a lot more prompt engineering – but these systems are not yet good enough to just train-

Des: Yeah. To outsource the whole thing to OpenAI, and they'll solve our problems.

“If you put 100X more resources into model training or dataset creation, what return do you get? Is it 10X, a 100X, a 1000X? I don't know if anyone knows that”

Fergal: Right, yeah. I really hesitate to speculate about when. Just to give you one super concrete limitation. All these models have a prompt size. The amount of context you can pass to it with a prompt is limited. And that limit is baked in pretty low down. And so, a lot of the stuff the team is doing at the moment is around, “Hey, how do we work around that? How do we give them a relevant article?” And we're using more traditional machine learning techniques – traditional as in, invented five years ago. The classic stuff.

There are tons of opportunities with the marriage of this new capability in specific things it's good at with a lot of scaffolding, a lot of product work around that. I think there will be disruption, and it feels like extremely disruptive tech to me, particularly when you project a few years out. But we don't know how big it'll be. And I don't think anyone knows how big it'll be yet. Maybe the folks in OpenAI do. But if you put 100X more resources into model training or dataset creation, what return do you get? Is it 10X, a 100X, a 1000X? I don't know if anyone knows that. There's certainly no consensus on it.

Des: There was that quote from Sam Altman where he was asked something – I think it was some irrelevant question about challenges in San Francisco or something like that – and his answer was, “When you believe that artificial general intelligence is as close as I do, you struggle to think about any other problem.” When I read that, I was like, “Okay, well, he's certainly leaned a certain way.” Now, he could still be thinking in 20 years, but some societal problems are kind of irrelevant against the greater potential wave of what could be happening here.

“There's clearly a pitfall to avoid and an attractive pitfall to fall into”

Fergal: Yeah. Full disclaimer mode now. I think there's a lot of merit to that style of thinking, personally. I remembered there were times in the history of computation when it was like, “Oh, if you've got a million dollars to solve a computing problem and you need to solve it as soon as possible, what you need to do is sit with the million dollars for two years and then buy the fastest computer that the million could buy.

Des: I remember my own career. In 2006 or 2007, mobile websites were all the thing. Pre-iPhone, right? And people were talking about WAP and JMI files or JNI files, and everyone hyped up their mobile strategy. And literally, by the time I finished working out what I thought was the right recommendation for a client, the iPhone had launched. And I was like, “You know what? Don't worry about it. Sit on your hands. Apple's going to solve this entire problem.” And sure enough, two months later, “Hey, it turns out all our websites are mobile-ready.” Sometimes, a tech wave can be so big that any temporal thing you do will just be irrelevant against the magnitude of what's going to happen.

Fergal: Yeah, if you believe AGI is close, I guess I can logically see that position. Now, clearly, it seems like there's a terrible mistake to make there where-

Des: Yeah, where we're wrong, and you've probably just been sitting on your hands.

Fergal: You've given yourself a license to ignore terrible, terrible things. So obviously, you've got to wait, and I'm not making any judgment on that. But yeah, there's clearly a pitfall to avoid and an attractive pitfall to fall into. I think it's very hard to bet against increasingly general intelligence. And I don't know timelines and stuff, but I think there are big questions for people to think about. Now, that's definitely way outside customer support or customer service.

Des: No, yeah. Well, look, thank you very much. We'll check in in six weeks to find out that this podcast is yet again out of date. We'll see where we're at again. But for now, thank you very much.

Fergal: Thanks, Des.

CTA-Intercom-on-Product