GPT kalıcı olarak burada. Bizi nereye götürecek?

Yayınlanan: 2023-02-03

GPT önümüzde gelişiyor ve hiçbir anı kaçırmıyoruz. Bu yeni teknolojinin potansiyelini ve sınırlamalarını keşfederken, abartıya kadar yaşayacak mı?

ChatGPT, Kasım ayı sonlarında kullanıma sunulduğundan bu yana, insan benzeri yanıtlar üretme yeteneğiyle dünyanın dört bir yanındaki insanların kalplerini ve zihinlerini fethetti. Bununla birlikte, herhangi bir yeni teknolojide olduğu gibi, genellikle yutturmaca ile gerçeklik arasında bir boşluk vardır. Ve özellikle üretken AI, oldukça doğal bir yutturmaca makinesidir.

Şüpheciliği anlıyoruz - büyük dil modelleri, yanlış olduklarında bile makul görünmek konusunda harikadır. Ama doğruyu söylemek gerekirse çok iyimseriz. Geçtiğimiz sekiz hafta boyunca yapay zeka destekli özellikler oluşturduk ve bunları 160 beta müşteriye gönderdik ve geri bildirimler ezici bir çoğunlukla umut verici oldu. Öyle ki, bu haftanın başlarında, Makine Öğrenimi Direktörümüz Fergal Reid ve ben, neleri inşa ettiğimiz ve neler öğrendiğimizle ilgili içgörülerimizi paylaşmak için podcast'te özel bir bölüm yayınladık.

Bu sefer Intercom'un ve hatta müşteri hizmetlerinin ötesine geçiyoruz. Bugünün bölümünde, şüphecilikten iş iletişimindeki rolüne, yaratıcı çalışmanın kesintiye uğramasından kullanıcı arayüzlerinin geleceğine kadar GPT ile ilgili her şeyi araştırıyoruz.

İşte önemli çıkarımlardan bazıları:

Gelişen sadece teknoloji değil; ne inşa edeceğimizi, onu nasıl özelleştireceğimizi ve entegre edeceğimiz konusunda daha iyi hale geliyoruz ve tüm bu dinamikler sektörü ileriye taşıyor.
Belki de insan-makine arayüzlerinin geleceği, kullanıcıların niyetlerini anlayan ve etkileşimlerine aracılık eden kişiselleştirilmiş yapay zeka destekli botlar tarafından kolaylaştırılacaktır.
Bu modeller birçok yeni yeteneğin kilidini açtı ve bir bakışta birini kandırdı, ancak yine de Turing testini geçmek için gereken sağduyulu akıl yürütmeden yoksunlar.
GPT, müşteri hizmetleri endüstrisini sekteye uğratabilir, ancak otomasyon, aracının üretkenliğini artırırsa, sonuçta onların iş için değerini artıran yeteneklerin kilidini açabilir.

Intercom on Product'ı Apple Podcasts, Spotify, YouTube üzerinden takip ederek veya seçtiğiniz oynatıcıda RSS beslemesini alarak öne çıkan hiçbir şeyi kaçırmadığınızdan emin olun. Aşağıda, bölümün hafifçe düzenlenmiş bir kopyası var.

Aldatmacanın ötesinde

Des Traynor: Merhaba, Intercom podcast'ine hoş geldiniz. Yine Fergal bana katıldı ve GPT ile ilgili her şey hakkında konuşacağız. Fergal, ChatGPT'nin başlatılmasından bu yana tam sekiz hafta geçti. Daha şimdiden insanlar buna karşı faydalı ürünler üretiyorlar ve şimdiden bunun bir oyuncak olduğunu, olgunlaşmamış olduğunu, hiçbir şeye hazır olmadığını söyleyen bir şüphe dalgası aldık, ki bu sadece klasik yeni teknoloji tepkileri. Kafan nerede? Şüphecilik kuruldu mu? Gerçekten önemli olan algısal bir uçurumu aştık mı?

Fergal Reid: Evet, bence şüphecilikte belli bir haklılık payı var. Bu şeyler neredeyse doğal yutturmaca makineleridir. Ona bakmak ve iyi görünen bir şey yaptığını görmek çok kolay. Gerçekten içine girmezsen, harika görünüyor. Ve sonra, onu derinlemesine incelediğinizde, "Ah, bu yanlış, yanıltılmış hissediyorum" dersiniz. Bu makineler makul şeyler üretmek için tasarlanmıştır ve makul, ancak yanlışsa sizin için bir sorundur, çok hayal kırıklığı yaratabilir. Bu yüzden, birçok insanın bu teknolojiye geldiği varsayılan şüphecilik konumunu anlıyorum.

"Bugün internette olduğu şekliyle ChatGPT bir oyuncak olabilir, ancak bu, altta yatan teknolojiyi alıp ondan inanılmaz derecede değerli iş özellikleri oluşturamayacağımız anlamına gelmez"

Ancak, üretken yapay zeka konusunda her zaman çok iyimser olduk ve son konuştuğumuzdan beri bazı özellikler oluşturduk, bunları Beta'ya gönderdik, Beta'mızda şu özellikleri kullanan 160 küsur müşterimiz oldu: özetleme, bazı Bestecideki özellikler, insanları daha hızlı denemek ve yapmak için daha deneysel. Ve sonra, prototip formda henüz tam olarak orada olmayan bir dizi başka özellik dalgamız var - yüksek bilet değerli şeyler - ama buna bir görüş hattı gördüğümüzü düşünüyoruz. Ve böylece, şüpheciliği anlıyoruz, iyimserdik ve şimdi elimizde veriler var - gerçek müşteri kullanımı, gerçek müşteriler bize yapmak istedikleri belirli bir iş olduğunu söylüyor, her gün tüm gün yapıyorlar ve bu iş için dönüştürücü. o. Ve bu, benim için şüphecilik konumunun biraz sallantılı görünmesine neden oluyor.

Des: İnsanların bu şeyi aslında günlük olarak işlerinin bazı kısımlarını yapmak için kullanıyor olmaları.

Fergal: Evet. Bu işin nihai hakemi bu. İnsanlar onu sadece bir oyuncak olarak değil de gerçekten kullandıklarında şüpheci olmak çok zor. Ortada bir mantık var. The Atlantic'te ve buna benzer yerlerde insanların "Hey, bak, bu şey gerçekten değerli bir üründen çok bir oyuncak" dediği bazı makaleler gördük. Ve bugün internette olduğu şekliyle ChatGPT bir oyuncak olabilir, ancak bu, altta yatan teknolojiyi alıp ondan inanılmaz derecede değerli iş özellikleri oluşturamayacağımız anlamına gelmez.

Ekibim muhtemelen son birkaç aydır bunu yapan ve "Vay canına, bu gerçek değer sağlıyor" diyen birkaç ekipten biri oldu ve bence müşteri hizmetlerinde başarılı bir şekilde başarılı olan en büyük şirketlerden biriyiz. Bunu yüzlerce müşterinin eline verdiğimiz ve geri bildirim aldığımız bir geliştirme döngüsüne sahiptik. Ve bize gerçekten, “Evet, bu bana gerçekten zaman kazandırıyor; bu işimi hızlandırıyor.” Evet, şüpheciliği sürdürmek zorlaşıyor. Bu bir argüman. Şüpheciliğe farklı bir konumdan da saldırabileceğinizi düşünüyorum: Bu teknoloji hakkında şüpheci birçok tweet dizisi ve makale gördük çünkü önceki nesil uçurumu aşamadı ve dönüştürücü değildi. Ve şüpheci davranıyorlar çünkü yeni teknoloji her zaman abartılıyor. Ama bunlar iyi argümanlar değil. Bunlar bir süreliğine doğru olan ve sonra feci şekilde yanlış hale gelen argümanlardır. Aşırı iyimser davranarak burada başarısız olabilirsiniz, ancak aynı ölçüde başarısız olabilirsiniz...

Des: Boş ve karamsar.

Fergal: Aynen. Boş ve kötümser.

“Aynı anda meydana gelen ve birbirini besleyecek ve büyütecek pek çok dinamik var”

Des: Gördüğünüz paralellik, duydukları her yeni girişim fikrini çöpe atan insanlar. Ve olay şu ki, girişimlerin %90'ı işe yaramıyor. Yani, zamanın %90'ında farkedersiniz ve gerçekten akıllı görünürsünüz. Sonra trilyon dolarlık bir iş haline gelen bir işi çöpe atıyorsun ve herkes "Doğru, ortaya çıktı..." "Kötümserler zekice konuşuyor, iyimserler zengin oluyor" diyen Nat Friedman'dı ya da buna benzer bir şey. . Ve her görüşün arkasına gerçekten ağırlık verdiğinizde bunda bazı gerçekler var: yanıldığınızda ne kadar yanıldığınızın derecesi, sadece teknolojiye şüpheci davranarak az da olsa haklı olduğunuz dereceyi zorlar.

Fergal: Evet, %100. Bakın, yapay zekaya ve değerine inanıyorum. Bence gerçek değere dair yeterince kanıtımız var. Son on yılda, genel olarak makine öğrenimi ve yapay zeka trendinin arttığını ve arttığını görüyoruz. Yeni yeteneklerimiz var. Ekibimin, en azından GPT-3.5 ve diğer büyük dil modelleri için altı ay önce olmayan bazı yeteneklerin kilidi açıldığına dair yeterli kanıta sahip olduğunu düşünüyorum. Bir çıkıntı olduğuna inanıyorum; şimdi inşa edebileceğimiz, henüz yapılmamış çok daha fazla ürün var. Yani evet, yükselişe geçtik ve betayı gönderdiğimiz müşterilerin bize "Evet, bu işe yarıyor, bu harika" dediğini görmeye başlıyoruz.

Son parçasını tam olarak geçemedik. Bunun, müşterilerimizin zamanlarının %99'unu yapmak için harcadıkları görevler için temel değer açısından dönüştürücü olduğunu biliyoruz. Bu nedenle, gelen kutusunda zaman kazanmak için özetleme özelliğini ve diğer özellikleri gönderiyoruz. Ama buraya henüz inşa etmediğimiz, dahili olarak üzerinde çalıştığımız ama onları dışarıda bir pazar yerinde görmediğimiz büyük şeyler geliyor. Ve böylece, bunun gerçek heyecanının hala geldiğini düşünüyoruz.

Des: Yorumlarda birisinin beni düzelteceğinden emin olduğum bir dönüşüm hiyerarşisi var, ancak belirli iş akışlarını dönüştürmek için canlı özellikler ekledik ve dönüştürmekle, bunu yapmanın maliyetini %5'e düşürmeyi amaçlıyoruz. bir zamanlar neydi. Özetleme söz konusu olduğunda. Ardından, çok yaygın iş akışlarını dönüştürüyor olabilir. Daha sonra işi dönüştürebilir, ardından kuruluşu dönüştürebilir ve en üstte işi dönüştürebilir. Ancak, çok fazla değer sunabileceğimiz daha fazla kullanım durumu belirledikçe, bana göre müşteri hizmetleri dünyasının kaçınılmaz dönüşümü olan bu süreçte yolumuzu ördüğümüz oldukça açık.

"Müşterilerimize dahili olarak gittik ve beta işe alımını istediğimizden çok daha erken bitirmek zorunda kaldık çünkü bu şimdiye kadar aldığımız en büyük yanıtlardan biriydi"

Fergal: Kesinlikle. Bunun paralel olarak değişmesinin birçok yolu var. Aynı anda meydana gelen ve birbirini besleyecek ve büyütecek pek çok dinamik var. İlki oldukça açık: mevcut teknoloji daha iyi hale geliyor. Bu durmuyor. OpenAI ve Anthropic gibi diğer oyuncular her zaman yeni modeller geliştiriyor ve bunlar heyecan verici. Bu durmuyor. Yani, bu bir dinamik. Ve başka bir dinamik daha var, o da ürünleri bunlara göre inşa etmede daha iyi hale geliyoruz. Bu modelleri alıp ne tür şeylerde iyi olduklarını bulma konusunda giderek daha iyi hale geliyoruz. Ve başka bir dinamik daha var, o da onları özelleştirme, doğru istemleri oluşturma ve mevcut sistemlerimize entegre etme konusunda daha iyi hale geliyoruz. Ve sonra müşterilerimizin beklentileri daha da yükseliyor.

ChatGPT'den bu yana müşterilerimizden büyük bir ilgi dalgası geldiğini gerçekten gördük. Sözü görebilirler ve burada bir şey olduğuna inanabilirler. Beta ile, müşterilerimize dahili olarak gittik ve beta işe alımını istediğimizden çok daha erken bitirmek zorunda kaldık çünkü bu şimdiye kadar aldığımız en büyük yanıtlardan biriydi. İnsanlar üzerinde olmak istedi. Yani, bence bunların hepsi birlikte, tek başlarına herhangi birinden çok daha fazla büyüyecek.

Des: Bunu nasıl parçalara ayırdığın ilginç. Teknoloji gelişiyor, işletmelerin yetenekleri gelişiyor ve bu sadece onu yerel durumlarda benimsemek. Ardından işletmelerin bu teknolojiyi kullanarak yeni ürünler ve fırsatlar hakkında düşünme veya kavramsallaştırma becerileri gelişiyor. Teknolojiden müşteri beklentileri ile aynı. Basit bir örnek olarak, bir metin alanı içindeki metni genişletebilmeyi bekleyen insanlardan muhtemelen yalnızca bir yıl uzaktayız. Bu şeylerin her yerde ortaya çıktığını görüyorsun.

Fergal: Bir yıl bile olsa. Açıkçası, çoğumuz Microsoft'un bu özellikleri Word'e ve diğer şeylere getirme konusundaki duyurusunu gördük. Ve büyük ana akım ofis üretkenlik araçları bunu yaparsa, hızla değişecektir. Gerçekten hızlı olabilir.

AI asistanının yükselişi

Des: İşte suçlamada bulunacağım farklı bir şüphecilik türü - her halükarda bende biraz yankı uyandıran bir şüphecilik. Kevin Cannon'ın komik bir tweet'i olduğunu düşünüyorum, "Gelecek, 'İşi istiyorum' gibi şeyleri 'Sevgili Efendim' veya 'Madam' gibi sevimli bir mektuba genişletmek için GPT kullanan insanlardan oluşuyor. , filan… Ve sonra alıcı, özetleme düğmesini tıklatarak, kişinin az önce 'İşi istiyorum, işte özgeçmişim' ya da her neyse dediğini görmek için. Bir anlamda, onlara bakıp, bütün bunların ne anlamı var? Resmi dil, profesyonel yazı ve iş İngilizcesi, hepimizin iletişim kurması için anlamsız bir kanal haline geldi mi, gelecekte size istemi göndereceğim ve siz de "İstiyorum" gibi bir istemle yanıt vereceksiniz. Görev." "İşi alamazsın."

Fergal: Evet. Zor soru. Cidden spekülatif. Size bazı görüşler vereceğim. Muhtemelen belirli bağlamlar vardır, değil mi? Yasal bir belge diyelim. Hukuk ekibinizden birine “Hey, bir sözleşmeye ihtiyacım var. X, Y ve Z yapmak zorunda.” Bu istek 10 sayfalık yasal malzemeye dönüşecek. Alıcı, "Ah, yapacağını söylediği üç şeyi yapıyor mu?" Ve hukuk ekipleri "Evet, öyle" olacak. Bu, büyük genişleme ve sıkıştırmanın olduğu uç noktanın bir ucudur, ancak bazı garip son durumlarda, ikinci sayfadaki 13 numaralı madde mahkemede ortaya çıkabilir ve bu böyle devam eder. Açıkçası, bu önemli. Ondan kurtulamayız. Sadece bu dört madde işaretine sahip olamayız. Bütün bunlara ihtiyacımız var. Yazarken önemli görmeyebilirsiniz, ancak daha sonra önemli hale gelebilir. Bu, tüm bu uç vakalarla başa çıkmak için "Hayır, orada olması gerektiği gibi geliyor" gibi bir uç nokta gibi geliyor.

Ve diğer aşırı uç, muhtemelen, savunanın ve alıcının bu ayrıntıları umursamadığı bir durumdur. Her ikisi de bu ayrıntıları asla umursamayacak ve sadece bazı sosyal zarafetleri veya formaliteleri gözlemliyorlar, “iş mektubu böyle yazılır. Büyük bir şirkete yazıyorum, bir iş mektubu yazsam iyi olur” ve belki o şeyler geçecek.

Des: Aynı şekilde, benim için oradaki benzetmenin e-posta konuşmalarının SMS, iMessage veya WhatsApp'a taşınması olacağını düşünüyorum. Artık söylemediğin tüm saçmalıkları düşün. "Umarım bu seni iyi bulur" ya da her neyse. Bütün bu saçmalıklar gitti.

Fergal: Twitter'ın kısıtlamaları, biçimi, ortamı size daha kısa olma izni veriyor. Bence bu gerçek bir dinamik. İletişim kurma şeklimiz ve bir yardım merkezi makalesi yazma şeklimiz, onu yazmanın en uygun yolu olmayabilir. Belki de daha kısa olmalıyız. Makine öğrenimi ekibinde, bunu düşünmenin başka bir yolu var. Dünyanın geleceği ajanlar tarafından aracılık edilecek. Ve bir zamanlar, bu herkes için açıktı. Web tarayıcınızda onu dizileyen bir kullanıcı aracısı falan vardı. Ve dediğim gibi, ajanınız sizin için tüm bu bağlantılar ve diğer şeylerle birlikte o garip internette geziniyor. Senin için bir şeyler yapacak, geri gelecek ve sana bir şeyler anlatacak. Ve sonra, tüm bu şeyler merkezileştirildi ve şimdi arama motorunuz var vb.

“Gördüğümüz tek şey DALL·E 2 görüntü üretimi olsaydı, bu bir şey olurdu. Ama hayır, ses sentezinde, görüntü sentezinde, metni anlamada, metin sentezinde ve metin sıkıştırmada dönüşümler görüyoruz”

Teknoloji fütürizmi ve bilim kurgu vb.'de eski bir fikir vardır, muhtemelen sizi, niyetinizi, ne istediğinizi anlayan ve dikkatinize neyi getirip neyi getirmeyeceğini anlayacak kadar akıllı bir temsilciniz olacaktır. ile. Yani muhtemelen, gelecekte bu işlerin gidişatı daha çok buna benzer. Belirli bir ayrıntıyı bilmek istiyorsanız, yanınızdaki yazılım bunu özetlenmiş versiyonuna koyacak kadar akıllıdır. Ama senin o detayı da bilmek istemediğini bilecek ve onu dışarıda bırakacak kadar zekice.

Belki de kullanıcı arayüzlerinin değiştiği, belirli bir iş veya göreve yönelik kullanıcı arayüzümün bugün olduğu gibi o iş veya görev tarafından gerçekten kontrol edilmediği bir gelecekte yaşayacağız. Bunun yerine, benim için kişiselleştirildi. Kulağa çok hoş geliyor ama bence hızlı olacak. Bu dil modelleri çok güçlü, kod yazmak vb. için kullanılmaya başlıyorlar ve buradan harekete geçmem çok kısa. İnsanların bir web sitesini İngilizce bir cümleyi anlayacak ve sizin için web sitesinde gezinecek kadar iyi anlayan modeller üzerinde çalıştığı bazı prototipler gördük. Ve sonra, herkesin web siteleriyle bu şekilde etkileşime girdiği bir geleceğe mi gidiyoruz? Artık bir web sitesine ihtiyacınız var mı?

Des: Bu yeni SEO mu? GPT'nizin sizi anlayabildiğinden emin olmak mı istiyorsunuz?

Fergal: Evet. Belki web siteleri, herkese açık bir API gibi görünen bir şeye dönüşebilir ve bu, kullanıcı arabirimi ve biçimlendirme ile ilgili bir şeydir çünkü kullanıcı arabirimi aracılar tarafından biçimlendirilir.

Des: Hepimiz sadece Siri ile falan konuşuyoruz.

“Belki de robotlarla dolu bir gelecek böyle görünecek. Hepimizin arabirimi yöneten, bizim için kişiselleştirilmiş bir botu var ve bu ara katman hakkında gerçekten çok fazla endişelenmenize gerek yok”

Fergal: Evet, bence Google ve Apple bu geleceği görebilir. Zaman çizelgesini bilmiyoruz, ama yine de, her zaman kullandığım düşünme aracı şu: Ya sizi anlayan, sizinle çalışmış çok zeki bir insanınız olsaydı, belki bir kişisel asistanınız olsaydı ve siz de onlarla iletişim kuruyor olsaydınız ve tatil rezervasyonu yapmak mı istediniz? Bunun hakkında sana ne sorarlardı? Ve booking.com'da ya da her neyse gördüğünüz şeylerin yarısında, size bunu sormayacaklar - sadece sizin için tatil rezervasyonu yapacaklar ve belki de açıklayıcı sorularla geri dönecekler: "Oh, bunu yapmak istedin. git bir apartmanda kal ama orda yer yok. Bir otel olur mu?” Ancak bu uyarlanabilir bir kullanıcı arabirimidir. Yine, ChatGPT'ye ve az önce gönderilenlere çok fazla odaklanmıyorum. Bir veya iki yıl çıkarsın. Çok hızlı hareket ediyor. Mevcut sınırlamalar nedeniyle şüpheciyseniz, siz--

Des: Şüpheciliğin hedefi ıskalayacak.

Fergal: Aynen. Transformatörler son derece güçlüdür ve insanların kullandığı transformatör mimarileri son derece güçlüdür. Burada birden fazla yöntemin geliştiğini gördük. Gördüğümüz tek şey DALL·E 2 görüntü üretimi olsaydı, bu bir şey olurdu. Ama hayır, ses sentezinde, görüntü sentezinde, metni anlamada, metin sentezinde, metin sıkıştırmada dönüşümler görüyoruz. Pek çok paralel ilerleme görüyoruz. Kod yazabilir. Muhtemelen çok yakında bir web sitesi çalıştırabilecektir. Yani belki de botlarla gelecek böyle görünecek. Hepimizin, arabirimi yöneten, bize göre kişiselleştirilmiş bir botu var ve bu ara katman hakkında gerçekten çok fazla endişelenmenize gerek yok.

Des: Twitter'da gördüğüm bir süper prototip sahnesi, bir robotu kendi sesiyle konuşmak, bir numarayı aramak ve bir banka telefon ağacında gezinmek, etkili bir şekilde bir temsilciye ulaşmak, tüm bilgilerine sahip olmayı talep etmek için eğiten biriydi. döviz işlemleri iade falan. Sadece sormanız gereken bir standart türü ve onlar da bunu yapıyor. Yolun sonuna kadar geldi. Ve kelimenin tam anlamıyla, "Git" dediler ve çekip gittiler. Bu açıkça çok yapmacıktı, belki çok kapalıydı, ancak yine de uçtan uca otomatik olarak yürütülen çok gerçek bir kullanım durumuydu.

Fergal: Bence gerçekten ilginç bir alan. Müşteri hizmetlerinin nasıl değişeceği hakkında çok konuşuyoruz ve ChatGPT gibi, ancak işinize göre özelleştirilmiş ve soruları yanıtlamada gerçekten harika bir botunuz olduğunda ve müşteri hizmetleri sorunlarının maliyetinin düşeceği zaman, aklımızın her zaman gideceği şey ne olacağıdır. Ama başka bir yanı daha var. Kullanıcı, müşteri hizmetleri etkileşimlerini yönetebilen ve pes etmeyen veya yorulmayan bir bota sahip olduğunda müşteri hizmetleri nasıl değişecek? Ve orada potansiyel olarak büyük bir değişiklik var.

Des: Yeni B2B temelde bottan bota olacak.

Feryal: Olabilir. Kullanıcıların bu tür bir teknolojiye sahip olması biraz zaman alabilir, ancak dikkate alınması gereken ilginç bir şey.

Özgünlük bilmecesi

Des: Yaratılışın bu çift taraflı dünyası hakkında genel olarak nasıl düşünürsünüz ve nihayetinde, aldatma olarak görülebilecek şey - bu bir tabloya benziyor, ancak bu bir tablo değil, yaratıldı - algılamaya karşı, insanların söyleyebileceği fikir , "Hey, bu kodu gerçekten elle yazdım, bu oluşturulmuş kod değil." İnsanlığın bu dünyada gezinmesi ne kadar önemli? Batılı bir robot fabrikası olan Westworld'de ünlü bir sahne vardır, burada bir adam...

Fergal: Eski bir şeyin yeniden çevrimi.

Des: Ah, öyle mi? Bana haberler. Eski bir şeyin yeniden çevrimi olduğunu bilmiyordum. Ama Westworld'de bir adamın bir kadına çarptığı, onunla konuştuğu ve sonunda "Sormam gerek, sen gerçek misin?" dediği bir sahne var. Cevabı, "Sormanız gerekiyorsa, neden önemli?" Ve bence orada bir şey var. Algılama yeteneğimizi geride bırakmak, özgünlüğün tanımı olarak mı görülecektir? Özgünlük artık bir şey mi? Bankacılık örneğinde bir insan nasıl “Hey Fergal, bu sen misin yoksa bu senin eğittiğin bir bot mu?” Özellikle de onu bu soruya nasıl cevap vereceği konusunda eğittiyseniz.

Fergal: Orada bazı büyük sorular var. Orada muhtemelen izini kaybettiğim en az beş soru var. Turing testi hakkında konuşabilirsiniz, bir bilgisayarın ne zaman gerektiği gibi zeki hale geldiğini nasıl söyleyebileceğimize dair çok ileri görüşlü bir makale ve sonra bir test işlevsiz bir testti - eğer bir insan yargıç ikisi arasında güvenilir bir şekilde ayrım yapabilirse metin arayüzü veya her neyse, akıllı olmadığını söyleyebiliriz. Ve bunu geçtiğinde, işlevsel olarak zeki olduğunu kabul etmeliyiz. Çok fazla yanlış sunuldu, ancak makalesi daha çok "İş o noktaya gelirse gerçekten ilginç bir şey yapıyor" gibiydi. Ve bu, olaylara işlevsel olarak yaklaşmanın bir yoludur.

"Pek çok şeyin olduğu bir hikaye anlatın ve ardından buna ilişkin bir tür karmaşık, sonuçsal soru sorun, yine de takılıp kalacaktır"

Des: Ve bunu geçtik diyebilirim. Oralarda.

Fergal: Turing testini geçen bir şey hakkında her zaman manşetler vardır. Orijinal formülasyonun yetenekli bir sorgulayıcı gibi bir şey olduğunu düşünüyorum. Henüz o noktada değiliz. Birisi doğru soruları sormak için eğitilmişse, bu şeyler hızla bozulur. Bir insanın sahip olduğu derin dünya modeline sahip değildir.

Doğru . Kendine referanslı bir soru sorma hilesini nasıl yaparsın? Birinden dilsel olarak açmasını ister miydin?

Fergal: Teknoloji bu konuda daha da iyiye gidiyor. Ancak bu daha çok karmaşık bir etki alanı oluşturmaya benzer. Pek çok şeyin olduğu bir hikaye anlatın ve ardından ona bununla ilgili bir tür karmaşık, sonuçsal soru sorun ve yine de takılıp kalacaktır. Bir çocuğun yapmayacağı bir şekilde devreye girecek. Ama bence bunu düşünmenin doğru yolu, uzaylı zekasıyla uğraşıyor olmanız. Siz buna zeka demek istiyorsunuz ama o farklı bir şekilde şekillenecek. Yani, yedi yaşındaki bir çocuğun yazamayacağı bir sürü şey olacak – Bir bilgisayar programı yazabileceğim, ama sizin sağduyulu muhakeme diyebileceğiniz şey henüz orada değil. Bununla birlikte, felsefi olarak, bu şeyin canlı olup olmadığından ve bir şeyleri algılayıp algılamadığından bahsediyoruz. Ve hayır, çoğu insanın kullanacağı çoğu tanımla kesinlikle hayır. Ancak bu, AI sorularının felsefesine bir nevi sapmadır.

Orijinal noktanıza geri dönecek olursak, bu sistemler için CAPTCHA'lar oluşturmak isterseniz ne olur? Bu neye benziyor? Evet, insanların damgalama ve metnin bu modeller tarafından üretilip üretilmediğini belirleme yöntemleri var, ancak doğru miktarda gürültüyü enjekte etmekte gerçekten iyi olan bir modeliniz varsa bunun güvenilir olup olmayacağını bilmiyorum.

Bu alandaki herkesi uyarmak istediğim bir şey var ki, makine öğrenimi sistemleri var ve "makine öğrenimi sistemimin gerçek hayatta %99 görüntü algılama eşiğime ulaşacak kadar iyi kaliteye sahip olmasını nasıl sağlayabilirim?" Bu bir standart. Ve başka bir standart daha var: makine öğrenimi sistemimi, rakip girdiye kıyasla iyi çalışacak şekilde nasıl kurarım? Bu tamamen farklı bir top oyunu.

"En azından bir süreliğine, büyük bir dil modeline sahip herhangi bir büyük oyuncu, onu bunun gibi alçakça görevler için kullanıyorsanız sizi durdurmaya çalışır."

Tanım: Savunma tasarımı.

Fergal: Savunma tasarımı. Rakip girdilere karşı nasıl savunma yaparım? Ve genel olarak, bu gerçekten zor. Bana "Ah, dolandırıcılığı tespit edecek veya sistemimi karmaşık bir ortamda koruyacak yeni bir makine öğrenme sistemim var" deseydiniz, son derece şüpheci olurdum. Dolandırıcılık tespit sistemleri var, ancak bu, makine öğrenimi sistemine saldırmaya çalışan birinden farklı.

Bence bir botla ne zaman konuştuğunuzu, büyük bir dil modeliyle konuştuğunuzu ve o sizin konuşmanızı istemediğini tespit etme meselesinin zor olacağını düşünüyorum. Ve gelecekte, müşteri hizmetlerinin kullanıcı gibi davranan robotlarla dolup taştığı bir durumla karşılaşırsak, bununla başa çıkmak zor olacaktır. Ancak, en azından bir süreliğine, büyük bir dil modeline sahip herhangi bir büyük oyuncunun, onu bunun gibi hain görevler için kullanıyorsanız sizi durdurmaya çalışacağını hayal ediyorum. Ve orada biraz kontrol olacak çünkü bu kadar yüksek kaliteli bu modelleri barındırmak ve herhangi bir tür tüketici modeli donanımında çalıştırmak zordur. Bazı sorumluluklar olabilir.

Yaklaşan kesintiler

Des: Biraz yakınlaştırırsak, muhtemelen kulağa inandırıcı gelen bir müzik üretebilmekten çok da uzakta değiliz. Lobi müziği, bu tür şeyler.

Fergal: Evet. Muzak.

Des: Muzak, kesinlikle. Ve bir dereceye kadar, genel formüle dayalı şarkılar var - bence 65 bir numaralı şarkı gibi bir şey aynı dört akora sahip ya da onun gibi bir şey ya da listelerde en üst sıralarda yer alan şarkılar. Ve açıkçası, Dan Brown'ın romanlarının hepsi basit bir format izliyor. Bu kötü olduğu anlamına gelmez, ancak bir dereceye kadar formül niteliğinde ifade edilen herhangi bir şey kopyalanabildiğinde ve nihayetinde bunun 0 dolarlık bir versiyonunu elde edebileceğinizde toplum ne dereceye kadar değişir? Da Vinci Şifresi hala Da Vinci Şifresidir, herhangi bir normal tanıma göre oldukça iyi bir kitaptır, ancak artık onun pazarlıklı bodrum versiyonunu 0 veya beş sente veya her neyse alabilirsiniz. Ve sonra, bunun her tür yaratıcılıkta olduğunu düşünürsünüz. Yine, bu, bu teknolojilerin çıktılarının karşılaştırılabilir olacağı anlamına gelmez, ancak potansiyel olarak fiyatın %1'i kadar olacaktır. Böyle bir gelecekte dünya nasıl değişir sizce?

“Bu Jevons paradoksu – bazen, bir şeyi daha ucuz hale getirmek, sonunda ondan çok daha fazlasını yapmak anlamına gelir. Bu dinamikleri tahmin etmek gerçekten zor”

Fergal: Birçok farklı şekilde düşünüyorum. Geçmişten benzetmelere bakabilirsiniz. Resme bakabilirsin, sonra fotoğraf geldi ve birdenbire manzara fotoğrafı çekmek kolay oldu ama-

Des: Eminim ressamlar bundan hoşlanmamıştır, değil mi?

Fergal: Tarihi çok iyi bilmiyorum ama genel olarak, bir aksama olduğunda üzülen bazı görevliler var.

Des: Sanırım radyo ve kasetlerde de durum aynıydı - canlı müzisyenler "Eh, bu bizim işimizdi" gibiydi.

Fergal: Evet. Her sinemada film müziğini çalan bir piyanist vardı ve o da gitti. Gramofon ve piyano akortçuları, tezgâh ve Ludditler… Bunun sayısız örneği var. Ve yakın zamanda bozulmayla karşı karşıya olan başka alanlar olduğunu düşünüyorum ve neyin değerli olduğu hakkında zorlu konuşmalar olacak. Aynı şekilde, müşteri desteği konusunda da hassas olmalısınız. Her zaman daha iyi sonuçlar ve daha kötü sonuçlar vardır. İnsanlar kod yazmakta daha iyi hale gelen büyük dil modellerine bakıp "Hey, bir programcı olarak, kazanmak için yıllarca yatırım yaptığım bu değerli beceri, aman Tanrım, artık yararlı olmayacak" diyebilirler.

"Çok fazla otomasyonun olduğu bir dünyada daha az müşteri destek temsilcisi mi olacak yoksa bir işletmeye getirebilecekleri değer büyüdüğü için daha mı fazla olacak?"

Bunu düşünmenin farklı yolları var. Bunu AWS açısından düşünebilirsiniz. Amazon'u Intercom'da çok kullanıyoruz ve muhtemelen yaptığımız her şeyi AWS olmadan yapmak zorunda kalsaydık, bunu yapmak bize çok daha fazla programcı zamanına mal olurdu. Sonuç olarak bu, daha az programcı işe aldığımız anlamına mı geliyor? Bu muhtemelen, bu olanak sağlayan teknoloji olmadan bir işletme olarak mümkün olmayacağımız anlamına geliyor. Bu Jevons paradoksu – bazen, bir şeyi daha ucuz hale getirmek, sonunda ondan çok daha fazlasını yapmak anlamına gelir. Bu dinamikleri tahmin etmek gerçekten zor. Çok fazla otomasyona sahip bir dünyada daha az müşteri destek temsilcisi mi olacak yoksa bir işletmeye getirebilecekleri değer büyüdüğü için daha mı fazla olacak?

Des: Tüm gerçek şeyleri aldığımızda, aslında getirdikleri değeri görüyoruz ve siz de "Daha fazlasını istiyorum" diyorsunuz.

Fergal: Daha fazlasını istiyorsun; daha fazlasına ihtiyacın var. Aniden, "Vay canına, bu kadar çok temsilciye sahip olsaydık işimiz için değer açısından neyin kilidini açabilirdik?" Her biri şu anda yaptıklarından 10 kat daha fazlasını yapabilir. Asla bilemezsin. Bence bu bazen gözden kaçan bir şey. İnsanlar her zaman teknolojik bozulmaya tepki verir ve her zaman "Ah, değer merdivenini tırmanabilir ve daha iyi bir iş bulabilirsin. Gitmek istediğin yer orasıysa, ürün müdürü olabilirsin.” Ve bu potansiyel olarak tek yol. Ancak başka bir yol da, şu anda yaptığınız şeyde çok daha üretken olmanın, yapmanız gereken miktarını dönüştürebilmesidir.

Des: Veya bu sayede daha fazla iş mümkün hale gelir.

Fergal: Daha fazla iş mümkün hale geliyor. Bu en iyi şey. Bence bunların hepsi yapay zeka sanatı gibi şeylerle ortaya çıkacak. Açıkçası, intihal ve telif hakkı ihlali etrafında bir tartışma var. Birisi gidip DALL·E 2'yi bir sürü resim üzerinde eğitirse, bu telif hakkı ihlali miydi? Ya bir sanatçının üslubunu öğrenseler ve siz ondan onlarınki gibi işler üretmesini isteseniz? Bu telif hakkı ihlali mi? Ve muhtemelen yasal sistemlerin ve toplumun çözmesi gereken pek çok şey vardır. Bazen tartışmada eksik olduğunu düşündüğüm bir şey, mevcut modelleri eğitmenin telif hakkı ihlali olduğuna karar verseniz bile - ve biz bunu insanlarla kabul etmiyoruz; insanların bir şeylere bakmalarına ve onların tarzlarını kopyalamalarına izin verilir - birileri yine de açık, izin verilebilir çalışma konusunda eğitilmiş modeller inşa edecek ve görüntü oluşturmada oldukça başarılı olacaklar. Bence o gemi bir dereceye kadar yelken açtı.

Ne kadar büyüyebilir?

Des: Burada birkaç iğne atmak için, burada büyük bir sunucu ekibimizin olmadığı bir örnek olarak AWS'ye başvurdunuz. Sunucularla dolu dosya dolaplarımız yok. OpenAI, Anthropic ve tüm bunların varlığı nedeniyle AI ekibiniz daha mı küçük? Eğer onlar olmasaydı, sunucu ekibinin yapay zeka versiyonunu oluşturur muydunuz?

Fergal: Evet, yani, bu çok kötü bir soru. Ona bakmanın farklı yolları var. AI ekibi kesintiye mi uğruyor? Ve bu konuda ileri geri gittik. Büyük dil modellerinin güncel sürümüne bakalım. Son zamanlarda bir film tavsiyecisi olarak GPT ile oynuyordum. "Hey, X ve Y'yi izlemeyi seviyorum. Bana bir şey önerir misin?" Ve bu kötü değil. Eminim en iyi verilere sahip, iyi ayarlanmış bir tavsiyeci kadar iyi değildir, ancak filmleri rastgele seçmekten çok daha iyi yapıyor. Ve çıktı verecek, akıl yürütüyormuş gibi tükürecek. Ve yaptığı her şey gibi mantığı da makul ama fena değil. Yani yine, teknoloji şu anda harika olmasa bile - ondan bir film tavsiyesi veya herhangi bir şey üretmek için acele etmem - ya 10 kat veya 100 kat daha iyi olursa? Ya onu çok daha fazla eğitim verisi ya da çok daha iyi bir eğitim rejimi ile beslerseniz?

"Bu yeni yeteneğin iyi olduğu belirli şeylerde, pek çok yapı iskelesi ve bunun etrafında pek çok ürün çalışmasıyla bir araya gelmesiyle tonlarca fırsat ortaya çıkıyor"

Des: Sadece GPT-4'ü bekleyin.

Fergal: Evet, GPT-6, nasıl görünüyorsa öyle değil mi? 10 milyar dolar size bilgi işlem ve takviye, insan geri bildirimi öğrenmek için ne satın alırsa alsın, aslında olan buysa. Peki ya bu olursa? Hala gidip bir tavsiye sistemi kuruyor musunuz? Birisi sizden tavsiye sistemi istiyor, onu yapar mısınız? Sam Altman bu konuda konuşmalar yaptı. Bunu insan düzeyine getirebileceğimizi hayal edin. If you had something that was human-level general intelligence, would you need a machine learning team anymore? Or would you just sit down like, “Hi, how's it going? Today I'm going to teach you how to be a movie recommender.” You've got to give lots of examples, and it's got to be able to consume a data set about movies. But maybe it's just like, “Hey, AI system, write the code to consume the data set about movies.” Bilmiyorum.

“You're getting into big questions, Des. And maybe that's just where all our heads are going at the moment. But you can get into big questions about, like, by the time that's disrupted, what percentage of current human economic activity is disrupted?”

Des: Yeah, totally correct.

Fergal: But that's a very bullish case. Maybe we hit some asymptote before then, and I certainly don't think we're near that point at the moment. I think you still need your machine learning team. And I think we're certainly in this happy Jevons Paradox for a while where a lot of stuff is unlocked, and maybe we're doing slightly different work than we were before – we're certainly doing a lot more prompt engineering – but these systems are not yet good enough to just train-

Des: Yeah. To outsource the whole thing to OpenAI, and they'll solve our problems.

“If you put 100X more resources into model training or dataset creation, what return do you get? Is it 10X, a 100X, a 1000X? I don't know if anyone knows that”

Fergal: Right, yeah. I really hesitate to speculate about when. Just to give you one super concrete limitation. All these models have a prompt size. The amount of context you can pass to it with a prompt is limited. And that limit is baked in pretty low down. And so, a lot of the stuff the team is doing at the moment is around, “Hey, how do we work around that? How do we give them a relevant article?” And we're using more traditional machine learning techniques – traditional as in, invented five years ago. The classic stuff.

There are tons of opportunities with the marriage of this new capability in specific things it's good at with a lot of scaffolding, a lot of product work around that. I think there will be disruption, and it feels like extremely disruptive tech to me, particularly when you project a few years out. But we don't know how big it'll be. And I don't think anyone knows how big it'll be yet. Maybe the folks in OpenAI do. But if you put 100X more resources into model training or dataset creation, what return do you get? Is it 10X, a 100X, a 1000X? I don't know if anyone knows that. There's certainly no consensus on it.

Des: There was that quote from Sam Altman where he was asked something – I think it was some irrelevant question about challenges in San Francisco or something like that – and his answer was, “When you believe that artificial general intelligence is as close as I do, you struggle to think about any other problem.” When I read that, I was like, “Okay, well, he's certainly leaned a certain way.” Now, he could still be thinking in 20 years, but some societal problems are kind of irrelevant against the greater potential wave of what could be happening here.

“There's clearly a pitfall to avoid and an attractive pitfall to fall into”

Fergal: Yeah. Full disclaimer mode now. I think there's a lot of merit to that style of thinking, personally. I remembered there were times in the history of computation when it was like, “Oh, if you've got a million dollars to solve a computing problem and you need to solve it as soon as possible, what you need to do is sit with the million dollars for two years and then buy the fastest computer that the million could buy.

Des: I remember my own career. In 2006 or 2007, mobile websites were all the thing. Pre-iPhone, right? And people were talking about WAP and JMI files or JNI files, and everyone hyped up their mobile strategy. And literally, by the time I finished working out what I thought was the right recommendation for a client, the iPhone had launched. And I was like, “You know what? Don't worry about it. Sit on your hands. Apple's going to solve this entire problem.” And sure enough, two months later, “Hey, it turns out all our websites are mobile-ready.” Sometimes, a tech wave can be so big that any temporal thing you do will just be irrelevant against the magnitude of what's going to happen.

Fergal: Yeah, if you believe AGI is close, I guess I can logically see that position. Now, clearly, it seems like there's a terrible mistake to make there where-

Des: Yeah, where we're wrong, and you've probably just been sitting on your hands.

Fergal: You've given yourself a license to ignore terrible, terrible things. So obviously, you've got to wait, and I'm not making any judgment on that. But yeah, there's clearly a pitfall to avoid and an attractive pitfall to fall into. I think it's very hard to bet against increasingly general intelligence. And I don't know timelines and stuff, but I think there are big questions for people to think about. Now, that's definitely way outside customer support or customer service.

Des: No, yeah. Well, look, thank you very much. We'll check in in six weeks to find out that this podcast is yet again out of date. We'll see where we're at again. But for now, thank you very much.

Fergal: Thanks, Des.

CTA-Intercom-on-Product