GPT di sini untuk tinggal. Ke mana itu akan membawa kita?

Diterbitkan: 2023-02-03

GPT sedang berlangsung di depan kami, dan kami tidak ketinggalan. Saat kami menjelajahi potensi dan keterbatasan teknologi baru ini, akankah ini sesuai dengan hype?

Sejak diluncurkan pada akhir November, ChatGPT telah merebut hati dan pikiran orang-orang di seluruh dunia karena kemampuannya menghasilkan respons yang mirip manusia. Namun, seperti halnya teknologi baru, seringkali ada kesenjangan antara hype dan kenyataan. Dan AI generatif, khususnya, adalah mesin hype yang alami.

Kami memahami skeptisisme – model bahasa besar sangat bagus untuk tampil masuk akal, bahkan ketika itu salah. Tapi sejujurnya, kami sangat optimis. Selama delapan minggu terakhir, kami telah membuat fitur yang didukung AI dan mengirimkannya ke 160 pelanggan beta, dan umpan baliknya sangat menjanjikan. Sedemikian rupa sehingga awal minggu ini, Direktur Pembelajaran Mesin kami, Fergal Reid, dan saya merilis episode khusus di podcast untuk membagikan wawasan kami tentang apa yang telah kami buat dan apa yang telah kami pelajari.

Kali ini, kami melampaui Interkom, dan bahkan melampaui layanan pelanggan. Dalam episode hari ini, kita mempelajari semua hal tentang GPT – mulai dari skeptisisme hingga perannya dalam komunikasi bisnis, dari gangguan karya kreatif hingga masa depan antarmuka pengguna.

Berikut adalah beberapa takeaways utama:

  • Bukan hanya teknologi yang meningkat – kami semakin memahami apa yang harus dibuat, cara menyesuaikannya, dan mengintegrasikannya, dan semua dinamika ini mendorong kemajuan industri.
  • Mungkin masa depan antarmuka manusia-mesin akan difasilitasi oleh bot bertenaga AI yang dipersonalisasi yang memahami niat pengguna dan memediasi interaksi mereka.
  • Model-model ini telah membuka banyak kemampuan baru dan membodohi seseorang secara sekilas, tetapi mereka masih kekurangan akal sehat yang diperlukan untuk lulus tes Turing.
  • GPT dapat mengganggu industri layanan pelanggan, tetapi jika otomatisasi meningkatkan produktivitas agen, hal itu pada akhirnya dapat membuka kemampuan yang meningkatkan nilainya bagi bisnis.

Pastikan Anda tidak melewatkan sorotan apa pun dengan mengikuti Interkom pada Produk di Apple Podcasts, Spotify, YouTube, atau meraih umpan RSS di pemutar pilihan Anda. Berikut ini adalah transkrip episode yang diedit ringan.


Di luar hype

Des Traynor: Hai, dan selamat datang di podcast Interkom. Saya bergabung lagi dengan Fergal, dan kita akan membicarakan semua hal tentang GPT. Fergal, sudah delapan minggu penuh sejak ChatGPT diluncurkan. Sudah, orang-orang telah membangun produk yang berguna untuk melawannya, dan kami sudah memiliki gelombang skeptis yang mengatakan bahwa ini adalah mainan, belum dewasa, belum siap untuk apa pun, yang merupakan reaksi teknologi baru yang klasik. Di mana kepalamu? Apakah skeptisisme didirikan? Sudahkah kita melewati jurang persepsi yang benar-benar penting?

Fergal Reid: Ya, saya pikir ada legitimasi tertentu terhadap skeptisisme tersebut. Hal-hal ini hampir merupakan mesin sensasi alami. Sangat mudah untuk melihatnya dan melihatnya melakukan sesuatu yang tampaknya baik. Kecuali jika Anda benar-benar menggalinya, itu terlihat luar biasa. Dan kemudian, saat Anda menggalinya, Anda seperti, "Ah, salah, saya merasa disesatkan." Mesin-mesin ini dirancang untuk menghasilkan hal-hal yang masuk akal, dan jika masuk akal, tetapi salah adalah masalah bagi Anda, itu bisa sangat mengecewakan. Jadi saya memahami posisi standar skeptisisme yang membuat banyak orang menggunakan teknologi ini.

“ChatGPT, seperti yang ada di internet saat ini, mungkin merupakan mainan, tetapi bukan berarti kami tidak dapat mengambil teknologi dasar dan membangun fitur bisnis yang sangat berharga dari situ”

Namun, kami selalu sangat bullish pada AI generatif, dan sejak kami berbicara terakhir, kami telah membangun beberapa fitur, kami telah mengirimkannya ke Beta, kami memiliki pelanggan 160-an di Beta kami menggunakan fitur-fitur ini: peringkasan, beberapa fitur di komposer lebih eksperimental untuk mencoba dan membuat orang lebih cepat. Dan kemudian kami memiliki gelombang fitur lain dalam bentuk prototipe yang belum cukup ada – hal-hal bernilai tiket besar – tetapi kami pikir kami melihat garis pandang untuk itu. Jadi, kami memahami skeptisisme, kami optimis, dan sekarang kami memiliki data – penggunaan pelanggan nyata, pelanggan nyata memberi tahu kami bahwa ada pekerjaan tertentu yang ingin mereka lakukan, yang mereka lakukan sepanjang hari setiap hari, dan itu transformatif untuk itu. Dan itu, bagi saya, membuat posisi skeptis mulai terlihat sedikit goyah.

Des: Fakta bahwa orang benar-benar menggunakan benda tersebut untuk melakukan bagian dari pekerjaan mereka setiap hari.

Ferga: Iya. Itulah penengah utama dari ini. Sangat sulit untuk bersikap skeptis ketika orang benar-benar menggunakannya, dan bukan hanya sebagai mainan. Ada garis logika di luar sana. Kami telah melihat beberapa artikel di The Atlantic dan tempat-tempat seperti itu di mana orang berkata, "Hei, lihat, benda ini lebih seperti mainan daripada produk yang sangat berharga." Dan ChatGPT, seperti yang ada di internet saat ini, mungkin mainan, tetapi itu tidak berarti kami tidak dapat menggunakan teknologi dasar dan membangun fitur bisnis yang sangat berharga dari situ.

Tim saya mungkin telah menjadi salah satu dari beberapa tim yang melakukannya selama beberapa bulan terakhir, menjadi seperti, "Wow, ini memberikan nilai nyata," dan saya pikir kami mungkin salah satu perusahaan besar dalam layanan pelanggan yang berhasil. memiliki siklus pengembangan di mana kami benar-benar mendapatkan ini di tangan ratusan pelanggan dan mendapat umpan balik darinya. Dan mereka benar-benar memberi tahu kami, “Ya, ini benar-benar menghemat waktu saya; ini membuat pekerjaan saya lebih cepat.” Ya, skeptisisme menjadi lebih sulit dipertahankan. Itu salah satu argumen. Saya pikir Anda juga dapat menyerang skeptisisme dari posisi yang berbeda: kami telah melihat banyak utas tweet dan artikel yang skeptis tentang teknologi ini karena generasi sebelumnya tidak melewati jurang dan tidak transformatif. Dan mereka skeptis karena teknologi baru selalu dilebih-lebihkan. Tapi itu bukan argumen yang bagus. Itu adalah argumen yang benar untuk sementara dan kemudian menjadi sangat salah. Anda bisa gagal di sini dengan bersikap terlalu optimis, tetapi Anda juga bisa gagal dengan menjadi-

Des: Kosong dan pesimis.

Fergal: Tepat sekali. Kosong dan pesimis.

“Ada begitu banyak dinamika yang terjadi pada saat bersamaan yang akan saling memberi umpan balik dan memperbesar satu sama lain”

Des: Paralel yang Anda lihat adalah orang-orang yang membuang setiap ide startup baru yang pernah mereka dengar. Dan masalahnya adalah 90% dari startup tidak berhasil. Jadi 90% dari waktu, Anda tepat dan terlihat sangat pintar. Kemudian Anda membuang bisnis yang kemudian menjadi bisnis triliunan dolar, dan semua orang seperti, "Benar, ternyata ..." Saya pikir Nat Friedman yang berkata, "Pesimis terdengar pintar, optimis menjadi kaya," atau sesuatu seperti itu . Dan ada beberapa kebenarannya ketika Anda benar-benar memberi bobot di balik setiap pendapat: tingkat kesalahan Anda saat Anda salah melibas tingkat di mana Anda sedikit benar hanya dengan bersikap skeptis terhadap teknologi.

Fergal: Ya, 100%. Begini, saya percaya pada AI dan nilainya. Saya pikir kami memiliki cukup bukti nilai nyata. Selama dekade terakhir, kami melihat tren pembelajaran mesin dan AI secara umum meningkat dan meningkat. Kami punya kemampuan baru. Saya merasa tim saya memiliki cukup bukti bahwa setidaknya ada beberapa kemampuan yang dibuka untuk GPT-3.5 dan untuk model bahasa besar lainnya yang tidak ada enam bulan lalu. Saya yakin ada overhang; ada jauh lebih banyak produk yang dapat kami buat sekarang yang belum dibuat daripada sebelumnya. Jadi ya, kami optimis, dan kami mulai melihat pelanggan yang kami kirim versi beta memberi tahu kami, "Ya, ini berhasil, ini bagus."

Kami belum melewati bagian terakhirnya. Kami tahu ini transformatif dalam hal nilai inti untuk tugas yang dilakukan pelanggan kami 99% dari waktunya. Jadi, kami mengirimkan fitur ringkasan dan fitur lainnya untuk menghemat waktu di kotak masuk. Tetapi ada hal-hal besar yang datang ke sini yang belum kami bangun, yang secara internal sedang kami kerjakan, tetapi kami belum melihatnya di pasar. Jadi, kami pikir kegembiraan sebenarnya dari ini masih akan datang.

Des: Ada beberapa hierarki transformasi yang saya yakin seseorang akan mengoreksi saya di komentar, tetapi kami telah menempatkan fitur langsung untuk mengubah alur kerja tertentu, dan dengan mengubah, kami bermaksud mengurangi biaya untuk melakukan ini menjadi 5% dari apa itu dulu. Dalam hal, katakanlah, ringkasan. Kemudian, itu mungkin mengubah alur kerja yang sangat umum. Kemudian, itu mungkin mengubah pekerjaan, lalu mengubah organisasi, dan yang paling atas, mengubah bisnis. Tapi itu cukup jelas karena kami mengidentifikasi semakin banyak kasus penggunaan di mana kami dapat memberikan banyak nilai yang kami jalin melalui ini, bagi saya, transformasi dunia layanan pelanggan yang tak terhindarkan.

“Kami pergi secara internal ke pelanggan kami dan harus menutup perekrutan beta jauh lebih awal dari yang kami inginkan karena ini adalah salah satu respons terbesar yang pernah kami dapatkan”

Fergal: Tentu saja. Ada begitu banyak cara yang berubah secara paralel. Ada begitu banyak dinamika yang terjadi pada saat bersamaan yang akan saling memberi umpan balik dan memperbesar. Yang pertama agak jelas: teknologi yang tersedia semakin baik. Itu tidak berhenti. OpenAI dan pemain lain seperti Anthropic sedang membuat model baru setiap saat, dan itu menarik. Itu tidak berhenti. Jadi, itu salah satu dinamika. Dan ada dinamika lain, yaitu kami menjadi lebih baik dalam membuat produk di sekitar itu. Kami menjadi lebih baik dalam mengambil model-model itu dan mencari tahu jenis hal yang mereka kuasai. Dan ada dinamika lain, yaitu kami menjadi lebih baik dalam menyesuaikannya, membuat petunjuk yang tepat, dan mengintegrasikannya ke dalam sistem kami yang sudah ada. Dan kemudian harapan pelanggan kami semakin tinggi.

Kami benar-benar menemukan bahwa, sejak ChatGPT, ada gelombang minat yang sangat besar dari pelanggan kami. Mereka dapat melihat janji dan percaya bahwa ada sesuatu di sini. Dengan versi beta, kami mendatangi pelanggan secara internal dan harus menutup perekrutan beta jauh lebih awal dari yang kami inginkan karena ini adalah salah satu respons terbesar yang pernah kami dapatkan. Orang-orang ingin berada di atasnya. Jadi, semua hal ini bersama-sama akan memperbesar lebih dari salah satu dari mereka sendiri, menurut pendapat saya.

Des: Sangat menarik bagaimana Anda memecahnya. Teknologi meningkat, kemampuan bisnis meningkat, dan itu hanya mengadopsinya dalam kasus lokal. Dan kemudian kemampuan bisnis untuk memikirkan atau membuat konsep produk dan peluang baru menggunakan teknologi tersebut meningkat. Sama dengan ekspektasi pelanggan terhadap teknologi. Kami mungkin hanya berjarak satu tahun dari orang yang berharap dapat memperluas teks dalam bidang teks, sebagai salah satu contoh sederhana. Anda seperti melihat hal-hal ini muncul di mana-mana.

Fergal: Jika bahkan setahun. Jelas, banyak dari kita telah melihat pengumuman Microsoft tentang menghadirkan fitur-fitur ini ke dalam Word dan lainnya. Dan itu akan berubah dengan cepat jika alat produktivitas kantor utama yang besar melakukan ini. Itu bisa sangat cepat.

Munculnya asisten AI

Des: Inilah jenis skeptisisme yang berbeda yang akan saya tuju – yang sedikit beresonansi dengan saya. Saya pikir Kevin Cannon memiliki tweet lucu di mana dia berkata, “Masa depan terdiri dari orang-orang yang menggunakan GPT untuk memperluas hal-hal seperti, 'Saya ingin pekerjaan' menjadi surat yang indah seperti 'Dear Sir' atau 'Nyonya,' bla, bla , bla… Dan kemudian penerima, mengklik tombol ringkasan, untuk melihat bahwa orang tersebut baru saja berkata, 'Saya ingin pekerjaan, ini resume saya,' atau apa pun. Dalam arti tertentu, Anda akan tergoda untuk melihat mereka dan menjadi seperti, apa gunanya semua ini? Apakah bahasa formal dan penulisan profesional dan bahasa Inggris bisnis menjadi saluran sia-sia untuk cara teatrikal kita semua berkomunikasi, ketika di masa mendatang, saya hanya akan mengirimkan prompt, dan Anda akan membalas dengan prompt, seperti, "Saya ingin pekerjaan." "Kamu tidak bisa mendapatkan pekerjaan itu."

Ferga: Iya. Pertanyaan sulit. Ini sangat spekulatif. Saya akan memberi Anda beberapa pendapat. Mungkin ada konteks tertentu, bukan? Katakanlah dokumen hukum. Anda dapat mengatakan kepada seseorang di tim hukum Anda, “Hei, saya butuh kontrak. Itu harus melakukan X, Y, dan Z. Permintaan itu akan berubah menjadi 10 halaman materi hukum. Penerima akan seperti, "Oh, apakah itu melakukan tiga hal yang dikatakannya?" Dan tim hukum mereka akan menjawab, "Ya, benar." Ini adalah salah satu ujung ekstrem di mana ada ekspansi dan kompresi yang besar, tetapi dalam beberapa kasus yang aneh, klausul nomor 13 di halaman dua dapat muncul di pengadilan, dan seterusnya. Jadi jelas, itu penting. Kita tidak bisa menyingkirkannya. Kita tidak bisa hanya memiliki empat poin tersebut. Kami membutuhkan semua itu. Anda mungkin tidak menganggapnya material saat Anda menulisnya, tetapi nantinya bisa menjadi material. Itu terasa seperti ekstrim di mana itu seperti, "Tidak, rasanya harus ada di sana," sesuatu untuk menangani semua kasus ekstrem itu.

Dan ekstrem lainnya mungkin adalah situasi di mana pembela dan penerima tidak peduli dengan detail tersebut. Keduanya tidak akan pernah peduli dengan detail itu, dan mereka hanya mengamati beberapa keanggunan sosial atau formalitas “beginilah cara Anda menulis surat bisnis. Saya menulis untuk perusahaan besar, lebih baik saya menulis surat bisnis,” dan mungkin hal itu akan hilang.

Des: Dengan cara yang sama, menurut saya analogi yang ada bagi saya adalah ketika percakapan email dipindahkan ke SMS, iMessage, atau WhatsApp. Pikirkan semua omong kosong yang tidak Anda katakan lagi. "Semoga ini menemukan Anda dengan baik," atau apa pun. Semua omong kosong itu hilang.

Fergal: Kendala Twitter, formatnya, medianya, memberi Anda izin untuk lebih singkat. Saya pikir itu adalah dinamika yang nyata. Cara kami berkomunikasi dan cara kami menulis artikel pusat bantuan mungkin bukan cara yang optimal untuk menulisnya. Mungkin kita harus lebih singkat. Di tim pembelajaran mesin, ada cara berpikir lain tentang hal ini. Masa depan dunia akan ditengahi oleh agen. Dan sekali waktu, ini jelas bagi semua orang. Peramban web Anda memiliki agen pengguna yang merangkainya dan sebagainya. Dan seperti yang saya katakan, agen Anda yang pergi dan menavigasi internet aneh itu dengan semua tautan dan hal-hal ini untuk Anda. Itu akan melakukan banyak hal untuk Anda, kembali, dan memberi tahu Anda banyak hal. Dan kemudian, semua itu terpusat dan sekarang Anda memiliki mesin pencari dan seterusnya.

“Akan menjadi satu hal jika yang kita lihat hanyalah pembuatan gambar DALL·E 2. Tapi tidak, kami melihat transformasi dalam sintesis audio, sintesis gambar, pemahaman teks, sintesis teks, dan kompresi teks”

Ada ide lama dalam futurisme teknologi dan fiksi ilmiah dan seterusnya, bahwa Anda mungkin akan memiliki agen yang memahami Anda, niat Anda, apa yang Anda inginkan, dan cukup pintar untuk mencari tahu apa yang harus Anda perhatikan dan apa yang tidak. ke. Jadi kemungkinan ke depan, cara ini lebih seperti itu. Jika Anda ingin mengetahui detail tertentu, perangkat lunak di sisi Anda cukup pintar untuk memasukkannya ke dalam versi ringkasannya. Tetapi cukup pintar untuk mengetahui bahwa Anda juga tidak ingin mengetahui detail itu dan mengabaikannya.

Mungkin kita akan hidup di masa depan di mana antarmuka pengguna berubah, di mana antarmuka pengguna saya ke bisnis atau tugas tertentu tidak benar-benar dikendalikan oleh bisnis atau tugas itu seperti sekarang ini. Sebaliknya, itu dipersonalisasi untuk saya. Kedengarannya sangat mewah, tapi saya pikir itu akan terjadi dengan cepat. Model bahasa ini sangat kuat, mereka mulai digunakan untuk menulis kode dan seterusnya, dan ini adalah lompatan yang sangat singkat dari sini untuk mengambil tindakan dari saya. Kami telah melihat beberapa prototipe di luar sana di mana orang-orang mengerjakan model yang memahami situs web dengan cukup baik untuk memahami kalimat bahasa Inggris dan menavigasi situs web untuk Anda. Lalu, apakah kita menuju masa depan di mana setiap orang berinteraksi dengan situs web seperti itu? Apakah Anda memerlukan situs web lagi?

Des: Apakah ini SEO baru? Memastikan GPT Anda dapat memahami Anda?

Ferga: Iya. Mungkin situs web berubah menjadi sesuatu yang lebih mirip API yang diekspos secara publik, dan itu adalah sesuatu dengan UI dan pemformatan karena UI diformat oleh agen.

Des: Kami semua hanya berbicara dengan Siri atau apa pun.

“Mungkin seperti itulah masa depan dengan bot. Kita semua memiliki bot yang dipersonalisasi untuk kita yang menangani antarmuka dan Anda tidak perlu terlalu khawatir tentang lapisan perantara itu”

Fergal: Ya, dan menurut saya Google dan Apple dapat melihat masa depan ini. Kami tidak tahu garis waktunya, tetapi sekali lagi, alat berpikir yang selalu saya gunakan adalah: bagaimana jika Anda memiliki manusia yang sangat cerdas yang memahami Anda, yang pernah bekerja dengan Anda, mungkin asisten pribadi, dan Anda berinteraksi dengan mereka, dan Anda ingin memesan liburan? Apa yang akan mereka tanyakan tentang itu? Dan setengah dari hal-hal yang Anda lihat di booking.com atau apa pun, mereka tidak akan menanyakan itu – mereka hanya akan memesankan liburan untuk Anda dan mungkin kembali dengan pertanyaan klarifikasi: “Oh, Anda ingin pergi dan tinggal di apartemen, tetapi tidak ada tempat di sana. Apakah sebuah hotel akan melakukannya? Tapi itu antarmuka pengguna yang bisa disesuaikan. Sekali lagi, saya tidak terlalu fokus pada ChatGPT dan apa yang baru saja dikirimkan. Anda mengambil satu atau dua tahun keluar. Ini bergerak terlalu cepat. Jika Anda skeptis karena keterbatasan saat ini, Anda akan-

Des: Skeptisisme Anda akan meleset.

Fergal: Tepat sekali. Transformer sangat kuat, dan arsitektur transformator yang digunakan orang sangat kuat. Kami telah melihat banyak modalitas meningkat di sini. Ini akan menjadi satu hal jika semua yang kita lihat adalah pembuatan gambar DALL·E 2. Tapi tidak, kami melihat transformasi dalam sintesis audio, sintesis gambar, pemahaman teks, sintesis teks, kompresi teks. Kami melihat begitu banyak kemajuan paralel. Itu bisa menulis kode. Ini mungkin akan dapat bekerja situs web segera. Jadi mungkin seperti itulah masa depan dengan bot. Kita semua memiliki bot yang dipersonalisasi untuk kita yang menangani antarmuka dan Anda tidak perlu terlalu khawatir tentang lapisan perantara itu.

Des: Satu adegan prototipe super yang saya lihat di Twitter adalah seseorang yang melatih bot untuk berbicara dengan suaranya sendiri, saya percaya, dan untuk memanggil nomor dan menavigasi pohon telepon perbankan, secara efektif menghubungi agen, meminta untuk memiliki semua transaksi valuta asing dikembalikan atau sesuatu. Sesuatu yang merupakan standar di mana Anda hanya perlu bertanya dan mereka melakukannya. Itu berhasil sampai akhir. Dan secara harfiah, mereka hanya berkata, "Pergi," dan pergi. Itu jelas sangat dibuat-buat, mungkin sangat tertutup, tetapi itu masih merupakan use case yang sangat nyata dari ujung ke ujung yang dieksekusi secara otomatis.

Fergal: Saya pikir ini area yang sangat menarik. Kami berbicara banyak tentang bagaimana layanan pelanggan akan berubah, dan ke mana kepala kami selalu mengarah adalah apa yang akan terjadi ketika Anda memiliki bot seperti ChatGPT tetapi disesuaikan dengan bisnis Anda dan sangat hebat dalam menjawab pertanyaan dan biaya masalah layanan pelanggan akan turun. Tapi ada sisi lain dari itu. Bagaimana layanan pelanggan akan berubah ketika pengguna memiliki bot yang dapat menangani interaksi layanan pelanggan dan tidak menyerah atau lelah? Dan ada potensi perubahan besar di sana.

Des: B2B baru pada dasarnya akan menjadi bot-to-bot.

Ferga: Mungkin. Mungkin perlu beberapa saat sebelum pengguna memiliki teknologi semacam itu, tetapi ini hal yang menarik untuk dipertimbangkan.

Teka-teki keaslian

Des: Bagaimana pendapat Anda tentang dunia penciptaan dua sisi ini dan pada akhirnya, apa yang dapat dilihat sebagai penipuan – ini terlihat seperti lukisan, tetapi ini bukan lukisan, ini dihasilkan – versus deteksi, gagasan yang dapat dikatakan orang , "Hei, saya benar-benar menulis kode itu, itu bukan kode yang dihasilkan." Seberapa penting bagi umat manusia untuk menjelajahi dunia ini? Ada adegan terkenal di Westworld, sebuah pabrik robot barat, di mana seorang pria ingin-

Fergal: Ini adalah remake dari hal lama.

Des: oh gitu? Berita untuk saya. Saya tidak tahu itu adalah remake dari hal lama. Tapi di Westworld, ada adegan di mana seorang pria menabrak seorang wanita, bercakap-cakap dengannya, dan kemudian, pada akhirnya, dia berkata, "Saya harus bertanya, apakah Anda nyata?" Tanggapannya adalah, “Jika Anda harus bertanya, mengapa itu penting?” Dan saya pikir ada sesuatu di sana. Akankah melampaui kemampuan deteksi kami dilihat sebagai definisi otentik? Apakah keaslian bahkan menjadi sesuatu lagi? Dalam contoh perbankan, bagaimana seseorang akan berkata, "Hei, Fergal, apakah ini sebenarnya Anda, atau ini bot yang Anda latih?" Apalagi jika Anda sudah melatihnya bagaimana menjawab pertanyaan itu.

Fergal: Ada beberapa pertanyaan besar di sana. Setidaknya ada lima pertanyaan di sana yang mungkin saya lupa. Anda dapat berbicara tentang tes Turing, makalah yang sangat canggih tentang bagaimana kita dapat mengetahui kapan komputer telah menjadi cerdas dengan baik, dan kemudian satu tes adalah tes disfungsional - jika seorang hakim manusia dapat dengan andal membedakan antara keduanya. melalui antarmuka teks atau apa pun, kami dapat mengatakan itu tidak cerdas. Dan ketika melewati itu, kita harus menerima bahwa itu cerdas secara fungsional. Ini banyak disalahartikan, tetapi makalahnya lebih seperti, "Itu melakukan sesuatu yang sangat menarik jika sampai ke titik itu." Dan itu salah satu cara mendekati sesuatu secara fungsional.

"Ceritakan sebuah cerita di mana ada banyak hal yang terjadi dan kemudian ajukan pertanyaan yang kompleks dan konsekuensial tentang itu, dan itu akan tetap tersandung"

Des: Dan kita sudah melewati itu, menurut saya. Sekitar itu.

Fergal: Selalu ada berita utama tentang sesuatu yang lulus tes Turing. Saya pikir formulasi aslinya adalah sesuatu seperti interogator yang terampil atau semacamnya. Kami belum pada titik itu. Jika seseorang dilatih untuk mengajukan pertanyaan yang tepat, hal ini akan cepat rusak. Itu tidak memiliki model dunia yang dalam seperti manusia.

Des: Benar. Bagaimana Anda akan melakukan trik mengajukan pertanyaan referensi diri? Anda akan meminta seseorang untuk membuatnya tersandung secara linguistik?

Fergal: Teknologi semakin baik dalam hal itu. Tapi ini lebih seperti menyiapkan domain yang kompleks. Ceritakan sebuah kisah di mana ada banyak hal yang terjadi dan kemudian ajukan pertanyaan yang rumit dan konsekuensial tentang itu, dan itu masih akan tersandung. Itu akan tersandung dengan cara yang tidak akan dilakukan oleh seorang anak. Tapi menurut saya cara yang tepat untuk memikirkan hal ini adalah Anda berurusan dengan kecerdasan alien. Anda ingin menyebutnya kecerdasan, tetapi bentuknya akan berbeda. Jadi, itu akan menjadi banyak hal yang tidak dapat ditulis oleh anak berusia tujuh tahun – saya akan dapat menulis program komputer, tetapi apa yang Anda sebut penalaran akal sehat belum ada. Konon, secara filosofis, itu berbicara tentang apakah benda ini hidup dan merasakan benda. Dan tidak, jelas tidak, dengan sebagian besar definisi yang akan digunakan kebanyakan orang. Tapi itu semacam membelok ke filosofi pertanyaan AI.

Untuk kembali ke poin awal Anda, bagaimana jika Anda ingin membuat CAPTCHA untuk sistem ini? Seperti apa bentuknya? Ya, orang memiliki cara menandai air dan mendeteksi jika teks itu dihasilkan oleh model ini, tetapi saya tidak tahu apakah itu dapat diandalkan jika Anda memiliki model yang sangat bagus dalam menyuntikkan jumlah kebisingan yang tepat.

Satu hal yang akan saya ingatkan kepada siapa pun di bidang ini adalah bahwa ada sistem pembelajaran mesin dan pertanyaan seperti, "bagaimana cara membuat sistem pembelajaran mesin saya memiliki kualitas yang cukup baik sehingga dapat mencapai ambang deteksi gambar 99% di kehidupan nyata?" Itu satu standar. Dan ada standar lain ini: bagaimana cara membangun sistem pembelajaran mesin saya agar bekerja dengan baik dibandingkan dengan input musuh? Itu ballgame yang sangat berbeda.

“Untuk sementara, setidaknya, pemain besar mana pun dengan model bahasa besar akan mencoba dan menghentikan Anda jika Anda menggunakannya untuk tugas jahat seperti itu”

Des: Desain pertahanan.

Fergal: Desain pertahanan. Bagaimana cara bertahan dari input musuh? Dan secara umum, itu sangat sulit. Jika Anda memberi tahu saya, "Oh, saya memiliki sistem pembelajaran mesin mewah baru yang akan mendeteksi penipuan atau melindungi sistem saya di lingkungan yang kompleks," saya akan sangat skeptis. Ada sistem deteksi penipuan, tetapi itu berbeda dengan seseorang yang mencoba menyerang sistem pembelajaran mesin.

Saya pikir seluruh masalah pendeteksian saat Anda berbicara dengan bot, saat Anda berbicara dengan model bahasa besar saat tidak diinginkan, itu akan sulit. Dan jika kita berakhir dalam situasi di masa depan di mana layanan pelanggan dibanjiri oleh bot yang berpura-pura menjadi pengguna, itu akan sulit untuk dihadapi. Tapi saya membayangkan bahwa untuk sementara, setidaknya, pemain besar mana pun dengan model bahasa besar akan mencoba dan menghentikan Anda jika Anda menggunakannya untuk tugas jahat seperti itu. Dan akan ada beberapa kontrol di sana karena model dengan kualitas tinggi ini sulit untuk dihosting dan dijalankan sendiri pada perangkat keras model konsumen apa pun. Mungkin ada beberapa akuntabilitas.

Gangguan menjulang

Des: Jika kami memperbesar sedikit, kami mungkin tidak terlalu jauh untuk dapat menghasilkan musik yang terdengar masuk akal. Musik lobi, semacam itu.

Ferga: Iya. Muzak.

Des: Muzak tepatnya. Dan sampai taraf tertentu, ada lagu-lagu formula umum - saya pikir sekitar 65 lagu nomor satu memiliki empat akord yang sama atau sesuatu seperti itu, atau lagu-lagu top-chart. Dan, tentu saja, semua novel Dan Brown mengikuti format yang sederhana. Itu tidak berarti itu buruk, tetapi sejauh mana masyarakat berubah ketika apa pun yang diungkapkan sampai taraf tertentu dalam sifat formulaik dapat direplikasi, dan pada akhirnya, Anda bisa mendapatkan versi $0 dari itu? The Da Vinci Code tetaplah The Da Vinci Code, ini adalah buku yang cukup bagus dengan definisi normal apa pun, tetapi Anda sekarang bisa mendapatkan versi basement yang murah seharga $0 atau lima sen atau apa pun. Dan kemudian, Anda memikirkan hal itu terjadi di setiap jenis kreativitas. Sekali lagi, ini bukan untuk mengatakan bahwa output dari teknologi ini akan sebanding, tetapi berpotensi 1% dari harga. Menurut Anda bagaimana dunia berubah di masa depan seperti itu?

“Ini adalah paradoks Jevons – terkadang, membuat sesuatu yang lebih murah berarti Anda akhirnya melakukan lebih banyak hal. Dinamika itu sangat sulit diprediksi ”

Fergal: Saya berpikir dalam banyak cara yang berbeda. Anda dapat melihat analogi dari masa lalu. Anda dapat melihat lukisan, dan kemudian fotografi muncul, dan tiba-tiba mudah untuk mengambil gambar lanskap tetapi-

Des: Saya yakin para pelukis tidak menyukainya, bukan?

Fergal: Saya kurang tahu sejarahnya, tapi umumnya ada incumbent yang kesal setiap kali ada gangguan.

Des: Saya pikir itu sama dengan radio atau kaset - musisi live seperti, "Ya, ini pertunjukan kami."

Ferga: Iya. Setiap bioskop dulu memiliki seorang pianis yang akan memainkan soundtrack, dan itu hilang. Gramophone dan piano tuner, alat tenun dan Luddites… Ada banyak sekali contohnya. Dan menurut saya ada area lain yang akan segera menghadapi gangguan, dan akan ada percakapan sulit tentang apa yang berharga. Demikian pula, dengan dukungan pelanggan, Anda harus peka. Selalu ada hasil yang lebih baik dan hasil yang lebih buruk. Orang-orang mungkin melihat model bahasa besar menjadi lebih baik dalam menulis kode dan berkata, "Hei, sebagai seorang programmer, keterampilan berharga yang telah saya investasikan bertahun-tahun ini, astaga, itu tidak akan berguna lagi."

“Apakah akan ada lebih sedikit perwakilan dukungan pelanggan di dunia dengan banyak otomatisasi, atau akankah ada lebih banyak karena nilai yang dapat mereka bawa ke bisnis telah diperbesar?”

Ada berbagai cara untuk memikirkan hal ini. Anda dapat memikirkannya dalam istilah AWS. Kami sering menggunakan Amazon di Interkom, dan mungkin, jika kami harus melakukan semua yang kami lakukan tanpa AWS, kami akan membutuhkan lebih banyak waktu pemrogram untuk melakukannya. Apakah itu berarti kami mempekerjakan lebih sedikit programmer sebagai hasilnya? Yah, itu mungkin berarti kita tidak akan layak sebagai bisnis tanpa teknologi yang memungkinkan itu. Ini adalah paradoks Jevons – terkadang, membuat sesuatu yang lebih murah berarti Anda akhirnya melakukan lebih banyak hal. Dinamika itu sangat sulit diprediksi. Apakah akan ada lebih sedikit perwakilan dukungan pelanggan di dunia dengan banyak otomatisasi, atau akankah ada lebih banyak karena nilai yang dapat mereka bawa ke bisnis telah diperbesar?

Des: Saat kami mengambil semua barang asli, kami benar-benar melihat nilai yang dibawanya, dan Anda seperti, "Saya ingin lebih dari itu."

Fergal: Anda menginginkan lebih dari itu; Anda membutuhkan lebih dari itu. Tiba-tiba seperti, "Wow, apa yang bisa kita buka dalam hal nilai bisnis kita jika kita memiliki banyak perwakilan?" Masing-masing dapat melakukan 10 kali lebih banyak dari yang mereka lakukan saat ini. Kau tak pernah tahu. Saya pikir itu adalah sesuatu yang terkadang terlewatkan. Orang-orang selalu menanggapi gangguan teknologi dan selalu berbicara tentang, “Oh, Anda dapat menaiki tangga nilai dan mendapatkan pekerjaan yang lebih baik. Anda bisa menjadi manajer produk jika itu yang Anda inginkan.” Dan itu berpotensi salah satu cara. Tetapi cara lain adalah menjadi jauh lebih produktif pada apa yang Anda lakukan saat ini dapat mengubah jumlah yang perlu Anda lakukan.

Des: Atau lebih banyak bisnis menjadi mungkin karenanya.

Fergal: Lebih banyak bisnis menjadi mungkin. Itu yang terbaik. Saya pikir ini semua akan terungkap dengan hal-hal seperti seni AI. Jelas, ada perdebatan seputar plagiarisme dan pelanggaran hak cipta. Jika seseorang pergi dan melatih DALL·E 2 pada banyak gambar, apakah itu pelanggaran hak cipta? Dan bagaimana jika mereka mempelajari gaya seorang seniman dan kemudian Anda memintanya untuk menghasilkan karya seperti mereka? Apakah itu pelanggaran hak cipta? Dan mungkin ada banyak hal yang perlu dipikirkan oleh sistem hukum dan masyarakat di sana. Satu hal yang saya pikir terkadang hilang dari perdebatan adalah bahwa meskipun Anda memutuskan bahwa melatih model saat ini adalah pelanggaran hak cipta – dan kami tidak menerimanya dengan manusia; manusia diizinkan untuk melihat sesuatu dan meniru gaya mereka – seseorang masih akan membangun model yang dilatih pada pekerjaan yang terbuka dan diizinkan, dan mereka akan menjadi cukup bagus dalam menghasilkan gambar. Saya pikir kapal itu telah berlayar sampai batas tertentu.

Seberapa besar itu bisa terjadi?

Des: Untuk membuang beberapa jarum di sini, Anda mereferensikan AWS sebagai salah satu contoh di mana kami tidak memiliki tim server yang besar di sini. Kami tidak memiliki lemari arsip yang penuh dengan server. Apakah tim AI Anda menjadi lebih kecil karena adanya OpenAI, Anthropic, dan sebagainya? Jika mereka tidak ada, apakah Anda akan membuat tim server versi AI?

Fergal: Ya, maksud saya, itu pertanyaan yang sangat sulit. Ada berbagai cara untuk melihatnya. Apakah tim AI terganggu? Dan kami telah bolak-balik dalam hal ini. Mari kita lihat versi model bahasa besar saat ini. Saya bermain dengan GPT baru-baru ini sebagai pemberi rekomendasi film. Itu seperti, "Hei, saya suka menonton X dan Y. Sarankan saya sesuatu?" Dan itu tidak buruk. Saya yakin ini tidak sebagus rekomendasi yang disetel dengan baik yang memiliki semua data terbaik, tetapi jauh lebih baik daripada memilih film secara acak. Dan itu akan keluar, itu akan keluar seperti alasannya. Dan alasannya, seperti semua yang dilakukannya, masuk akal, tetapi tidak buruk. Jadi sekali lagi, bahkan jika teknologinya tidak bagus sekarang – saya tidak akan terburu-buru untuk menghasilkan rekomendasi film darinya atau apa pun – bagaimana jika itu menjadi 10 kali atau 100 kali lebih baik? Bagaimana jika Anda memberinya lebih banyak data pelatihan atau rezim pelatihan yang jauh lebih baik?

“Ada banyak peluang dengan penggabungan kemampuan baru ini dalam hal-hal tertentu yang bagus dengan banyak perancah, banyak produk bekerja di sekitar itu”

Des: Tunggu saja GPT-4.

Fergal: Ya, GPT-6, apa pun itu, kan? Apa pun 10 miliar dolar yang Anda beli untuk komputasi dan penguatan, mempelajari umpan balik manusia, jika memang itulah yang terjadi. Dan bagaimana jika itu terjadi? Apakah Anda masih pergi dan membangun sistem pemberi rekomendasi? Seseorang meminta Anda untuk sistem pemberi rekomendasi, apakah Anda akan melakukannya? Sam Altman telah memberikan ceramah tentang itu. Bayangkan kita bisa membuat ini menjadi level manusia. Jika Anda memiliki sesuatu yang merupakan kecerdasan umum tingkat manusia, apakah Anda memerlukan tim pembelajaran mesin lagi? Or would you just sit down like, “Hi, how's it going? Today I'm going to teach you how to be a movie recommender.” You've got to give lots of examples, and it's got to be able to consume a data set about movies. But maybe it's just like, “Hey, AI system, write the code to consume the data set about movies.” Aku tidak tahu.

“You're getting into big questions, Des. And maybe that's just where all our heads are going at the moment. But you can get into big questions about, like, by the time that's disrupted, what percentage of current human economic activity is disrupted?”

Des: Yeah, totally correct.

Fergal: But that's a very bullish case. Maybe we hit some asymptote before then, and I certainly don't think we're near that point at the moment. I think you still need your machine learning team. And I think we're certainly in this happy Jevons Paradox for a while where a lot of stuff is unlocked, and maybe we're doing slightly different work than we were before – we're certainly doing a lot more prompt engineering – but these systems are not yet good enough to just train-

Des: Yeah. To outsource the whole thing to OpenAI, and they'll solve our problems.

“If you put 100X more resources into model training or dataset creation, what return do you get? Is it 10X, a 100X, a 1000X? I don't know if anyone knows that”

Fergal: Right, yeah. I really hesitate to speculate about when. Just to give you one super concrete limitation. All these models have a prompt size. The amount of context you can pass to it with a prompt is limited. And that limit is baked in pretty low down. And so, a lot of the stuff the team is doing at the moment is around, “Hey, how do we work around that? How do we give them a relevant article?” And we're using more traditional machine learning techniques – traditional as in, invented five years ago. The classic stuff.

There are tons of opportunities with the marriage of this new capability in specific things it's good at with a lot of scaffolding, a lot of product work around that. I think there will be disruption, and it feels like extremely disruptive tech to me, particularly when you project a few years out. But we don't know how big it'll be. And I don't think anyone knows how big it'll be yet. Maybe the folks in OpenAI do. But if you put 100X more resources into model training or dataset creation, what return do you get? Is it 10X, a 100X, a 1000X? I don't know if anyone knows that. There's certainly no consensus on it.

Des: There was that quote from Sam Altman where he was asked something – I think it was some irrelevant question about challenges in San Francisco or something like that – and his answer was, “When you believe that artificial general intelligence is as close as I do, you struggle to think about any other problem.” When I read that, I was like, “Okay, well, he's certainly leaned a certain way.” Now, he could still be thinking in 20 years, but some societal problems are kind of irrelevant against the greater potential wave of what could be happening here.

“There's clearly a pitfall to avoid and an attractive pitfall to fall into”

Fergal: Yeah. Full disclaimer mode now. I think there's a lot of merit to that style of thinking, personally. I remembered there were times in the history of computation when it was like, “Oh, if you've got a million dollars to solve a computing problem and you need to solve it as soon as possible, what you need to do is sit with the million dollars for two years and then buy the fastest computer that the million could buy.

Des: I remember my own career. In 2006 or 2007, mobile websites were all the thing. Pre-iPhone, right? And people were talking about WAP and JMI files or JNI files, and everyone hyped up their mobile strategy. And literally, by the time I finished working out what I thought was the right recommendation for a client, the iPhone had launched. And I was like, “You know what? Jangan khawatir tentang itu. Sit on your hands. Apple's going to solve this entire problem.” And sure enough, two months later, “Hey, it turns out all our websites are mobile-ready.” Sometimes, a tech wave can be so big that any temporal thing you do will just be irrelevant against the magnitude of what's going to happen.

Fergal: Yeah, if you believe AGI is close, I guess I can logically see that position. Now, clearly, it seems like there's a terrible mistake to make there where-

Des: Yeah, where we're wrong, and you've probably just been sitting on your hands.

Fergal: You've given yourself a license to ignore terrible, terrible things. So obviously, you've got to wait, and I'm not making any judgment on that. But yeah, there's clearly a pitfall to avoid and an attractive pitfall to fall into. I think it's very hard to bet against increasingly general intelligence. And I don't know timelines and stuff, but I think there are big questions for people to think about. Now, that's definitely way outside customer support or customer service.

Des: No, yeah. Well, look, thank you very much. We'll check in in six weeks to find out that this podcast is yet again out of date. We'll see where we're at again. But for now, thank you very much.

Fergal: Thanks, Des.

CTA-Intercom-on-Product