人工智能驅動的用戶界面(又名“聊天返回”)
已發表: 2023-08-11人工智能革命比移動更大,比雲更大,Intercom 中的一些人說甚至比互聯網本身更大。
許多預測都是基於新功能將如何使軟件變得更加強大:根據描述渲染圖像的能力,長時間聆聽/閱讀並在幾秒鐘內進行總結的能力,診斷問題的能力,對主題進行分類並採取行動的能力,一切都以思想的速度進行。 所有這些新的力量都將以巨大的方式改變軟件產品,我們已經看到了這一點。 我預計的另一項重大變化是聊天 UI(又名自然語言界面)作為產品標準界面的出現。
尼爾·斯蒂芬森 (Neal Stephenson) 的史詩般的文章/咆哮“最初是命令行”(正確地)認為命令行比點擊(或觸摸和滑動)界面更有效和高效。 然而,它們並不是直觀的或對世界上一小部分人來說是可以訪問的(除非您猜到調整圖像大小只是一個簡單的find . -type f -iname "*.jpg" -exec convert -resize 1000\> {} {} \;遠。)
命令行是大量晦澀難懂的命令,具有愚蠢的名稱和復雜的語法,但 LLM 支持的聊天要寬容得多。 有十幾種不同的方式來表達你想要調整圖片大小,法學碩士會理解其中的每一種。
如果您將同樣的論點應用到 UI,您會發現一些相似之處。 例如,Workday,一款價值 600 億美元的產品。 當我記得如何登錄時,我不情願地用它來請求休假。 它肯定比命令行更容易,但仍然需要一系列步驟來找到正確的表單並填寫它。

現在問問自己,哪個更簡單,是輸入“des Want 10 月 14 日結婚週年紀念日休息”,還是瀏覽上面帶有無盡選項卡、幽靈按鈕和下拉菜單的 UI? 為了獲得獎勵積分,問問自己是否可以設計一個通用 UI,比我只輸入“des 想要 10 月 14 日結婚週年紀念日休息”更快。 這並不容易……事實上,我們已經看到人們對鍵盤優先界面的巨大需求,而那是在它們變得如此直觀之前。 換句話說,Workday(至少)多久才會添加這種類型的 UI?

(好吧,我聽到了,是的,這可能需要好幾年。)
我們從唾手可得的人工智能果實開始
今天,我們看到人工智能聊天機器人在我們已經期望與文本框交互的領域蓬勃發展,例如搜索引擎、文章寫作、客戶支持信使(嗨,芬!)但它不會就此止步,這些只是最簡單和最簡單的。最適合無線電的人工智能用例。 作為設計師,我們可能還沒有準備好接受我們的大部分工作將被簡化為一個圓角矩形,即使是一個具有漂亮排版的矩形。
但我們將看到聊天 UI 改變了以前受其必然的硬核用戶界面、語言或命令限制的產品。 舉一個相關的例子,假設您在 Excel 中,想要將所有負數單元格突出顯示為紅色 – 您如何做到這一點? 我們大多數人都會去谷歌,然後記住我們要找的詞是條件格式,然後我們重新谷歌“條件格式Excel”,然後谷歌答案框解釋了要做什麼,所以我們返回Excel並遵循這些指令是自動的。 然後,我們會立即記住一路上暫時獲得的所有知識,然後回到我們最初想做的事情。
今天,您只需要求機器人為您做這件事即可。 聊天 UI 可以實現軟件訪問的巨大民主化。

複雜的軟件通過聊天 UI 變得更好
大多數企業產品用戶都是永遠的新手——他們只知道足以完成他們最常需要的一兩個任務,但除此之外,他們只會通過破解和廢棄的方式來獲得結果。 他們對於自己想要完成的任務有很多想法,但就是不知道如何完成。 這種上游障礙會向下游傳播,在您意識到之前,您就會放棄認為該產品有任何好處或可以解決他們的問題。 如果您曾因某項功能而被競爭對手奪走客戶,那麼您就經歷過這種痛苦。

想想 Google Analytics、Salesforce 或具有其強大功能和復雜性的產品。 您知道,在某個地方深處埋藏著一個重要問題的正確答案,例如“我們從哪裡獲得性能最高的流量來源,以及最新的新來源是什麼?” ,或者“我們看到哪些競爭對手的交易量有所增加?” ,但你不可能自己找到答案。 因此,你要么詢問當地的專家,要么自己編造答案並希望沒有人知道。
學習 UI,即使它很漂亮和優雅,也很少值得你花時間。
但是,如果您只需輸入(或說出)您想要做的事情,然後看著它發生,障礙就會消失。 每個人都獲得了專業知識,每個人都成為高級用戶,突然間,該產品就改變了遊戲規則。 這是一種極其簡單的可視化方法:

在所有這些產品中,有些用戶知道自己想做什麼,但不知道如何做。 自然語言用戶界面將這一差距縮小到接近於零。
早期發布的聊天 UI
我們已經在野外看到了這種方法的一些例子。
- Equals:Equals 由兩位前 Intercomrade 構建,是下一代電子表格,可實時連接到實時數據。 (免責聲明/披露:我是一名投資者。)它允許您輸入您想要做的事情,Equals 將計算並生成您從未知道且無法自己計算的 Excel 命令。

- Mixpanel:這家事件分析公司最近發布了 Spark,這是一個生成式 AI 聊天界面,允許您用簡單的語言提出有關數據的問題。

- Stripe:Stripe 推出了一項新的 Radar 功能,允許客戶使用自然語言創建複雜的欺詐預防規則。

雖然我在這里關注的是作為輸入機制的聊天 UI,但作為輸出的聊天確實更棘手,因為對於許多目的來說,視覺優先級、層次結構、設計、佈局等都優於聊天氣泡。 例如,儀表板之類的東西本質上是視覺項目,無法用文本響應替代。 然而,可能有許多產品的 UI 會大幅褪色 - 例如,“預訂 10 月 14 日假期”→“完成”是完全可以接受的交互。
我相信這就是軟件的發展方向——人與軟件之間的多模式、混合方法的通信。 我們已經經歷了“點擊”和“點擊並滑動”,現在我們正處於“打字和說”的時代。 這種獲取複雜產品的民主化將平等地改變產品和用戶。 畢竟,如果您的所有用戶現在都知道如何在您的產品中執行所有操作,您的業務會發生怎樣的變化? 最好在你的競爭對手發現之前發現。

