色135综合网_中国无码人妻丰满熟妇啪啪软件_东京人气热影院_欧美欧洲成本大片免费_XXXX交换夫妇COm中国回

當(dāng)前位置:首頁(yè) > 關(guān)注 > 正文

報(bào)道:ChatGPT該給語(yǔ)音助手們補(bǔ)補(bǔ)“智商”了

來(lái)源:雷科技    時(shí)間:2023-03-09 16:08:37

AI 語(yǔ)音助手的「蠢」,好像全世界都知道。


【資料圖】

不管是 Siri 還是小愛(ài)同學(xué),大部分使用過(guò)所謂「AI 語(yǔ)音助手」的用戶大概都同意,它們肯定不算聰明。尤其是在 ChatGPT 出來(lái)之后,這種對(duì)比尤為明顯,甚至包括微軟的最高話事人也在批評(píng)自家的語(yǔ)音助手。

微軟 CEO 薩蒂亞·納德拉最近在接受英國(guó)《金融時(shí)報(bào)》采訪時(shí)表示,蘋(píng)果的 Siri、亞馬遜的 Alexa,微軟自家的 Cortana(中文名:小娜)以及公認(rèn)拔尖的 Google Assistant,這些語(yǔ)音助手有一個(gè)算一個(gè):

都笨得跟石頭一樣。

納德拉和 Cortana,圖/微軟

2014 年 4 月,納德拉剛剛上任微軟 CEO 兩個(gè)月后的微軟 Build 開(kāi)發(fā)者大會(huì)上,微軟全球副總裁喬北峰正式推出了 Cortana。在最初的幾年,Cortana 表現(xiàn)了不俗的智能,也受到包括納德拉在內(nèi)微軟高層的集體認(rèn)可,納德拉在 2016 年還稱贊 Cortana 的智能,并說(shuō)「機(jī)器人是新應(yīng)用」。但 Cortana 的智能(橫向比較)和市場(chǎng)份額越來(lái)越糟糕,到 2021 年微軟就正式宣布停止支持 iOS 和 Android 上的 Cortana 應(yīng)用,僅保留對(duì) Windows 平臺(tái)的支持。

更重要的是,OpenAI 帶著 ChatGPT 來(lái)了,微軟直接拿到了 AI 時(shí)代目前為止最好的一張船票。與此同時(shí),語(yǔ)音助手在過(guò)去幾年基本陷入了停滯,Siri 的聯(lián)合創(chuàng)始人 Adam Cheyer 也承認(rèn),ChatGPT 理解復(fù)雜信息的能力讓現(xiàn)有的語(yǔ)音助手看起來(lái)很蠢。

但換句話說(shuō),如果能在語(yǔ)音助手上實(shí)現(xiàn)類似 ChatGPT 理解復(fù)雜信息的能力,Siri 和小愛(ài)同學(xué)是不是就能重獲新生?

至少很多人已經(jīng)開(kāi)始嘗試了。

個(gè)人開(kāi)發(fā)者的嘗試

ChatGPT 出現(xiàn)后不久,互聯(lián)網(wǎng)上其實(shí)就有了一大堆的新想法,聲量最大的一個(gè)是改變「搜索」,如今已經(jīng)成為了搜索引擎巨頭的共識(shí),微軟必應(yīng)已經(jīng)在測(cè)試,谷歌和百度也提前進(jìn)行了預(yù)告。而另一方面,也有不少人在驚嘆于 ChatGPT 的自然語(yǔ)言溝通能力之余,期望會(huì)推出語(yǔ)音助手版本的 ChatGPT,替代掉目前不堪一「談」的語(yǔ)音助手。

在今年又一輪爆發(fā)之后,盡管我們還是沒(méi)看到 OpenAI 或者微軟推出對(duì)應(yīng)的語(yǔ)音助手版,但已經(jīng)有開(kāi)發(fā)者進(jìn)行了大量的嘗試。

xiaogpt,圖/GitHub

在全球最大的代碼托管平臺(tái) Github 上,就有開(kāi)發(fā)者嘗試將 ChatGPT 接入小愛(ài)同學(xué),Star 數(shù)已經(jīng)達(dá)到了 1.3k。據(jù)項(xiàng)目介紹,只要有 ChatGPT 的賬號(hào)、小愛(ài)音箱、正常連接 ChatGPT 的網(wǎng)絡(luò)以及 python 3.8+,人人都可以在小愛(ài)音箱上使用「ChatGPT 版小愛(ài)同學(xué)」。

原理上很簡(jiǎn)單,喚起小愛(ài)同學(xué)后,以「幫我」開(kāi)頭詢問(wèn)的問(wèn)題會(huì)自動(dòng)以文本形式發(fā)送一份給 ChatGPT,同時(shí)會(huì)屏蔽小愛(ài)同學(xué)原本的回答,替換成「正在問(wèn) GPT,請(qǐng)耐心等待」,而 ChatGPT 生成的文本則會(huì)被小愛(ài)同學(xué)通過(guò) TTS(語(yǔ)音合成技術(shù))進(jìn)行語(yǔ)音回答。

從開(kāi)發(fā)者的演示顯示,整個(gè)過(guò)程足夠流暢,實(shí)際回答也遠(yuǎn)超小愛(ài)同學(xué)原本的「智力」。(具備條件可搜索 GitHub 項(xiàng)目「xiaogpt」)

演示,圖/YouTube

不僅是小愛(ài)同學(xué),另一位更為大眾調(diào)侃的「智障」語(yǔ)音助手——Siri,實(shí)際上更早就被開(kāi)發(fā)者嘗試接入 ChatGPT。

圍繞 Siri 其實(shí)有不少嘗試,其中國(guó)內(nèi)開(kāi)發(fā)者@Yue-Yang 最近就以「快捷指令」形式連接了 Siri 和 ChatGPT,讓 Siri 變成真正的 AI 聊天機(jī)器人。在 GitHub 或者「小眾軟件」上你都能找到對(duì)應(yīng)的快捷指令——智能聊天,不過(guò)使用條件是需要申請(qǐng) OpenAI 的付費(fèi) API。

「ChatGPT Siri」在原理上與「xiaogpt」類似,利用 OpenAI 的 API(應(yīng)用程序接口)和 iOS 的特性,先將語(yǔ)音指令轉(zhuǎn)換為文本再傳遞給 ChatGPT,收到回答后再讓 Siri「讀」出來(lái)。在 B 站上,通過(guò)搜索「ChatGPT Siri」可以查看對(duì)應(yīng)的演示。

ChatGPT Siri,圖/GitHub

當(dāng)然,以上兩個(gè)項(xiàng)目都是個(gè)人開(kāi)發(fā)者的嘗試,也包括其他類似的項(xiàng)目,不管是使用體驗(yàn)還是上手門檻,都并不適合普通用戶??紤]到語(yǔ)音助手的技術(shù)、產(chǎn)品和生態(tài),大公司的入場(chǎng)很可能降低門檻、提高整體的使用體驗(yàn)。

問(wèn)題在于意愿和能力,很多公司其實(shí)也看到了站在 ChatGPT 的「肩膀」上重新打造語(yǔ)音助手的可能性,但在全球范圍內(nèi),真正同時(shí)手握 AI 能力和語(yǔ)音助手背后生態(tài)的公司總共也就那幾家。

巨頭的入場(chǎng),不遠(yuǎn)了

與搜索一樣,ChatGPT 不可能直接取代現(xiàn)有的語(yǔ)音助手。一方面語(yǔ)音交互的優(yōu)勢(shì)在于直接、易上手,很多任務(wù)通過(guò)觸控、文字輸入等方式不僅繁瑣、更耗時(shí)間,同時(shí)對(duì)于老人、小孩等用戶也偏于復(fù)雜,自然的語(yǔ)音交互則能比較輕松地實(shí)現(xiàn)。另一方面,ChatGPT 并不能對(duì)現(xiàn)實(shí)層面進(jìn)行直接干預(yù),比如我們用 Siri 或者小愛(ài)同學(xué)操控空調(diào)、掃地機(jī)器人等。

ChatGPT,或者說(shuō)生成式 AI 更大的價(jià)值在于通過(guò)強(qiáng)大的自然語(yǔ)言理解和溝通能力,來(lái)改善語(yǔ)音助手的使用體驗(yàn)。

小愛(ài)同學(xué) 5.0 發(fā)布現(xiàn)場(chǎng),圖/小米

過(guò)去我們總抱怨 AI 太笨,要么答非所問(wèn),要么干脆就是「我沒(méi)有明白」,基本幾輪對(duì)話就會(huì)感到心累,轉(zhuǎn)向?qū)δ苄缘男枨螅热缣鞖?、?wèn)題查詢、智能家居操作等。相反,ChatGPT 的對(duì)話能力則基本不用擔(dān)心,盡管可能會(huì)有錯(cuò)誤信息,但至少不會(huì)像 Siri 和小愛(ài)同學(xué)那樣溝通成本太高。這也是多年的發(fā)展停滯之后,語(yǔ)音助手的關(guān)鍵機(jī)會(huì)所在。

2 月底,微軟在推出支持 AI 對(duì)話的新必應(yīng)之后,又支持了 Android 和 iOS 版本,并且在 AI 對(duì)話中第一次增加了語(yǔ)音對(duì)話功能,用戶如果使用語(yǔ)音開(kāi)啟對(duì)話,新必應(yīng)也會(huì)使用語(yǔ)音回應(yīng)。不過(guò)就現(xiàn)在而言,新必應(yīng)的語(yǔ)音對(duì)話功能還僅限于對(duì)話,并不能用來(lái)進(jìn)行一系列操作,比如在手機(jī)上喚起某個(gè)系統(tǒng)或應(yīng)用的功能,也不支持設(shè)置為默認(rèn)的語(yǔ)音助手。

語(yǔ)音功能加入,圖/微軟

此外,微軟自家的 Windows 平臺(tái)也還未支持,目前為止尚未流出 Cortana 或其他新語(yǔ)音助手加入類 ChatGPT 能力的消息。

而更早些時(shí)候,小度官方在 2 月初宣布,AI 語(yǔ)音助手小度將在未來(lái)融合百度文心一言的全面能力,同時(shí)在此基礎(chǔ)上還將打造針對(duì)智能設(shè)備場(chǎng)景的人工智能模型「小度靈機(jī)」并應(yīng)用到小度全系產(chǎn)品。而據(jù)小度官方數(shù)據(jù),搭載小度的智能設(shè)備已經(jīng)進(jìn)入了 4000 萬(wàn)戶家庭。

當(dāng)然,按照百度此前的規(guī)劃,文心一言要在本月才上線測(cè)試,距離小度全面接入文心一言的顯然還需要一段時(shí)間。

另一方面,谷歌也早早看到了這一點(diǎn)。2021 年的 I/O 大會(huì)上,谷歌就首次宣布將 LaMDA 大語(yǔ)言模型的對(duì)話能力整合入 Goolgle Assistant、搜索和 Workspace。今年 2 月,谷歌推出了類 ChatGPT 的聊天機(jī)器人 Bard 之后,接入 Google Assistant 似乎也是題中應(yīng)有之義,包括 9TO5Google、《連線》雜志也認(rèn)為谷歌應(yīng)該這么做。

就像人人都知道語(yǔ)音助手的「蠢」,所有人也看到了 ChatGPT 讓語(yǔ)音助手們至少在理解人類語(yǔ)言和對(duì)話上「變聰明」的很大可能。

「賈維斯,有時(shí)在你學(xué)會(huì)走之前得先跑起來(lái)」,圖/《鋼鐵俠》

過(guò)去我們都暢想過(guò),有一個(gè)數(shù)字語(yǔ)音助手可以在日常生活中幫我們解決各種需求,就像《鋼鐵俠》里的賈維斯,現(xiàn)實(shí)是 Siri 和小愛(ài)同學(xué)們距離聽(tīng)懂人類的話還差很遠(yuǎn),充斥著各種「不明白」「聽(tīng)不懂」。

的確,現(xiàn)實(shí)世界的技術(shù)還趕不上科幻世界的想象很正常,但 ChatGPT 背后強(qiáng)大的對(duì)話語(yǔ)言能力,無(wú)疑可以讓語(yǔ)音助手們能夠更流暢地與我們對(duì)話,讓我們更感覺(jué)在對(duì)話的是一個(gè)「智商在線」的 AI 助手,而非對(duì)牛彈琴。而對(duì)于智能音箱和智能家居廠商,這也意味著更高的用戶粘性和使用率。

更或許,當(dāng) AI 越來(lái)越聰明并理解人類,智能家居乃至物聯(lián)網(wǎng)的未來(lái)也會(huì)隨之發(fā)生巨變。

題圖來(lái)自 Unsplash

本內(nèi)容為作者獨(dú)立觀點(diǎn),未經(jīng)允許不得轉(zhuǎn)載,合作事宜請(qǐng)聯(lián)系linxiuliu@leikeji.com

關(guān)鍵詞:

上一篇:

下一篇:

精心推薦

X 關(guān)閉

X 關(guān)閉

產(chǎn)業(yè)