深燃(shenrancaijing)原創
作者 | 李秋涵
【資料圖】
編輯 | 魏佳
你還在用 ChatGPT 嗎?
在全球掀起 AI 熱潮的 ChatGPT,似乎進入了瓶頸期。
首先是關于 ChatGPT 的使用率,有不利的數據出現。6 月初,摩根士丹利發布的一項調查顯示,只有 19% 的受訪者表示他們之前使用過 ChatGPT,只有 4% 的人表示依賴 ChatGPT。調查表示,比例低的驚人。
這項調查在今年 4 月進行,涉及人數為 2000 人。不過,在全球 78 億人口面前,這樣的樣本量不算大,也一定程度上降低了其參考性。
還有一個基數更廣泛的數據值得關注,ChatGPT 的增長已經明顯放緩。
根據網站數據分析工具 SimilarWeb 數據,前期 ChatGPT 的訪問量增長率驚人,1 月份的環比增長率為 131.6%,2 月份為 62.5%,3 月份為 55.8%,在 4 月份明顯放緩,環比增長率為 12.6%,到了 5 月,這個數字已經變為了 2.8%。
隨著 ChatGPT 普及,參考基數變大,增長率放緩是正常現象,不過,根據目前已有的趨勢來看,6 月的環比增長率也有可能為負數。
今年年初,ChatGPT 像一聲驚雷,讓全球見識到了生成式 AI 的威力,也讓背后的 GPT(生成式預訓練 Transfomer 模型)大火,掀起大模型創業潮。它刷新了很多數字,最讓人印象深刻的,是史上用戶增長速度最快的消費級應用,在推出僅兩個月后,ChatGPT 的月活用戶已經突破了 1 億。
但對它未來的發展,即便是創造者也很難給出明確答案。此前 OpenAI 董事會成員海倫 · 托勒就曾表示," 甚至創造它們的人也不知道它們能做什么,不能做什么。我預計,我們真正了解 GPT-4 能做和不能做的所有事情,可能還需要幾年時間。"
ChatGPT 現在的天花板,不代表就是 GPT 的天花板,但作為目前最厲害的大語言模型支撐的產品,ChatGPT 的走向,也能成為觀察 GPT 應用的一個窗口。關于 AI 的狂想還在繼續,時間已經過去了近半年,我們好奇的是,ChatGPT 的使用情況到底如何?它被高估了嗎?
ChatGPT 真的很多人用嗎?
對于 ChatGPT 的使用體驗,不同行業、不同人答案不同。有人把它當玩具,使用了一兩次后就不再登錄;有人努力把它變為工具,在工作中以提高效率;也有人,在努力將 ChatGPT 變為工具的過程中失敗了,因為覺得它 " 不夠好用 "。
夏楠屬于第三種。她從事外貿行業,會用 ChatGPT 寫工作郵件,也會讓它解答一些生活中的煩惱,為了能更好的使用 ChatGPT,她都是用英文發指令。
從 2 月開始使用 ChatGPT,她的體驗分為了三個階段,最開始是好奇,很多問題都想拋給 ChatGPT,看它怎么回答,探索它。從 5 月開始,她感覺 ChatGPT" 變笨了 ",之前能做到的,現在做不到了?,F在,她對 ChatGPT 的評價是," 不好用 "。
比如最近,他們公司接了一個炒菜機器人的 ODM(原始設備制造)業務,她想讓 ChatGPT 提供這個市場的預測數據,在反復推拉后,ChatGPT 還是沒有給她答案。而在寫工作郵件上,經過調教,ChatGPT 也只給到她一個命令式的跟進郵件,文字官方式的長篇大論,也不是她想要的,她希望 " 它能寫出有禮貌的,信息表達很明確的郵件 "。
她覺得,ChatGPT 之所以做不到,短板在于 " 不懂得人情世故 "。得不到想要的結果,她的使用頻次也降低了,從一個星期五六次變為了一周一次。
當然,之所以會有這樣的體驗,背后綜合影響因素很多,和使用者是否問到了 ChatGPT 擅長的領域有關,也要看使用者有沒有找到與 ChatGPT 合適的交流方式。
正在澳大利亞生活的 Lucy,從去年底 ChatGPT 一推出后就開始用英文使用它。現在,她日常用 ChatGPT 來整理學術研究上的思路、學習語言,是生活里必不可少的工具。只是,準確性的問題一直讓她煩惱,文獻參考需要自己找," 如果我質疑它的回答,它就會順著我的思路回答 "。
除了 ChatGPT 的使用體驗感受不一,從數據來看,ChatGPT 的普及率,暫時也還沒有想象中的廣。
摩根士丹利相關報告截圖
除了摩根士丹利的報告,還有一些數據可以作為佐證。根據 SimilarWeb 數據,3 月 -5 月,美國、日本是全球為 ChatGPT 貢獻流量份額最高的國家,分別位列第一、第三。不過,最近,美國的流量已經下滑了 10.28%。
ChatGPT 的全球流量分布 來源 / SimilarWeb 數據
美國方面,在 5 月底,皮尤研究中心發布了一份調查,他們在今年 3 月中旬在 1 萬多名美國成年人當中展開調查,18% 的人聽說過很多關于 ChatGPT 的事情,39% 的人聽說過一點,42% 的人根本沒有聽說過。
而在日本,根據日本 ICT 市場調查咨詢機構 MM 總研的最新調查報告,5 月 24 日 -31 日期間,以日本及美國企業所屬的 13814 名員工(其中,日本 13412 人、美國 402 人)為對象,進行的網絡調查結果是,日本企業的 ChatGPT 使用率僅 7%,與美國企業的 51% 使用率相比,兩者相差高達 44 個百分點。
日本企業中,近半數員工(46%)回答 " 不知道 "ChatGPT,而即便知道 ChatGPT,但回答 " 未使用 " 的比重也達 42%。
這些都是最近的報告,樣本量在 1 萬人左右。不過 ChatGPT 大熱后,全球關于它的使用報告眾多,觀點不一,甚至有的得出的是相反結論。上述報告有一定參考性,但也因地域和人群的差別,不一定能完全反應真實情況。
還有更明確的值得參考的整體性數據,可以幫助我們認識 ChatGPT 的應用現狀。
根據 SimilarWeb,ChatGPT 增長明顯放緩,尤其到 6 月,截至 6 月 20 日,6 月已經過去三分之二,訪問量比 5 月少了 38% 左右,粗略推算,到 6 月 31 日如果沒有特別新的刺激,6 月的環比流量或將下降。
ChatGPT 近期流量變化 來源 / SimilarWeb 數據
同時,還可以參考的是,根據 SimilarWeb,在 5 月,ChatGPT 的跳出率是 12.59%,低于谷歌、Youtube 等,而在 6 月 24 日,跳出率已經上升到 37.37%。平均訪問持續時間也從 8 分 32 秒,下降到 7 分 48 秒。
另一個數據是,接入 GPT 大模型后 Bing 的市場份額變化。
來源 / Statcounter
Bing 的市場占有率,在二三月份剛引入 GPT 時引發關注,根據網站通訊流量監測機構 Statcounter,2023 年 3 月 Bing 的市場份額是 2.86%,5 月是 2.77%,不僅占比沒有提高,甚至還有下降趨勢。
是什么限制了 ChatGPT?
關于 ChatGPT 應用上的問題,已經老生常談,不過這些問題對它應用普及上的影響,或許比想象中廣。
首先是 " 變笨 " 這件事。
6 月初,"ChatGPT 變笨了 " 的聲音引發過討論。不過 OpenAI 開發者推廣大使 Logan Kilpatrick 曾出面回應,表示自 3 月 14 日發布 GPT-4 以來,大模型的本體一直處于靜態,不存在大量外部數據污染模型的情況。同時他也承認,大模型本身存在不穩定性,因此對相通的提示詞,存在回答前后不一致的情況。
一位 AI 從業者告訴深燃,5 月就有國外從業者在 OpenAI 論壇里分享論證 GPT 變笨的文章。最近,他用 GPT-4 的 API 做了測試,讓它做簡單的計算題。從結果準確度來看,GPT-4-0314 取得了滿分,GPT-4 取得了 80 分,GPT-4-0613,勉強可以拿 50 分。其中,0314、0613 即指 3 月 14 號、6 月 13 號的快照(指整個系統在某個時間點上的狀態)。這個結果,給他一種 GPT-4 在被削弱的感受。
來源 / unsplash
根據監管機構 NewsGuard 的專家分析,OpenAI 最新版本的 GPT-4,在輸出信息方面,比 GPT-3.5 要糟糕。在今年 3 月份發布的報告中,NewsGuard 提到,GPT-4 不僅在其研究人員的提示下回答了完全虛假的新聞敘述,而且比 GPT-3.5 回答的內容更差。
在上述 AI 行業從業者看來,這樣變化的結果是,用戶需要變得更為具體和主動地引導 GPT-4,才能獲得與過去相當的回答質量。
這也再度影響 ChatGPT 的使用門檻,而這與 ChatGPT 的初衷有所背離。
最開始 ChatGPT 爆火,就有業內人士對深燃分析,它帶來的影響是將通用人工智能放在了每個用戶面前,也把人機交互的門檻,打到了最低點。
但目前來看,門檻還是存在。從 ChatGPT 的用戶畫像,也能看出這個產品的普及情況。根據 SimilarWeb 數據,使用者主要分布在計算機電子與技術行業,其中,編程和軟件開發占比最大。其他行業里,只有游戲行業中的視頻游戲機和配件的從業者占比較多。
在使用 ChatGPT 的體驗上,一位工程師給深燃的反饋最為積極,表示一直在用," 能幫我解決小的程序上的問題 "。
盡管都說," 淘汰你的不是 AI,是會用 AI 的人 ",如果普通人使用起來門檻越來越高,那也一定程度上脫離了 ChatGPT 的初衷。
還有兩個問題,是 ChatGPT 從最開始就面臨的質疑,即準確率和隱私保護。
根據上述日本相關機構的報告,在被問到今后若要繼續 / 擴大使用 ChatGPT,需要解決什么問題時,日本企業、美國企業分別有高達 49%、45% 的回答是 " 案件的精度 ",其次為 " 個人資料等隱私 ( 日企 34%、美企 35% ) ",和 " 對問題的理解程度 ( 日企 33%、美企 34% ) "。
準確度方面,OpenAI 的 CEO 山姆 · 奧特曼,也做出過解釋,這個程序會自信地宣稱一些東西是事實,但其實它是編造出來的,就像謊話連篇的政客一樣。他給這種現象起了個名字—— " 幻覺難題 "。
總之,準確率要實現起來非常不容易。原因就是因為它不是靠記憶,而是憑借演繹推理能力來工作。" 大語言模型靠的是推理的拼字游戲,不可能像數據庫一樣完全準確,人也不能完全保證準確 ",關注 AI 行業的工程師楊陽告訴深燃。
隱私方面,OpenAI 至今還沒有給出明確的解決方案。在加拿大工作的小虹就告訴深燃,公司特地發郵件通知,讓大家謹慎使用 ChatGPT。
基于這些限制,ChatGPT 的應用場景也受限制。
關注產業的投資人陳默默告訴深燃,它其實適合 " 生產力驅動 " 的內容生產,而不是 " 創意驅動 " 的內容生產,在前者上,能替代不少有重復經驗累積的人力。
用戶洛洛從 4 月開始使用 ChatGPT,她開了會員,主要用于寫腳本和文案," 只要能給它正確的公式,基本可以反饋給我任意思維的腳本,只是拿到手要改 "。她表示,產出的腳本比較基礎,沒法做成爆款,但它邏輯沒有問題," 像公司日常的一些大量的視頻輸出,是可以支持的 ",她現在的 ChatGPT 使用頻率,基本上一周 3 次以上。
現在夏楠調整了策略,只問它一些流程式的問題,比如開 ebay 網店的流程。盡管這類問題也可以問谷歌、百度,但 "ChatGPT 的回答更好 ",她舉例,最近她去德國旅行,讓 ChatGPT 給她安排旅游計劃,給出的答案有參考性,交通安排的也很清楚。
這些長期使用 ChatGPT 的用戶,不論對 ChatGPT 的使用體驗滿意與否,他們都提到,ChatGPT 更像是一個升級了的谷歌、百度,帶來了一定助力。
ChatGPT,象征意義高過實質意義?
最近,OpenAI 推出了類似于 LLM 版的 App Store,加速生態的建設,還被曝光了一些功能上的優化。這背后也隱藏著一個信號,GPT4 暫時已經到天花板,要加速生態建設,在 GPT5 出不來之前,先做一些體驗上的優化。
早在 4 月,山姆 · 奧特曼就表示,還沒有開始研究 GPT-5,也沒有立即開始的打算,還曾表示," 大型模型時代已經到頭了。"
據 OpenAI 官網,GPT 模型參數數量(可以理解為喂養模型的語言材料)在不斷提升。GPT-1 是 1.17 億,GPT-2 有 15 億,到了 GPT-3,飆升至 1750 億,GPT-4,根據國外媒體機構 Semafor 的一份報告,比 GPT-3 大六倍左右,具有 1 萬億個參數。
此前楊陽也對深燃表示,或許 GPT-4 就成長到頭了,語料是一個原因," 人類歷史上創造出的優秀資源就這些了 ",模型本身的限制也是一個原因。在他看來,現在 GPT-4 被限制了,應該有能力沒有被完全開發出來。
近日,Facebook 母公司 Meta 首席人工智能科學家 Yann LeCun 就指出,ChatGPT 背后的生成式人工智能技術已進入了死胡同,擁有太多的局限性。
出于巨頭間的競爭關系,或許很難將這話作為客觀參考。但可以肯定的是,ChatGPT 的確遇到了瓶頸。
要讓大語言模型有更好的應用,不少人把視線投向垂直領域的應用上。
AI 行業從業者秦凱對深燃做了一個比喻,ChatGPT 這類泛化型的人工智能,應用寬泛時,能力就像是高中生、大學生,和垂直場景結合時,fine-tuning(在自然語言處理中使用的技術,也叫微調)的數據足夠精確和貼合場景,能力就能變為碩士、博士,能解決更具體的需求。
楊陽也認同這一看法。他提到,目前的模型最多只能進行一倍左右的優化," 大家有一個基礎共識,GPT-5 來了,也不會帶來顛覆性的進化 ",短期內不可能達到 AGI(通用人工智能)水平。
來源 / unsplash
不過,他表示,現在做具體垂類應用,首先是費用高,訓練模型對公司來說依舊是不小的成本;其次是數據安全、數據隔離的問題,目前采用的辦法是," 在大模型基礎上套小模型 ",但帶來的問題是,現在的底層技術還在變化," 沒有人知道下一個模型,更優秀的模型什么時候出現 ",這個中間階段讓大家很迷茫," 如果三五年后才出現,那現在基于大模型做垂類的產品是不虧的,場景落地后有機會回收資金。但如果很快就出現了,那大家現在做的外掛型垂類產品,是沒有多少意義的。"
投資人陳默默表示,這是一個 " 先有雞還是先有蛋 " 的問題,他們還是愿意去看相關項目,在細分領域里切一個特定場景的應用,因為 " 哪怕未來的底層有變化,只要行業沒有變動,在應用層的行業理解上還是會有沉淀 "。
但他們在看項目時遇到的問題是,很難有人可以明確告訴他們,產品能節省多少人力成本。" 看下來,還是得給機器配個人 ",她舉例,關注賦能研發端論文篩選歸納相關的垂類產品,實際使用也還是需要一個人順著機器的結果,再做進一步驗真、開發和研究,實際上很難說效率有特別好的優化 ",所以現在,一些投資人都會傾向于再觀望觀望。
在關注垂類領域的 AI 創業公司的產品時,她的感受是," 我們對技術帶來的產業升級機會保持謹慎樂觀,目前可能它的市場意義,高過實質意義 "。
秦凱總結,人們對 ChatGPT 的期望過高,但有兩個瓶頸。首先,下一代大語言模型通過更大的參數規模和更強算力的收益邊際遞減,人們的期望可能無法很快滿足。其次,當前的大語言模型是泛化的,需要很長時間來解決特定、真實的問題。目前垂直領域的生成式 AI,已經變成了針對具體企業做定制化需求和私有部署的體力活," 底層模型依靠 transformer 方式缺乏解決非常復雜問題的能力,現在的應用情況與預期的水平相距甚遠 "。
應用還在繼續,技術還在發展,關于 ChatGPT 的應用及潛力還需要再觀望。即便是這樣,ChatGPT 已經讓一些人的生產效率,有了一個數量級的提高,即便當下有瓶頸,"ChatGPT 已經是很偉大的產品,這就夠了。" 楊陽表示。
* 題圖來源于 unsplash。應受訪者要求,文中夏楠、Lucy、楊陽、小虹、洛洛為化名。
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-25
頭條 23-06-24
頭條 23-06-24
頭條 23-06-24
頭條 23-06-24
頭條 23-06-24
頭條 23-06-24
頭條 23-06-24
頭條 23-06-24
頭條 23-06-24
頭條 23-06-24
頭條 23-06-24
頭條 23-06-24
頭條 23-06-23
頭條 23-06-23
頭條 23-06-23
頭條 23-06-23
頭條 23-06-23
頭條 23-06-23
頭條 23-06-23
頭條 23-06-23
頭條 23-06-23
頭條 23-06-22
頭條 23-06-22