文心一言來了:超級生產力工具上线!

Tech星球 發布於:2023-03-17



來源 | Tech星球

| 王琳


百度生成式AI產品“文心一言”今天交卷了。


就在下午舉行的新聞發布會上,李彥宏在現場展示了文心一言在文學創作、商業文案創作、數理推算、中文理解、多模態生成五個使用場景中的綜合能力。


對比下來,在大模型通用的優勢能力上,比如文學創作能力、商業文案寫作能力、數理邏輯推算能力上,文心一言已經逐漸接近人類水平。甚至得益於百度這個最大的中文搜索平台,文心一言具備出色的中文理解能力。這是目前全球任何生成類AI產品都無法比擬的。


比如當你詢問文心一言,明日黃花與昨日黃花有什么區別。它可以明確給出回復:


而將同樣的問題拋給ChatGPT,它顯然無法理解題意:


比如,當你詢問文心一言,關羽和秦瓊誰更厲害時,文心一言可以從战績、战略、战術多個角度分析:


而當同樣的問題拋給ChatGPT,它似乎無法做出更精細的評價:


雖然,文心一言現在也並不完美,李彥宏提及,這類大語言模型還遠未到發展完善的階段,進步空間很大,未來這段時間它一定會飛速發展,日新月異。


但用戶的熱情不減。新聞發布會後三小時內,排隊申請文心一言企業版API調用服務測試的企業用戶已達6.5萬家,申請產品測試網頁多次被擠爆,百度智能雲官網流量飆升百倍。


任何技術創新的發生一开始都不是盡善盡美的,而是慢慢迭代才得以完善。放在更長的視角來看,每一次工業革命無不是先進的生產力取代落後的生產力,將人類從重復繁雜的低端勞動中解放出來,而這些現在看起來先進的生產力,在誕生之初多多少少都存在問題。


作爲第四次工業革命一個現象級的產品,文心一言可以讓每一個人,每一家公司有機會享受技術帶來的紅利。大模型基礎設施公司、進行行業模型精調的企業、基於大模型底座進行應用开發的公司都可以將其視爲一個API,連接到應用程序,改變一個又一個行業。


過去10年,百度一直希望把技術變成人人需要的產品,文心一言的出現讓這種希望成爲了現實,每個人都可以利用這樣先進的生產力工具,爲自己服務,爲企業服務。


不誇張的說,文心一言是百度技術人員追逐技術改變世界的夢想的產物,是百度過去10年壓強式、馬拉松一樣的投入的成果,也是反饋驅動創新的最佳實踐。


全球大廠第一個生成式AI產品


全球大廠,誰將第一個推出第一個類ChatGPT產品成爲了科技圈、創投圈乃至普通用戶都最關注的事情。


在2月8日舉辦的Google Event大會,谷歌率先展示了旗下類ChatGPT產品Bard,不過出了烏龍,Bard答錯題了。谷歌顏面盡失,灰頭土臉得撤下了YouTube相關演示視頻。隨後,谷歌沒宣布發布日期,ChatGPT比想象的要難,谷歌並沒有準備好。


就在Google Event大會前一天,百度宣布其計劃在今年3月推出與OpenAI的ChatGPT類似的人工智能聊天機器人服務,該項目名字確定爲文心一言,英文名ERNIE Bot,三月份完成內測,面向公衆开放。隨後,阿裏、騰訊、華爲都宣布入局,但他們和谷歌一樣,並未公布產品發布的時間。


百度這次沒有吹牛。今天下午文心一言啓動產品測評,雖然對標ChatGPT難度很高,但百度依然是全球大廠中第一個做出類似產品的。


現場,李彥宏展示了文心一言在五個使用場景的表現,包括文學創作、商業文案創作、數理推算、中文理解和多模態生成。


大模型在回答文學創作領域的事實性問題經常犯的一個錯誤就是胡編亂造,或者說張冠李戴,Bard當時就是犯了這樣一個錯誤。


總結、分析、檢索內容對文心一言來說不在話下,在今天下午的產品測評中,文心一言根據對話問題將知名科幻小說《三體》的核心內容進行了總結,並提出了五個續寫《三體》的建議角度。


文心一言還具備推理能力,比如當問到,“於和偉和張魯一有哪些共同點”、“於和偉和張魯一誰更高”這類問題,文心一言也可以得出了正確答案。


這是因爲, 基於搜索業務積累,百度有世界上最大的知識圖譜,一直致力於給用戶提供唯一答案。這一切讓文心一言回答準確性及生成結果的可信度得到提升。


在商業文案創作上,文心一言還可以帶給你驚喜。當要求他給一個“用大模型服務中小企業數字化升級的科技服務公司”起名字時,它起完名字後,還會解釋這個名字的意思。比如起名智信科技,是結合了智能和信任的意思,體現了公司致力於中小企業提供智能化、可信賴的數字化服務。


系統並沒有教給文心一言這樣的能力,但是有研究表明,當數據規模大到參數達到千億級,大模型就可能發生“智能湧現”,湧現出知識和邏輯推理能力。文心一言大模型的訓練數據包括萬億級網頁數據,數十億搜索數據和圖片數據,百億級語音日均調用數據,及5500億事實的知識圖譜。因此,發生“智能湧現”,帶給用戶一些小驚喜並不意外。


當然,具備一定思維能力的文心一言在“雞兔同籠”這樣的數學題時也表現出色,最值得一提的是文心一言在中文理解和多模態上的表現。


在現場展示中,文心一言正確解釋了成語“洛陽紙貴”的含義、“洛陽紙貴”對應的經濟學理論,還用“洛陽紙貴”四個字創作了一首藏頭詩。


李彥宏表示,文心一言可以處理英文,但它的表現還沒有那么好。原因是數據注入沒有那么多,未來百度會持續加強投入,包括其他語種。


現在,信息流通的方式已經遠遠不止文字,而是包含圖片、視頻、音頻在內的多模態形式,文心一言可以幫助用戶做海報宣傳圖、宣傳視頻,甚至可以用方言,如四川話、東北話來回答用戶的問題。


“多模態是生成式AI一個明確的發展趨勢。”李彥宏表示,“未來,隨着百度多模態統一大模型的能力增強,文心一言的多模態生成能力也會不斷提升。”


十年蓄力,最全的技術儲備


百度能夠成爲全球大廠第一個推出類ChatGPT產品不是偶然。


從外部來看,過去一個月,超過600家合作夥伴宣布加入文心一言生態,期待盡早用上最新最先進的大語言模型。而百度內部的很多產品,從搜索到智能雲,再到自動駕駛,市場和合作夥伴都有明確需要。


但更重要的是內因。


自然語言處理是人工智能領域的明珠,也是要解決的核心問題之一。2010年,王海峰博士加入百度成立了“自然語言處理部”,這也拉开了百度押注人工智能的序幕。


百度扎根AI這些年,人類已經從信息時代逐漸進入到人工智能時代,IT技術的技術棧發生了根本性的變化,過去分爲三層:芯片層,操作系統層和應用層。現在可以分爲四層:芯片層、框架層、模型層和應用層。


百度是全球爲數不多進行全棧布局的人工智能公司,從高端芯片昆侖芯,到飛槳深度學習框架,再到文心預訓練大模型,搜索、自動駕駛等AI產品,每一層百度都有具有領先優勢。


外界不太熟悉的是,在成立自然語言處理部後,百度也於2011年开啓了其自研芯片之路,是國內第一批自研 AI 芯片的互聯網公司。等到2018年,昆侖芯片對外發布時,已經支持了百度業務多年。現在,已經有超過2萬片昆侖芯片得以落地應用。


2018 年7 月,李彥宏在百度 AI 开發者大會上喊出了要讓“EveryoneCan AI”的口號,飛漿就是這一口號的實踐者之一。2021年,飛漿超過了國外兩個老牌深度學習框架TensorFlow和PyTorch,成爲中國开發者使用最多的深度學習框架,在全球排名第三。


AI競速本質上就是算法、算力、算據的競爭,而飛漿和昆侖芯片讓百度集齊了這三大要素,正是基於此,飛漿推出3年後,百度便推出了文心大模型ERNIE 1.0,這就是去年开始大熱至今的“生成式AI”技術。目前文心大模型已經迭代到第三代,ERNIE 3.0目前每天接受數十億用戶的搜索請求和其他百度移動生態app的訓練,這讓模型得以更精準。


全棧布局的好處是四層架構之間,可以實現端到端優化,大幅提升效率。尤其是框架層和模型層之間,有很強的協同作用,可以幫助構建更高效的模型,並顯著降低成本。


過去10年,AI有過很多爭議時刻,投資人們覺得短時間內無法落地。投入Ai需要強大的战略定力,畢竟短期內它不能產生強大的現金流而長期來看商業價值巨大。


作爲一家上市公司,百度需要權衡股東利益,但更需要找到可以堅持十年,二十年,甚至上百年的事情。百度沒有只看眼前利益,而是找到了更具挑战性的事業。公司堅持在技術上壓強式投入,近十年累計研發投入超過 1000 億元。


剛剛過去的2022年百度核心研發費用達到214.16億元,佔百度核心收入比例達22.4%。如此高的研發投入,在大廠中鳳毛麟角。要知道,去年前三季度,阿裏、騰訊、美團的研發投入佔比分別約爲15%、10%和8%。


高研發投入也讓百度儲備先發優勢,面對大模型驚人的算力需求做到遊刃有余。


數據顯示,跑通一次100億以上參數量的模型,算力至少需要1000張GPU卡。GPU芯片中領先者如A100售價達1萬美元, 微軟Azure雲服務爲ChatGPT布署了超過1萬枚英偉達A100 芯片。


即使不使用頂級芯片,按照一張GPU五萬元的市場均價計算,1000張GPU意味着單月至少5000萬的成本。業界測算,gpt-3單次訓練成本至少460萬元。


文心一言有萬億級參數,可想而知,其光GPU成本就已經耗費了可能10億。這樣來看,文心一言只是百度在AI技術上投入的一個自然結果。


人人可用,最先進的生產力工具


文心一言現在顯然無法完美回答用戶的所有問題,在前端體驗上依然有些不足,事實上就連ChatGPT在其所擅長的文本交互一开始也不能做到战無不勝。


但我們不能因爲一些缺陷就否定它的價值,無論是ChatGPT還是文心一言,應該看到未來的發展潛力和可能性。


文心一言和ChaGPT所採用的技術都是一樣的,比如用於訓練階段的模型微調SFT, Supervised fine-tuning)、基於人類反饋的強化學習RLHF(reinforcement learning from human feedback)、給預訓練大語言模型做提示的Prompt都沒有差別。


我們看到了文心一言的不足,也必須承認文心一言在某些方面威力強大,比如文心一言不僅可以處理文字,還可以識別圖片、視頻和音頻。而這種多模態語言,才是未來發展的趨勢。


文心一言的定位是人工智能基座型的賦能平台,你可以將其視爲一個API,連接到應用程序,借助這個最先進的生產力工具,人們有望改變千行百業。


比如,大模型基礎設施公司通過雲計算輸出能力和服務,文心一言,將根本性地改變雲計算行業的遊戲規則。進行行業模型精調的公司,可以借助文心一言爲行業客戶提供更精準的解決方案。基於大模型底座進行應用开發的公司,可以像當初人們在安卓系統上开發出App一樣开發出一個個極具潛力的應用。


最重要的是,普通人也可以用它來解決工作上的一些問題,比如寫營銷方案,寫論文等等。確切得說,文心一言是一個人人可用的生產力工具。


中信建投《人工智能行業專題報告:從CHATGPT到生成式AI(Generative AI)-人工智能新範式,重新定義生產力》指出,生成式AI和此前的決策式AI模型最大的不同是,前者是根據已有數據分析、判斷、預測,而後者更強調學習歸納後進行演繹創造、生成全新的內容,本質上是對生產力的大幅度提升和改造。


不過最終,一個生產力工具是否好用依然需要人類的訓練加持。


這和大模型通過海量無標注數據訓練是不同的,需要每一位用戶的真實反饋,這些真實的用戶數據會融入到訓練中,持續提升效果。最終,打造出符合人類使用習慣的大語言模型。


任何一項先進工具的發明在誕生之初都不是完美的,200多年前,紐科門大氣式蒸汽機誕生,但效率低下。多年後,瓦特推出的改良版蒸汽機將效率提高了3倍,人類得以更快進入工業社會。


100多年前,德國發明家奧托制造了世界上第一台內燃機,但其對燃料要求高,無法大規模應用,後來燃料從煤氣變成了汽油,熱效率也從4.5%一步步突破30%,火車、汽車借此出現,人類的出行半徑得以迅速擴展。


作爲生成式AI最典型的產品文心一言無疑是AI時代最先進的生產力工具,但這個工具依然不夠好用。不過,歷史已經告訴我們,隨着人類使用、優化,每一個工具都會越來越符合人類使用習慣。到了那時候,百度技術人員追逐技術改變世界的夢想又進了一步。

追加內容

本文作者可以追加內容哦 !

2024/05/07 - 外匯經紀商評分