百度發布大腦語言與技術、語音和視覺等多項技術產品

藍鯨財經發布於：2021-12-29

作爲百度AI多年技術積累和業務實踐的集大成，百度大腦已發展成爲全球領先的人工智能平台。12月28日，百度Create AI开發者大會“百度大腦論壇”舉辦。論壇圍繞打造人工智能時代的驅動引擎展开探討，帶來了百度大腦語言與技術、語音和視覺等多項技術產品的發布，以及飛槳在开源算法模型、產業級模型庫和企業級AI應用开發等方面的全新升級。

百度大腦語言與知識技術全布局，三大技術產品重磅發布

百度技術委員會主席吳華在論壇上表示，經過11年的發展，百度已形成了完整的語言與知識技術布局，包括知識圖譜、語言理解與生成技術和應用系統等。隨後，吳華帶來了三大技術產品的發布：全球首個知識增強超大模型鵬城-百度文心，全球最大中文跨模態生成模型 ERNIE ViLG，以及首個百億參數中英對話預訓練生成模型 PLATO-XL，實現了知識增強大模型、跨模態文圖生成、人機對話等領域的領先。

特別是全球首個千億知識增強的大模型鵬城—百度文心，得益於鵬城實驗室的算力系統“鵬城雲腦Ⅱ”和飛槳深度學習平台的強強聯手，解決了超大模型訓練的多個公認技術難題，使訓練效率大幅提升，模型效果更優。鵬城-百度文心已經在機器閱讀理解、文本分類、語義相似度計算等60多項任務取得最好效果，並在30余項小樣本和零樣本任務上刷新基準。

基於百度的語言與知識技術，百度也面向各行業开放了語言與知識开放平台。不僅包含开源數據集“千言”和知識生產平台“解語”，還研發了面向應用的能力引擎平台和知識中台，以及智能文檔分析平台、智能對話定制平台、智能創作平台、翻譯开放平台和內容審核平台等場景定制平台。

百度語音技術重要進展，SMLTA2全新發布

語音和語言天生更接近，因此，把語音識別模型和語義模型進行一體化後的準確率和交互成功率會大幅提升。百度語音首席架構師賈磊介紹了百度多模態語音交互的最新進展。百度提出的基於歷史信息抽象的流式截斷Confomer建模技術——SMLTA2，解決了傳統的自相關技術在進行長句識別時的計算爆炸問題和存儲爆炸問題，也很好地解決了注意力模型的焦點丟失問題。

SMLTA2通過Decoder到Encoder各層的注意力特徵選擇機制來引入反饋，使得最外層識別結果信息可以直接作用於編碼器內部的每一層的編碼過程，通過歷史信息抽象充分提取有效特徵信息，顯著改善了Transformer模型從NLP領域應用到語音識別領域面臨的各種問題。SMLTA2的這種全新的端到端建模方法，是對傳統Encoder-Decoder結構的端到端建模的結構性創新。

最後，賈磊還介紹了SMLTA的實際商業落地情況。浦發銀行在全國多個營業廳上线了語音交互系統，其中位於上海外灘的銀行網點語音交互識別率測試達到93.51%，語音交互已經由完全不可用變成基本可用。

智能視頻創作，計算機視覺的最新實踐

百度視覺技術部總監丁二銳重點介紹了計算機視覺在智能視頻創作中的最新進展。現階段，視頻內容生產正在由UGC（用戶生成內容）向AIGC（AI 生產內容）轉變。

智能視頻創作是一個多技術交叉融合的領域，對於一個創作者而言，同時掌握視覺生成、多模態、3D圖形學並不現實，但百度智能視頻制作技術兼顧內容創意和視頻功能創作，不僅實現了對人臉、人體的精細處理和環境的再塑造，在創作方法上，改善存量視頻並獲取新增視頻，保障了視頻的充足展現和分發。

丁二銳表示，智能視頻創作領域目前呈現蓬勃發展的態勢，技術的發展帶來了生產工具的變革，一旦與其他生產要素結合，將帶來無盡的想象力。

飛槳產業級平台再升級，讓AI應用門檻更低

除了技術上的融合創新，在工具與平台方面，飛槳從开源算法模型、產業級模型庫和企業級AI應用开發等方面實現升級，持續降低AI應用的門檻。

百度傑出架構師畢然分享道，目前百度飛槳官方支持的產業級开源算法模型超過400個，覆蓋計算機視覺、自然語言處理、語音和推薦等衆多深度學習應用領域。這樣全面覆蓋，使开發者可以很快地找到所需要的模型。並且這些產業級模型庫實現了訓練部署的全流程支持，开發套件支持靈活配置化調優。

畢然還詳細介紹了飛槳最新推出的產業實踐範例庫。針對產業實際場景的AI應用，範例庫提供完整的代碼實現，覆蓋任務解析、算法選擇、模型訓練及優化、推理部署及結果可視化等產業落地全流程，讓开發者快速上手，所學即所用。

百度智能雲AI產品研發部總監忻舟介紹了飛槳企業版AI开發雙平台EasyDL和BML在幫助开發者快速提升AI开發效率和資源使用效能的上的有效助力。

目前，飛槳企業版已經成爲應用和落地最廣泛的AI开發平台。基於雙平台的开發模式，同時滿足AI應用开發者和AI算法开發者的需求。基於飛槳推理部署工具鏈，飛槳企業版已經爲开發者測試並驗證了9345種模型芯片的組合，能夠覆蓋95%的適配需求，能夠節省开發者97%的自行適配开發時間。PaddleSlim結合全自動的模型組合壓縮算法，能夠使精度損失控制在1%以內時，推理的性能提升3到5倍；智能邊緣控制台的推出，則大幅提升模塊和系統集成的效率，集成的周期可以從天縮短到五分钟。

百度知識圖譜部、大數據部高級總監朱勇詳細介紹了在工業領域，百度打造的工業數據智能引擎如何降低AI的應用門檻。

朱勇表示，隨着產業數字化進程不斷深入，大數據的應用趨勢也逐漸從業務數據化發展到數據智能化，工業數據智能前景廣闊，機遇和挑战並存。百度基於領先的人工智能大數據技術，面向工業場景，打造了一套完整的工業數據智能引擎。它向下對接大數據平台，實現數據治理，向上支撐各種類型的業務場景需求，賦能電力能源、鋼鐵、化工、汽車制造等不同行業。百度工業數據智能引擎的核心是一系列可復用的工業模型以及支持定制化模型搭建的核心組件，包括數據分析、數據處理、AI算法和工業機理。

以鋼鐵行業爲例，爲了保證鍍鋅板具有良好的力學性能，需要根據鋼板的原料信息對鍍鋅工藝參數進行必要的調整。基於百度工業數據智能引擎可以進行力學性能預測，達到90%以上的準確率，通過工藝參數尋優，產品合格率達到99%。通過應用這套方案，企業客戶不僅能夠提升產品質量；相比傳統基於人工經驗的方式，還能大幅降低調試時間，從而提升生產效率。

最後，朱勇強調，在大數據和AI加速向工業滲透的背景下，工業數據智能前景可期。百度期待攜手更多开發者，共同助力工業智能化升級。

接下來，百度大腦將持續進化，不斷推動AI技術提升，通過融合創新，讓AI能力越來越強，與此同時，降低AI應用的門檻，讓技術的落地更加簡單，幫助越來越多行業和企業借助AI提升效率，創造價值。

追加內容

本文作者可以追加內容哦 !

百度發布大腦語言與技術、語音和視覺等多項技術產品

2024/04/29 - 外匯經紀商評分

最新消息