大模型拼應用最新戰況：智能帮手扎堆襲來_爱游戏娱乐

大模型拼應用最新戰況：智能帮手扎堆襲來

时间: 2024-11-20 01:40:22 | 作者: 爱游戏娱乐
AI將成為人類從事各種生產和活動的署理。AI等技術的大規模應用將重塑人的內涵，進而重塑人們的社會關系。

9月5日開幕的2024Inclusion·外灘大會上，復旦大學計算機科學技術學院教授黃萱菁共享了AI智能體（AI Agent）最近有多“熱”：不僅工業界的國際國內巨頭公司開始布局研發基於大語言模型的智能體，學術界把智能體用於科研創新如預測、剖析多蛋白復合物結構，眾多開發者還在谈天、購物、游戲、具身智能（具有物理實體並具備感知、決策、執行及交互才能的智能體——記者注）等領域應用智能體。

“大語言模型更倾向於對話與答疑，基於大模型的智能體更像人類的帮手，倾向於感知環境、規劃決策並採取行動。”黃萱菁介紹，现在，智能體應用已經適配在出行、政務民生、餐飲、景區、醫療、金融等領域場景。

大會開幕當天，AI日子管家、AI金融管家、AI健康管家等AI智能體露脸黃浦江岸。在大會所在地、曾見証我國工業發展的江南造船廠舊址，共30余項AI新效果相繼發布。

在清華大學AI研究院常務副院長孫茂鬆看來，當前智能體的發展得益於語言大模型在生成才能、代碼生成、圖像處理及3D建模等方面的進步。他認為，智能體技術正潤物細無聲地走進大眾日子，但這是一個量變引起質變的過程，“在大多数情况下要通過幾年迭代和積累，其功能才會有顯著提高。”

從1年半前的百模大戰，到本年5月大模型領域掀起的價格戰，到会本次大會的不少大模型廠商感触著大模型近兩年來發生的變化：功能提高和本钱下降。

“上一年行業首要在做模型基礎，中國也在巨大的市場期望裡跟進追趕、証明自己。”百川智能創始人兼CEO王小川習慣用“全新的時代”描述智能時代，他說，在智能時代，大模型帶來的是生產力的直接提高。

一個明顯的事例是，上一年12月谷歌公司推出的大語言模型Gemini在MMLU（大規模多任務語言了解）測試中，以90.0%的高分初次超過人類專家。該大模型從一開始就被創建為多模態模型，這意味著它可以歸納並流暢地了解、操作以及組合不同類型的信息，包含文本、代碼、音頻、圖像和視頻。

“大模型正從‘拼參數’走向‘拼應用’。”螞蟻集團總裁韓歆毅認為，大模型產品的目標可以濃縮為：好用、有用和用得起。對於用戶，這意味著一種全新的、愈加直觀的交互體驗﹔而對於商家，則意味著能夠更深化地了解用戶需求，進而供给更結構化和個性化的服務。

他以大會開幕首天發布的AI日子管家“支小寶”為例說，該應用基於螞蟻百靈大模型打造，具備國內首創的服務執行與智能陪同才能。

具體來看，用戶說句話就能辦到的事包含快速訂票、點餐、打車、查詢邻近吃喝玩樂、看醫保余額、異地就醫備案、給親友轉賬或發紅包、搜尋電子社保卡等。

“智能體能發揮大語言模型的專業性，帶來各種服務的迭代升級。”在黃萱菁看來，具身語言智能體所具備的視覺問答、圖片生成、標題生成、動作規劃和控制等多模態的輸入和具身輸出的方法，很或许是邁向通用AI的關鍵之一。

《連線》雜志創始主編、《5000天后的国际》作者凱文·凱利則認為，AI落地產業需求時間，“僅僅消化現有技術，或许就需求5-8年時間。”他在與韓歆毅線上對談時表明，现在人們把AI首要運用於一些东西型任務，價值首要體現在提高功率上。他認為，金融和醫療領域會最早應用並获益於AI的發展，“因為這兩個行業信息密度高。此外，廣告和營銷行業也會是最早遭到影響的行業之一。”

讓數字分身分擔作业，由AI健康管家找醫生、讀報告、陪看診，用語音喊AI金融管家幫助解讀市場熱點、剖析行業板塊……適配不同領域場景的AI帮手正進入人們的生產與日子。在復旦大學計算機科學技術學院教授、上海市數據科學重點實驗室主任肖仰華看來，AI將成為人類從事各種生產和活動的署理。AI等技術的大規模應用將重塑人的內涵，進而重塑人們的社會關系。

香港科技大學校董會主席、美國國家工程院外籍院士沈向洋則認為，AI智能體時代的到來，不會是一個奇特而強大的模型忽然替代了一切的作业流，“它触及技術、工程與市場的不斷磨合，最終以超預期的服務呈現給人類。”

他特别说到人機交互的新方法指向“AI與IA（Intelligent Augmentation，即智能增強——記者注）”的融合共進。這意味著一種以人為本的AI發展路徑，它聚集於運用技術提高人類的才能，而非取代人類，強調人類與AI之間的協作關系。

“（大模型產業）未來的發展路徑已經非常明確，將會從之前的大語言模型到多模態模型，未來邁向国际模型。未來必定會往具身智能方向上發展，往機器人方向走，其间一個特别形態便是自動駕駛。”沈向洋從算力视点介紹，大模型可分為通用大模型、行業大模型、企業大模型和個人大模型，其间通用大模型是AI的基礎，要訓練一個通用大模型至少需求萬卡，行業大模型是做領域應用的底座，需求千卡級別的訓練。

國家網信辦數據顯示，到2024年7月30日，我國已經完结備案的生成式人工智能服務大模型已達197個，從大模型的類型看，通用大模型、行業大模型分別佔比31％、69％。從行業大模型的類型看，教育領域19款、金融領域18款、辦公領域15款、政務領域11款、醫療領域11款，且正在向傳媒、招聘、家裝、心思等更廣闊的場景延伸。

“更多高質量、高價值的數據是在私域，在垂直行業，在千行百業，再往前走便是個人數據。”在肖仰華看來，现在的大模型還不能夠勝任專業任務，要想做到供给專業任務，用好私域數據或许是關鍵，“所以數據待发掘的潛力依然非常之大。”

可以必定的是，以智能體為代表的AI帮手在幫助解決具體問題上具備優勢。用西湖大學深度學習實驗室效果轉化負責人、西湖心辰CEO醒辰的話來說，大部分語音大模型在智商賽道不断比拼，“但许多的溝通場景不是光靠智力就可以完成，還需求情商與溝通才能。”

這也是许多人面對AI帮手的真實需求。既是教師又是父親的嚴鋒，是復旦大學中文系教授、博士生導師，他在大會期間參加圓桌討論“AI重塑未來日子的無限或许”時坦言，自己最期望有一個AI帮手、機器人來陪同自己的孩子。“因為我的孩子是一個孤獨症患者，孤獨症的中心問題是人際往来（存在）障礙。”

“我買了许多智能音箱，我信任這是未來通向陪同機器人的一種先驅，它們也在進化。”嚴鋒說，正是通過有意識地問這些放在客廳、臥室的智能音箱，他知道了孩子感興趣的是遠古動物、中世紀歷史，“我再向音箱提問的時候，孩子就會主動參與進來。”

好消息是，針對陪同領域的個性化需求如情緒疏導、客戶服務、兒童陪同等，已有應用落地。醒辰以大會期間正式發布的國內首款端到端通用語音大模型心辰Lingo為例說，該大模型在處理對話時直接了解語音，捕捉語氣、節奏和情緒，並進行語音回復，通過減少信息處理過程中的損失，讓“機器”更懂人。

“近幾年大部分AI數字人都是以东西來設計的，所以它首要意图是解決用戶遇到的問題，其次才是供给情緒價值。可是隨著许多AI技術的快速發展，大模型智能體對話才能越來越強，設計者開始更多關注數字人等AI帮手怎么更好地去解決情感方面的問題，供给情緒價值。”螞蟻集團數字人算法負責人楊明暉告訴中青報·中青網記者，隨著動態大模型包含視頻生成技術的快速發展，或许到下一年就會有比較老练的數字人方面的應用，“你輸入一張圖片，然后就可以和圖片中的人物語音對話，人物的表情和動作都可以生動天然。”

強腦科技創始人兼CEO韓璧丞認為，在技術發展非常快的時候，科研作业者應該更關注那些“走得慢”的人，比方肢體障礙人士、腦疾病患者群體。

過去10多年，這名哈佛大學腦科學中心博士生一向專注於腦機接口底層技術的研發。他認為，腦機接口技術在未來5-10年內，會發生3個階段的變化，分別是修復、增強和更高階的交互。“下一代的交互會變得更高階，比方現在是通過語言對話，未來或许不需求再通過語言對話，收到提問我們想一想就（把主意）傳遞出去了。”(朱彩雲)

公民日報社概況關於公民網報社招聘招聘英才廣告服務协作加盟供稿服務數據服務網站聲明網站律師信息保護聯系我們

人民網股份有限公司版權所有，未經書面授權禁止使用