每日經濟新聞 2025-12-30 20:00:26
一個越來越明顯的共識是,AI產業(yè)正從早期的技術模型探索,進入以“應用創(chuàng)新”“產業(yè)深耕”為核心的新階段,深度賦能政務、醫(yī)療、工業(yè)制造、交通、能源等關鍵領域,持續(xù)催生新業(yè)態(tài)、新模式。
每經記者|劉旭強 每經編輯|劉艷美
“個人級推理設備(AI PC)將從概念走向現實。”12月30日,第三屆全國先進計算技術創(chuàng)新大賽在成都舉行,中國工程院院士、清華大學計算機系教授鄭緯民在現場分享中提到,隨著AI大模型向普惠化、低成本方向發(fā)展,部署成本顯著下降,讓邊緣側、端側的低成本大模型應用從構想變成現實。
沿著這一思路,與會學界、企業(yè)及機構代表聚焦“成本普惠化”“應用垂直化”“產業(yè)生態(tài)化”等方向,探討AI如何與千行百業(yè)深度融合,并推動算力價值轉化為現實生產力。
一個越來越明顯的共識是,AI產業(yè)正從早期的技術模型探索,進入以“應用創(chuàng)新”“產業(yè)深耕”為核心的新階段,深度賦能政務、醫(yī)療、工業(yè)制造、交通、能源等關鍵領域,持續(xù)催生新業(yè)態(tài)、新模式。

圖片來源:主辦方提供
“現在智算算力需求非常旺盛,租GPU做AI推理,得提前兩個星期排隊預約。”鄭緯民表示,曾經由“模型訓練”主導的算力需求,如今已經轉向“推理”,簡單說就是AI從“學習成長”階段,進入了“給人干活”的實用階段,而這也催生出爆發(fā)式的算力缺口。
要讓AI高效“干活”,選對芯片是關鍵。相較于CPU,更擅長高效矩陣運算和高速數據讀寫的GPU脫穎而出。
不過高效的GPU也面臨“煩惱”,其內存主要用于存儲兩類數據,一是訓練所得的模型參數,二是推理過程中產生的中間結果。隨著Kimi等支持數百萬字上下文的模型走紅,AI大模型趨向“數據更多、模型更大、上下文更長”,但這也帶來了極高的推理負載,導致用戶量激增時頻繁宕機。
鄭緯民以熱門論文的推理需求為例,“十萬個用戶同時查詢,如果每個用戶都單獨存儲文章原文和推理中間結果,AI必然不堪重負。”
鄭緯民提到,業(yè)內的破解思路是“公共數據共享存儲”,即將重復出現的公共數據和推理中間結果僅存儲一份,讓所有用戶共用。通過“緩存復用”“以存換算”大幅減少算力浪費,從而緩解大模型AI宕機問題。
鄭緯民透露,該技術開源后獲得行業(yè)廣泛認可,英偉達、華為、阿里等國內外頭部企業(yè)都在采用。
除了存儲問題,公共算力“不夠用”也是一大行業(yè)痛點。
“我經常清晨五點半起來用AI查論文,往往問三次就會‘流量超限’。要是等到高峰期,可能問完一個問題,AI就會提示我‘休息一會’。其實不是我累了,是它忙不過來了。”
鄭緯民拿親身體驗舉例,大家常用的DeepSeek大模型,背后是由6000多塊芯片組成、耗資20多億元的“超級芯片”,但即便如此,高峰時段還是扛不住頻繁的用戶查詢需求。
鄭緯民介紹,針對企業(yè)部署本地推理的高成本問題,業(yè)內一項解決辦法是“CPU+GPU”協(xié)同的“性價比”方案。具體來說,就是把AI最需要快速運算的核心參數放在GPU里,把占比更高、不那么急的普通參數放在CPU里。這樣一來,只用一套更低成本的設備,就能讓大模型“滿血”運行。
鄭緯民透露,現在這個方案已經被多家大模型企業(yè)采用,相當于給企業(yè)提供了“平價解決方案”。
而這兩項技術創(chuàng)新,正讓AI PC概念加速走向現實。
“有可能過兩年,在座各位都會用上AI PC。”鄭緯民預判,就像當年計算機普及一樣,AI技術有望從“集群級服務”向“個人級應用”發(fā)展,這也是當下AI行業(yè)最值得關注的趨勢。
如果說前幾年是AI的技術競賽,今年則是產業(yè)場景中的價值兌現。
政策層面的系統(tǒng)性布局,為這場變革筑牢了根基。國家層面早已按下加速鍵。今年8月,國務院發(fā)布《關于深入實施“人工智能+”行動的意見》,明確提出到2027年,率先實現人工智能與6大重點領域廣泛深度融合,新一代智能終端、智能體等應用普及率超70%。
地方層面的實踐則讓政策落地生根,以四川為例,四川推進人工智能“一號創(chuàng)新工程”,將其納入“15+N”重點產業(yè)鏈,打造國家創(chuàng)新試驗區(qū),34個本土垂直大模型落地生根,形成政策與產業(yè)共振的良好生態(tài)。
工信部電子信息司副司長史惠康表示,當前,以先進計算為核心驅動力的科技創(chuàng)新正加速重構全球產業(yè)格局,催生出生成式人工智能、具身智能、數字孿生等前沿應用,深刻改變著人們的生產和生活方式,重塑全球創(chuàng)新格局和產業(yè)生態(tài)。
以技術突破、政策賦能為雙引擎,AI的產業(yè)應用快速落地。
以人工智能的重要分支具身智能為例,華為技術有限公司昇騰計算業(yè)務副總經理劉偉現場提供了一組數據:2024年具身領域投融資超過300億美元,是2023年的3倍以上,全年我國機器人相關企業(yè)注冊量就超19萬家。同時,海外英偉達、特斯拉、OpenAI等巨頭加快布局大模型+具身智能,并視為第二增長曲線。到2025年,大模型迅猛發(fā)展,引領AI、智能體、具身智能等產業(yè)爆發(fā),加速AI在行業(yè)核心場景的落地。
若把具身智能視為AI的“四肢”,智能體則是驅動產業(yè)協(xié)同的“大腦”。
2025年,被普遍認為是大模型智能體的“元年”。天府絳溪實驗室先進計算前沿研究中心業(yè)務支持部副部長李昕表示,隨著人工智能從“大模型”邁向“大應用”,多智能體協(xié)同技術正在打破單一應用的局限,“智能體經濟”已然成型。AI浪潮下,多智能體協(xié)同完成生產調度、質量檢測、設備維護的全流程,在智慧城市里聯動交通、安防、政務系統(tǒng)高效運轉,釋放規(guī)模化的智能價值。
隨著算力產業(yè)指數級增長、技術持續(xù)突破、生態(tài)協(xié)同開放態(tài)勢,AI普惠已不是抽象概念,而是通過“To B+To C”雙輪驅動,深度融入醫(yī)療、公安、金融、政務等社會運轉的方方面面。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP