亚洲区成人a片在线观看-亚洲视频观看一区二区-97人妻精品一区二区三区免费-亚洲狠狠婷婷综合久久-久久精品娱乐亚洲领-可以直接看中文字幕av网址-欧美日韩高清午夜蜜桃大香蕉-91久久福利国产成人精品-亚洲美女毛片在线视频

電動新物種 - 新能源電動汽車行業(yè)媒體

量子位MEET2026:高通萬衛(wèi)星剖析終端側(cè)AI演進(jìn)與混合AI新路徑

   發(fā)布時(shí)間:2025-12-11 13:50 作者:趙磊

量子位MEET2026智能未來大會近日在北京拉開帷幕,本次大會以“共生無界 智啟未來”為核心主題,搭建了一個(gè)跨行業(yè)、高密度的交流平臺。來自科技、產(chǎn)業(yè)及學(xué)術(shù)領(lǐng)域的近三十位領(lǐng)軍人物齊聚一堂,圍繞人工智能+、AI Infra、智能終端、智能駕駛、低空經(jīng)濟(jì)、能源電力等前沿話題展開深度對話,分享前瞻觀點(diǎn)。

高通公司AI產(chǎn)品技術(shù)中國區(qū)負(fù)責(zé)人萬衛(wèi)星在大會上發(fā)表了以“混合AI:從云端到邊緣智能”為主題的演講。他指出,AI技術(shù)正經(jīng)歷從生成式AI向智能體AI的演進(jìn),生態(tài)系統(tǒng)也從單體模型向復(fù)合模型轉(zhuǎn)變,這將成為邁向智能體AI的重要基礎(chǔ)。萬衛(wèi)星特別提到,未來的AI體驗(yàn)將朝著混合AI方向發(fā)展,高通已通過量化壓縮、并行解碼、NPU及異構(gòu)計(jì)算架構(gòu)等技術(shù),推動端側(cè)AI向更主動、更高效的服務(wù)形態(tài)升級,構(gòu)建端云協(xié)同體系,為用戶提供更個(gè)性化的智能服務(wù)。

萬衛(wèi)星詳細(xì)闡述了AI應(yīng)用的演進(jìn)路徑。第一階段為“感知AI”,涵蓋自然語言處理、語音降噪、圖片識別等傳統(tǒng)技術(shù),這些技術(shù)已實(shí)現(xiàn)商業(yè)化落地。第二階段是“生成式AI”,依托大規(guī)模數(shù)據(jù)預(yù)訓(xùn)練,在人類監(jiān)督下完成文生圖、聊天機(jī)器人等任務(wù)。第三階段為“智能體AI”,其特點(diǎn)是能夠在幾乎無人類干預(yù)的情況下自主行動、預(yù)測意圖并編排任務(wù)。第四階段是“物理AI”,AI將理解真實(shí)物理世界并做出反饋,目前尚處于研究初期。

在終端側(cè)生成式AI的發(fā)展趨勢中,模型尺寸持續(xù)擴(kuò)大。手機(jī)已支持近100億參數(shù)的大模型部署,PC可支持約200億參數(shù),車載場景則支持200億至600億參數(shù)的模型。模型質(zhì)量也不斷提升,支持思維鏈和推理能力的模型已實(shí)現(xiàn)端側(cè)部署,上下文處理能力從兩年前的1K-2K增長至今年的8K-16K,甚至在特定場景下可支持128K文本的端側(cè)部署。終端側(cè)AI正從單一文字模態(tài)向文本、圖片、視頻、音頻、語音等多模態(tài)演進(jìn)。

端側(cè)運(yùn)行AI具有顯著優(yōu)勢,如個(gè)性化服務(wù)、隱私保護(hù)、無需網(wǎng)絡(luò)連接且成本低廉。然而,也面臨內(nèi)存和帶寬限制等挑戰(zhàn)。內(nèi)存限制制約了模型參數(shù)量,進(jìn)而影響模型能力上限;帶寬限制則影響推理速度和用戶體驗(yàn)。高集成度終端運(yùn)行大語言模型對能效控制提出極高要求,功耗過高可能觸發(fā)設(shè)備溫控機(jī)制。

為應(yīng)對這些挑戰(zhàn),高通在技術(shù)儲備和預(yù)研方面取得多項(xiàng)突破。通過量化壓縮技術(shù),將模型精度從8 bit、4 bit提升至2 bit,顯著減少內(nèi)存占用;采用并行解碼技術(shù),在端側(cè)運(yùn)行較小草稿模型一次性推理多個(gè)token,再由原始大模型校驗(yàn),提高解碼速度;利用先進(jìn)的NPU和異構(gòu)計(jì)算系統(tǒng),推動端側(cè)AI從被動式服務(wù)向主動式、個(gè)性化服務(wù)轉(zhuǎn)變。

以智能體AI的具體用例為例,用戶可通過自然語言與智能體交互發(fā)布微博。智能體理解用戶意圖后,打開微博APP,搜索照片并添加濾鏡,最終完成發(fā)布。用戶還可監(jiān)測回復(fù)并點(diǎn)贊或回復(fù)評論。這一用例在今年9月的驍龍峰會上展示,全程在端側(cè)運(yùn)行。

高通的產(chǎn)品覆蓋智能眼鏡、PC、汽車、智能手表、IoT等豐富品類,支持所有驍龍?jiān)O(shè)備間的智能互聯(lián)。算力較小的設(shè)備如智能眼鏡、智能手表,可通過Wi-Fi或藍(lán)牙與手機(jī)、汽車連接,共享本地?cái)?shù)據(jù),將大模型推理任務(wù)轉(zhuǎn)移至算力更大的設(shè)備,實(shí)現(xiàn)分布式個(gè)性化推理。

高通公司認(rèn)為,AI體驗(yàn)未來將向混合AI方向發(fā)展。終端側(cè)運(yùn)行垂類高效模型,提供更安全、個(gè)性化的AI服務(wù);云端運(yùn)行更大尺寸模型,提供更通用、更強(qiáng)大的AI服務(wù)。高通將憑借低時(shí)延、高速且安全的連接技術(shù),確保混合AI場景下的端云協(xié)同與連接。

 
 
更多>同類內(nèi)容
全站最新
熱門內(nèi)容
本欄最新