在GSMA 2025 MWC上海大會首日的高通公司代理式人工智能峰會上,高通技術公司AI/生成式AI產品管理副總裁Vinesh Sukumar博士指出,生成式AI發展正在進入全新階段,邊緣AI發展重心正在向邊緣終端轉移。高通公司
6月18日,生成式GSMA 2025 MWC上海正式拉開帷幕。邊緣本屆為期三天的高通公司盛會在上海新國際博覽中心(SNIEC)舉行,匯聚約400位演講嘉賓與思想領袖,生成式帶來主旨演講、邊緣峰會論壇及前沿技術展示等精彩內容。高通公司今年大會圍繞四大核心主題展開:5G融合、生成式人工智能+、邊緣行業互聯與賦能互聯。高通公司
在大會首日的生成式代理式人工智能峰會上,高通技術公司AI/生成式AI產品管理副總裁Vinesh Sukumar博士指出,邊緣AI發展正在進入全新階段,AI發展重心正在向邊緣終端轉移。當前,AI正在向智能體AI領域轉型,高通相信AI將成為新的UI,并覆蓋廣泛終端。與此同時,為實現這一愿景,高通公司已經構建了覆蓋廣泛邊緣終端的硬件和軟件技術,為智能體AI體驗在終端側的發展打造了堅實基礎。
以下為演講全文:
大家下午好,我是Vinesh Sukumar。在高通,我們主要致力于在感知AI、生成式AI、智能體AI以及物理AI(Physical AI)等領域,賦能從手機到汽車等不同終端實現激動人心的AI體驗。今天我們要討論生成式AI,高通在中國和全球AI產業生態中扮演的重要角色,以及我們將在不久的將來推出的一些激動人心的體驗。
那么首先,縱觀AI的發展歷程,早期AI技術主要集中在分割、檢測、分類、圖像增強等感知AI領域,這些技術為賦能智能手機體驗奠定了基礎。但隨著時間的推移,這些體驗也發生了很大的演變,類似技術也擴展到了汽車、PC等市場,以及XR和工業網絡等新興領域。在這些領域中,我們都在探討從感知數據到多模態數據的轉變,多模態數據可以是文本、圖像或視頻形式,且全部都基于提示(prompt)生成。我們將這些技術匹配到不同的應用賽道上,從而幫助在生產力、游戲甚至內容生成領域打造全新的用戶體驗。而在高通,我們正在將這些知識積累應用到所有相關領域。
正如我之前提到的,高通非常重視生成式AI和智能體AI。實際上我們是最早展示大模型可以完全在邊緣運行的芯片平臺廠商之一,早在2023年的MWC巴塞羅那上我們就演示了在端側基于提示生成對話內容,或基于提示生成1K x 1K分辨率的圖像。
那AI未來的發展方向如何呢?在高通,我們非常重視與眾多的模型開發者合作,致力于推動大型基礎模型向更加垂直行業或任務專用型模型轉變,并助力實現邊緣終端運行。這些行業專用模型可能會非常龐大,參數量可能達到70-100億,我們已經開始推動這些模型在不同形態的終端上運行。
在模型領域,過去人們通常認為更大的模型意味著更好的質量,但縱觀大模型的發展過程,從通義千問、Meta、Google或微軟推出的模型中可以看出,小模型的質量正在快速提升并追趕大模型的能力。以模型智能指數對比為例,眾多的小語言模型(SLM)已經達到了Llama 3 700億參數大模型的水平。
為何邊緣模型正在變得愈發重要和關鍵呢?它們能夠在生產力或內容創作領域為用戶提供豐富的體驗。過去,模型會面臨如何真正實現終端側部署的挑戰。針對這一挑戰,高通提供了高通AI軟件棧,能夠支持模型完全在邊緣平臺部署。我們始終致力于為包括開發者在內的生態系統合作伙伴提供機會,讓應用能夠實現云端訓練,并在高通平臺賦能的終端上運行。
在過去的12到18個月里,我們在邊緣AI領域實現了諸多關鍵用例的商業化應用。過去,高通每年賦能大約200到300個AI應用。在過去的12個月左右,我們更加重視生成式AI領域。在消費領域,邊緣AI已經能夠支持內容創作、照片編輯、圖像修復、圖像擴展等諸多應用;在企業領域,還有代碼生成等更多應用。這一切都是可行的,因為我們在基礎技術構建方面投入了大量精力,以確保這些應用可以在各類終端上高效運行且實現全面優化。
在過去,生成式AI已經帶來了諸多助力,但其僅支持單一模態。現在,我們正在向所謂的智能體AI領域轉型。我們相信,AI將成為新的UI(用戶界面),并覆蓋廣泛終端。
要如何實現這一目標?首先要看我們期望打造什么樣的用戶體驗。為此,我們致力于融合多種數據模態。這些數據模態可能基于圖像、音頻、文本、語音甚至視頻。基于這些模態支持,我們可以理解用戶意圖,并匹配連接多個應用以調用AI處理能力,從而滿足用戶需求。這就催生了AI智能體這個概念。智能體AI側重于解讀需求并采取行動,從而走向自動化。實現智能體體驗頗具挑戰性,但高通正在不斷強化基礎技術構建,為這些智能體AI用例筑牢根基。
我們可以推動包括娛樂、電商、禮賓服務、地圖導航甚至音樂等多種領域的智能體AI用例發展。為了實現這些目標,需要廣泛的邊緣側布局,能夠理解用戶需求且將其轉化為恰當操作的強大軟件棧。
在將用戶意圖轉化為恰當的操作時,總會出現某一設備可能無法回答或響應用戶查詢(query)的情況。這時如果用戶需要進行設備間通信,我們可以通過高通AI軟件棧來實現。高通的產品覆蓋廣泛的邊緣終端,涵蓋從手機到PC、XR等多種產品形態,因此這對我們來說更容易。此外,憑借在這些終端上收集到的海量用戶數據,我們也能更成功地解讀用戶意圖并采取行動。
智能體AI在進行商用部署時也面臨許多挑戰,比如智能體AI的準確性、可預測性、一致性表現如何?它是否能夠精準匹配用戶需求?為此,擁有必要的軟件棧支持至關重要。我們的高通AI軟件棧非常強大,經過長期技術積累,可以支持針對特定任務的多種小語言模型。
其次,要實現更好的服務質量意味著當用戶提出特定提示(prompt)時,AI能夠以最快速度響應,這需要在硬件方面大力投入。為實現這一目標,高通打造了CPU、GPU等通用計算單元,以及Hexagon NPU這樣的專用加速器。
最后但同樣重要的是如何實現規模化擴展,為開發者社區提供靈活性。這一關鍵在于提供必要的工具和軟件支持,使開發者可以更輕松適應不同的環境和情況。
而我們已經為這些需求打造了技術基礎設施。各位將在未來6個月內,看到更多來自高通公司的發布,我們將助力推出更豐富的面向消費者的應用,敬請關注。
前面我簡要提到了該如何提高智能體AI的服務質量,我們能夠做到這一點,是因為我們擁有高通Hexagon NPU這樣的專用引擎。作為一個專用引擎,它能夠支持矩陣運算、張量運算等任務,這針對需要降低續航影響的持續型用例尤為重要。
現在,隨著我們向AI推理時代邁進,正如我一直在說的,我們總是會面臨邊緣平臺因性能受限而無法解決用戶查詢(query)的問題。在這種情況下,如何確保用戶體驗不受影響?在高通,我們已經將邊緣推理進行了跨多個終端的分布式部署。如果某些查詢無法通過終端側算力解決,我們就轉而使用基于高通平臺的本地邊緣服務器來繼續查看、理解和回答查詢;如果本地邊緣平臺無法解決,AI會獲取用戶的上下文信息,然后將任務轉移到中央云子系統,根據用戶的個人知識圖譜來處理查詢,然后給出更合理的回復。
非常感謝這次演講機會,謝謝大家!
(作者:新聞中心)