omniture

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

2025-04-09 16:34

智東西(公眾號:zhidxcom)
作者 | GenAICon 2025

4月1日-2日,一場全場干貨爆棚的生成式AI盛會,在北京圓滿舉行。

開年以來,DeepSeek的異軍突起,改寫了中西大模型競爭敘事。生成式AI似乎猛然沖進一個全新征程中,中國企業(yè)更是斗志昂揚地踴躍創(chuàng)新,不僅領銜AI開源盛世,還掀起了新一輪模型部署與AI應用研發(fā)熱潮,在這千載難逢的歷史機遇期全速沖鋒。

為此,我們發(fā)起了一場聚焦前沿技術與產(chǎn)業(yè)趨勢的春日AI聚會——2025中國生成式AI大會(北京站)。

大會以“大拐點 新征程”為主題,兩天之內(nèi),超過50位產(chǎn)學研嘉賓密集輸出高濃度、高質(zhì)量的干貨信息,深度解構(gòu)DeepSeek引發(fā)的變革狂潮,全面展示覆蓋深度推理模型、多模態(tài)模型與世界模型、AI Infra(AI基礎設施)、AIGC應用、Agents(智能體)、具身智能等領域的生成式AI最新進展。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲中國生成式AI大會主會場開幕式、GenAI應用論壇、大模型峰會、分會場技術研討會、展區(qū)人流密集

本屆大會主會場舉辦開幕式、GenAI應用論壇、大模型峰會,分會場舉辦3場以DeepSeek R1與推理、AI智能體、具身智能大模型為主題的技術研討會,期間既有同頻共振,又有激烈觀點交鋒,現(xiàn)場參會觀眾超過1500人。

展區(qū)亦是人頭攢動,從早到晚充斥著熱切的交流聲,Alluxio、Zenlayer、DriveNets、澳鵬數(shù)據(jù)、晴數(shù)智慧、中昊芯英、GMI Cloud、焱融科技、英博數(shù)科、華為云、研惠通、新晧誠科技、楓清科技、科華數(shù)據(jù)、首都在線、清智圖靈等16家企業(yè)帶來最新技術產(chǎn)品展示。

這已經(jīng)是智一科技旗下智猩猩、智東西共同發(fā)起中國生成式AI大會的第四屆,也是AI青年學者密度最高的一屆。自2023年以來,大會累計吸引了數(shù)千人線下參會,線上觀看人次更是超過1000萬,成為國內(nèi)AI領域最具影響力的產(chǎn)業(yè)峰會之一。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏 ▲聯(lián)想集團Game of AI科普視頻在大會展播:聯(lián)想工廠制造控制塔MCT2.0,生成式AI在制造業(yè)首次落地

智一科技聯(lián)合創(chuàng)始人、CEO龔倫常在致辭環(huán)節(jié)宣布:今年,中國生成式AI大會正式升級為“智領未來”北京人工智能系列品牌活動之一。

“智領未來”是北京市科委、中關村管委會打造的北京市人工智能領域的活動品牌。此外,同樣作為“智領未來”北京人工智能系列品牌活動之一的中國AI算力峰會將于今年6月在北京舉辦。

龔倫常還預告了將于今年舉辦的多個主題會議:4月底,中國汽車智能化創(chuàng)新峰會將在上海車展期間同步舉辦;9月,全球AI芯片峰會將在上海舉辦;11月,中國具身智能機器人大會將在深圳舉辦。歡迎感興趣的朋友們關注。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲智一科技聯(lián)合創(chuàng)始人、CEO龔倫常致辭

一、開幕式:突破大模型預訓練瓶頸,為AI應用爆發(fā)掃清障礙

進入2025年,AI領域涌現(xiàn)哪些新關鍵詞?慢思考推理技術如何緩解大模型預訓練瓶頸?怎樣讓機器人操作交互像跳舞一樣絲滑?Agents(智能體)落地企業(yè)需攻克哪些挑戰(zhàn)?國產(chǎn)算力怎么解鎖萬卡集群難關?

在大會首日開幕式上,產(chǎn)學研嘉賓圍繞深度推理模型、具身智能機器人、AI智能體、AI算力基礎設施、AI應用,分享了對最新技術思路與推動落地的觀察與思考。

1、人大趙鑫:慢思考推理技術如何緩解大模型預訓練瓶頸?

中國人民大學高瓴人工智能學院教授趙鑫談道,大模型本質(zhì)上是一個條件概率生成模型,思維鏈會提升預測正確的可能性。

當前訓練模型性能增長會出現(xiàn)邊際效益遞減,其中數(shù)據(jù)和算力是探索擴展法則的主要限制,這也是為何當下需要慢思考推理技術。

慢思考推理技術的基本思路是“搜索+學習”的結(jié)合,具體來看,包括基于多次采樣的方法、基于樹搜索的方法、基于SFT(監(jiān)督微調(diào))的方法、基于RL(強化學習)的方法。

趙鑫教授團隊在慢思考技術方面進行了大量研究。在RL技術領域,找到可驗證的訓練數(shù)據(jù)非常重要,團隊系統(tǒng)探索了類R1模型的復現(xiàn)方法。

推理模型本質(zhì)上可以認為是一個具備逐步推理/動作規(guī)劃的“大腦”,未來推理模型可能會深刻影響現(xiàn)有智能體的設計模式。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲中國人民大學高瓴人工智能學院教授趙鑫

2、清華許華哲:如何讓機器人的操作交互像跳舞一樣“絲滑”?

清華大學交叉學院助理教授、博導、星海圖聯(lián)合創(chuàng)始人許華哲談道,當前機器人做跳舞、跑步、扭秧歌這類事已經(jīng)很嫻熟了,有大量數(shù)據(jù)支撐,但在操作交互方面數(shù)據(jù)十分匱乏,還有很長的路要走。

解決數(shù)據(jù)難題,讓機器人有觸覺是非常關鍵的,這樣數(shù)據(jù)才能更豐富,團隊設計了仿真手套,可以讓機器人同步人手的操作。

有了數(shù)據(jù)還不夠,數(shù)據(jù)量也非常關鍵,為此,團隊通過DemoGen的方式豐富數(shù)據(jù)量,借此機器人的泛化能力可以得到進一步提升。相比傳統(tǒng)方式,通過DemoGen的方式獲得數(shù)據(jù)的速度快了上萬倍。

未來讓機器人能夠泛化地去做更多的柔性操作,是團隊努力的方向。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲清華大學交叉學院助理教授、博導、星海圖聯(lián)合創(chuàng)始人許華哲

3、PINE AI李博杰:AI原生團隊是組織形態(tài)的一場重大變革

PINE AI聯(lián)合創(chuàng)始人、首席科學家李博杰認為,AI Agent在爆火的同時,也面臨著企業(yè)知識孤島、GUI使用困難、缺少獨立測試環(huán)境、無法長時間運行等問題。

要打造AI原生團隊,讓AI真正成為“數(shù)字員工”,需要為Agent打造類似開源社區(qū)的溝通文化,實現(xiàn)開放透明的信息共享,并配備AI友好的團隊協(xié)作工具接口、完善的測試環(huán)境與測試用例,同時讓每個員工都擁有AI助理。

從技術層面來看,未來Agent還需要在明晰需求、主動溝通、主動協(xié)作、長期記憶、自我反思回溯與高精度內(nèi)部知識庫搜索等方面實現(xiàn)突破,才能真正實現(xiàn)從工具到團隊成員的轉(zhuǎn)變。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲PINE AI聯(lián)合創(chuàng)始人、首席科學家李博杰

4、壁仞科技丁云帆:64卡4TB顯存訓練滿血DeepSeek-V3,異構(gòu)混訓逐步邁向萬卡集群

DeepSeek引爆了大模型落地元年。壁仞科技AI軟件首席架構(gòu)師丁云帆認為,大模型落地需要工程和算法的協(xié)同創(chuàng)新,數(shù)據(jù)是燃料,算法是引擎,算力是加速器。

壁仞科技目前有萬卡集群整體解決方案和智算生態(tài),希望通過軟硬協(xié)同&算法與工程協(xié)同,系統(tǒng)性地破解大模型算力難題:硬件集群算力方面,壁仞科技自主原創(chuàng)了GPU芯片架構(gòu),引領Chiplet技術趨勢;軟件有效算力方面,有大模型訓推一體平臺,業(yè)界首次實現(xiàn)大模型訓練自動彈性擴縮容。業(yè)界首創(chuàng)三級異步checkpoint,千卡集群千億參數(shù)可以實現(xiàn)自動斷點續(xù)訓小于5分鐘,大幅提升集群穩(wěn)定性。

大規(guī)模分布式優(yōu)化方面,壁仞科技針對國產(chǎn)GPU高效適配DeepSeek進行了一系列技術優(yōu)化創(chuàng)新,64卡4096GB顯存即可支持DeepSeek-V3滿血版高效全參訓練,而其他已公布方案至少需要256卡。

此外異構(gòu)聚合算力方面,壁仞科技自主原創(chuàng)了異構(gòu)GPU協(xié)同訓練方案HGCT,支持4種及以上異構(gòu)GPU協(xié)同訓練同一個大模型,解決了異構(gòu)混訓的關鍵技術挑戰(zhàn),已實現(xiàn)數(shù)千卡規(guī)模混訓,下一步將突破萬卡混訓。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲壁仞科技AI軟件首席架構(gòu)師丁云帆

5、英諾天使基金王晟:AI應用爆發(fā),需要新終端設備的出現(xiàn)

英諾天使基金合伙人王晟談道,2023年是大語言模型的爆發(fā)期,2024年則轉(zhuǎn)向多模態(tài)技術,但2024年被寄予厚望的“AI應用元年”并未如期而至,主要原因是缺乏新終端設備和新場景定義,當前既有設備的場景需求已接近飽和。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲英諾天使基金合伙人王晟

未來,AI應用的爆發(fā)可能需要于新終端設備、新計算能力的出現(xiàn)。能夠提供情緒價值的AI玩具和陪伴類產(chǎn)品也擁有巨大的潛力,因為人類為情緒價值買單的意愿非常強烈。

此外,AI公司的發(fā)展方向正從工具提供轉(zhuǎn)向智能代理,未來會成為“造人”的公司,讓AI能夠承擔更復雜的任務,甚至取代人類從事多種職業(yè)。2025年,AI領域的關鍵詞包括應用、AI硬件、具身智能和世界模型,這些方向?qū)⒍x未來的技術和市場格局。

二、高端對話:中國AGI新征程全速起航,全產(chǎn)業(yè)鏈迎巨大發(fā)展機會

以《DeepSeek開啟大模型下半場 中國AGI新征程全速起航》為主題的高端對話,由智一科技聯(lián)合創(chuàng)始人、智車芯產(chǎn)媒矩陣總編輯張國仁主持,彩云科技創(chuàng)始人兼CEO袁行遠,GMI Cloud創(chuàng)始人兼CEO Alex Yeh,PINE AI聯(lián)合創(chuàng)始人、首席科學家李博杰,智澄AI創(chuàng)始人及CEO胡魯輝,四位嘉賓分別作為AI應用、算力云、Agent、具身智能企業(yè)代表進行分享。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

智一科技聯(lián)合創(chuàng)始人、智車芯產(chǎn)媒矩陣總編輯張國仁談道,今年春節(jié)以來,從DeepSeek、人形機器人到通用Agent產(chǎn)品Manus,中國團隊不斷造出現(xiàn)象級AI產(chǎn)品,2025年AI發(fā)展似乎進入了“中國時刻”,隨著中國AGI新征程全速起航,中國市場、中國公司在全球AI格局扮演的角色和發(fā)展特征都備受關注。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲智一科技聯(lián)合創(chuàng)始人、智車芯產(chǎn)媒矩陣總編輯張國仁

1、DeepSeek顯著提升成本效益

PINE AI聯(lián)合創(chuàng)始人、首席科學家李博杰認為,DeepSeek-R1揭示了大模型訓練的真實成本,讓世界了解到只要方法得當,便能訓練出優(yōu)秀的模型。

GMI Cloud創(chuàng)始人兼CEO Alex Yeh談道,DeepSeek的開源模型顯著降低了企業(yè)的部署成本,使企業(yè)能夠以低成本快速構(gòu)建應用。

彩云科技創(chuàng)始人兼CEO袁行遠更是用事實說話,提到彩云科技旗下產(chǎn)品在切換到DeepSeek后,成本降低了90%,毛利率轉(zhuǎn)正。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲彩云科技創(chuàng)始人兼CEO袁行遠

2、中國開源活躍度高,年輕人展現(xiàn)出后發(fā)優(yōu)勢

談及中美AI發(fā)展的差異,Alex Yeh觀察到,中國在開源社區(qū)的活躍度和快速落地能力顯著優(yōu)于美國,這也意味著中國在AI應用爆發(fā)上會有巨大的機會。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲GMI Cloud創(chuàng)始人兼CEO Alex Yeh

彩云科技旗下的產(chǎn)品正在出海。袁行遠分享說,海外用戶對數(shù)據(jù)、隱私等問題的關注度較高,與國內(nèi)用戶區(qū)別明顯。他認為中國有望通過大量高質(zhì)量的人才儲備,在中美AI對決中取勝。

在李博杰看來,AI行業(yè)領域知識獲取更便捷,對經(jīng)驗的要求相對較少,使許多年輕的中國企業(yè)和研究者能展現(xiàn)出后發(fā)優(yōu)勢。

3、做基礎模型還是AI應用?

針對做基礎模型還是AI應用的選擇問題,Alex Yeh認為大廠偏重基礎模型的訓練,而中小企業(yè)則應專注于快速落地和應用開發(fā)。

AI訓練需要消耗海量的數(shù)據(jù)與算力。智澄AI創(chuàng)始人及CEO胡魯輝相信,未來的創(chuàng)新將圍繞如何更高效地利用數(shù)據(jù)和算力展開,創(chuàng)業(yè)公司在未來十年也仍將有巨大的發(fā)展空間。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲智澄AI創(chuàng)始人及CEO胡魯輝

彩云科技既做AI基礎研究,又開發(fā)了彩云天氣、彩云小夢等AI應用。在袁行遠看來,在AI應用落地的過程中,高性能底層模型已如“電力”般廣泛可及,行業(yè)重點逐漸從基礎算法轉(zhuǎn)變?yōu)閷眉毠?jié)的極致追求。以天氣預報為例,通用AI模型無法敏銳地識別云圖中的細微變化和噪音,需要運用大量的一線行業(yè)知識才能完美勝任。

4、未來兩年是垂直領域Agent的關鍵突破口

PINE AI正在打造能聽、能看、能說、能操作電腦的通用AI Agent,未來希望成為數(shù)字員工和個人助理。

李博杰說,Agent的形態(tài)正在變化,決策能力、通用性不斷增強,未來兩年是垂直領域Agent的關鍵突破口,企業(yè)需要在這一階段積累品牌聲譽與網(wǎng)絡效應,為2027年左右通用Agent爆發(fā)做好準備。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲PINE AI聯(lián)合創(chuàng)始人、首席科學家李博杰

除了完成單一任務之外,通用Agent的價值還在于并行完成大量重復性工作,為生產(chǎn)、生活節(jié)省時間,提供便利。在李博杰看來,這類Agent有望在2025年初步落地,產(chǎn)生價值。

5、具身智能可能在五年內(nèi)實現(xiàn)

胡魯輝談道,大模型可能只是AI發(fā)展的一個階段性成果,AI發(fā)展正從生成式AI邁向物理智能,最終實現(xiàn)通用人工智能(AGI)。

李博杰也認為,具身智能很有可能是AI到達甚至超過AGI的路徑。具身智能在與現(xiàn)實世界交互的過程中,獲得大量知識與數(shù)據(jù),助力模型能力持續(xù)提升。

Alex Yeh預測具身智能將在未來五年內(nèi)實現(xiàn),特別是在工業(yè)領域的應用。

他提到多模態(tài)數(shù)據(jù)的整合將推動AI向更高維度發(fā)展,為AGI的實現(xiàn)提供新的路徑。AI目前還缺少物理數(shù)據(jù),通過VR、AR等技術收集,并結(jié)合虛擬場景訓練,可加速具身智能的發(fā)展。

針對近期資本退出人形機器人公司的爭議,胡魯輝相信行業(yè)共識能夠推動科技發(fā)展、人類進步,堅持長期主義很重要,亞馬遜、微軟等大公司的成功都源于長期堅持。因此,投資應注重長期價值。

三、GenAI應用論壇:從生活到企業(yè),如何用AI掀起生產(chǎn)效率變革?

伴隨著前沿模型快速迭代突破,AI應用迎來前所未有的繁榮期,快速將AI技術轉(zhuǎn)化成能夠解決消費級、生產(chǎn)級問題,帶來實際價值的賦能工具。

在大會首日GenAI應用論壇上,AI平臺、視頻生成、智算云、AI PPT、AI搜索、AI動漫、端側(cè)芯片領域的嘉賓代表各抒己見,剖析產(chǎn)業(yè)問題,暢談落地思路,分享他們在真實應用場景中的實踐經(jīng)驗和對未來趨勢的研判。

1、楓清科技高雪峰:單一模型無法解決生產(chǎn)級問題,AI落地產(chǎn)業(yè)有三要素

楓清科技Fabarta創(chuàng)始人兼CEO高雪峰認為,單一產(chǎn)品、技術或模型難以解決復雜的生產(chǎn)級問題,只有將各類AI技術落地在企業(yè)、產(chǎn)業(yè)之中,帶來真正的高價值場景,融合為生態(tài)系統(tǒng),才能讓AI技術更富有生命力、更繁榮。

AI技術在產(chǎn)業(yè)中落地,有三個關鍵要素:知識引擎、行業(yè)大模型、智能體平臺。要把生成式AI技術應用到產(chǎn)業(yè)端,最需要實現(xiàn)決策智能。

楓清科技采取了以數(shù)據(jù)為中心的AI平臺架構(gòu)落地的范式,還推出知識引擎和行業(yè)大模型雙輪驅(qū)動的智能體平臺,幫助企業(yè)實現(xiàn)多場景價值落地。該平臺通過多模態(tài)數(shù)據(jù)存儲和計算,智能化構(gòu)建企業(yè)知識庫,支持精準推理和復雜推理能力。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲楓清科技Fabarta創(chuàng)始人兼CEO高雪峰

2、愛詩科技孫偉哲:視頻模型需兼顧趣味與速度,幫每個人成為生活的導演

愛詩科技是全球最早訓練視頻生成大模型的團隊之一,正以高頻的技術研發(fā)節(jié)奏,進行底層模型的迭代。愛詩科技企服負責人孫偉哲分享說,針對短視頻時代用戶習慣的特點,打造視頻生成模型需要兼顧趣味與速度,前者能促進用戶的關注與傳播,而后者則是提升用戶體驗的關鍵。

語言曾經(jīng)是傳遞信息的最好介質(zhì),但目前我們接受的大部分信息都來自于視頻。全球視頻創(chuàng)作需求已大量涌現(xiàn),日均視頻播放量達800億次,企業(yè)也需要通過AI技術實現(xiàn)視頻內(nèi)容生產(chǎn)的降本增效。愛詩科技希望通過視頻生成技術,實現(xiàn)創(chuàng)作平權,幫助每個人成為生活的導演。

愛詩科技的PixVerse是全球最早實現(xiàn)千萬級MAU的視頻生成產(chǎn)品,并同步發(fā)力B端業(yè)務,利用視頻生成技術,為企業(yè)客戶在數(shù)字營銷、信息流廣告、短劇創(chuàng)作與出海、游戲設計與開發(fā)等領域提供助力,并提供了持續(xù)、精準的運營服務。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲愛詩科技企服負責人孫偉哲

3、GMI Cloud King Cui:推理服務成AI出海關鍵支撐,及時彈性擴容是核心性能

GMI Cloud亞太區(qū)總裁King Cui談道,基礎模型能力提升和開源生態(tài)的豐富,為AI應用爆發(fā)提供了核心必要條件,這背后,為中國AI產(chǎn)品出海提供關鍵支撐的就是推理算力。

AI應用往往會出現(xiàn)用戶規(guī)模和訪問量短期暴漲等現(xiàn)象,因此提供及時性、擴展性、穩(wěn)定性的推理服務至關重要。

GMI Cloud的目標是打造更高性能的GPU推理云服務,支持全球范圍自動擴縮容、一鍵部署推理模型、搭載自動容錯機制等。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲GMI Cloud亞太區(qū)總裁King Cui

4、像素綻放PixelBloom蒲世林:AI帶來的效率革新符合發(fā)展趨勢,需理性擁抱

像素綻放PixelBloom(AiPPT.com)聯(lián)合創(chuàng)始人蒲世林談道,隨著底層算力和模型層成本的顯著下降,AI應用層迎來全面爆發(fā)的機遇。

像素綻放PixelBloom在AI PPT領域,通過ToC、To Partner ToC、ToB三種商業(yè)化路徑,既直接服務消費者,也與頭部企業(yè)合作提升辦公效率;同時還開放API能力,與聯(lián)想、釘釘?shù)扔布蛙浖S商深度集成,構(gòu)建開放生態(tài),覆蓋辦公人群。

在進軍海外市場時,AiPPT.com注重做好本土化,提供多語言版本和本地化模板,滿足不同國家的市場需求,還通過孵化和并購來擴展產(chǎn)品矩陣。

在蒲世林看來,AI技術帶來的效率革新符合人類發(fā)展趨勢,企業(yè)需理性擁抱AI,不低估但也別期待過高,通過實際應用探索能力邊界,以抓住未來十年的AI紅利。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲像素綻放PixelBloom(AiPPT.com)聯(lián)合創(chuàng)始人蒲世林

5、博查AI翁柔瑩:AI比人類更需要搜索引擎

博查AI搜索聯(lián)合創(chuàng)始人兼CTO翁柔瑩認為,AI時代,用戶的搜索習慣已由“關鍵詞搜索”轉(zhuǎn)變?yōu)?ldquo;自然語言對話”,內(nèi)容的生產(chǎn)、流動、消費也在發(fā)生變化,在AI為用戶整理、總結(jié)信息的過程中,內(nèi)容的消費主體已經(jīng)變成了AI。

AI大模型的訓練數(shù)據(jù)存在滯后性,必須通過聯(lián)網(wǎng)搜索來獲取最新的內(nèi)容,才能為用戶提供更好的信息服務,從這一角度來看,AI比人類更需要搜索引擎。

為AI打造的搜索引擎與傳統(tǒng)搜索引擎在架構(gòu)上有相似之處,依舊需要實時獲取高質(zhì)量信息。博查采用多模態(tài)混合搜索和語義排序技術,能突破傳統(tǒng)搜索引擎的技術瓶頸,滿足大模型對于高質(zhì)量世界知識的需求,還打造了全球首個多Agent架構(gòu)的智能體搜索,為AI提供專業(yè)領域知識。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲博查AI搜索聯(lián)合創(chuàng)始人兼CTO翁柔瑩

6、中文在線周立強:AI降低動漫短劇門檻,制作成本降低50%

中文在線AI動漫部總經(jīng)理周立強談道,中國AIGC應用市場正在加速發(fā)展,預計2024年至2028年年均復合增長率將超過30%。作為勞動密集型行業(yè),動漫領域正受到AIGC相關工具的深刻影響。

傳統(tǒng)動漫短劇制作通常包含原文理解、劇本改寫等11個環(huán)節(jié),而AI已將流程壓縮至設定理解、生圖合成、后期處理等5個步驟。AI動漫短劇的優(yōu)勢在于具備跨國傳播能力、支持工業(yè)化量產(chǎn),且制作成本顯著下降——單部作品的制作周期可縮短70%,成本降低約50%。

周立強指出,AI動漫短劇已逐步突破單一流量變現(xiàn)階段。預計未來三年,掌握AIGC全鏈路能力的團隊有望占據(jù)全球短劇市場30%以上的份額。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲中文在線AI動漫部總經(jīng)理周立強

7、光羽芯辰周強:端側(cè)AI的發(fā)展促使手機架構(gòu)變革,可能孕育出新的大型公司

光羽芯辰創(chuàng)始人兼董事長周強談道,過去幾年,AI經(jīng)歷了從低谷到高峰的周期,AI創(chuàng)新的核心在于實用性,只有當技術可用且有價值時,市場關注度才會提升。

早期AI應用多局限于云端,而端側(cè)AI的興起使AI能夠深入生產(chǎn)生活各領域,比如應用到工廠的機器人上,顯著提升生產(chǎn)力。大模型的出現(xiàn)增強了AI能力,但也暴露了硬件性能不足的問題。

端側(cè)AI需要新的技術架構(gòu)以降低功耗、提升性能和帶寬。以手機為例,隨著AI未來的發(fā)展趨勢,智能手機將進化為AI手機,將集成更多端側(cè)數(shù)據(jù),成為所有智能終端的中心,光羽芯辰的端側(cè)芯片以及創(chuàng)新的解決方案和架構(gòu)將極大的助力這一變革。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲光羽芯辰創(chuàng)始人兼董事長周強

8、Zilliz郭人通:對于Agent構(gòu)建,我們?nèi)绾斡行еС趾A繑?shù)據(jù)檢索,挖掘隱藏于長尾的高價值信息?

Zilliz關注如何有效檢索海量數(shù)據(jù),發(fā)掘隱藏于長尾的高價值信息。在OpenAI發(fā)布Deep Research功能之后,Zilliz也嘗試了復刻。

據(jù)Zilliz合伙人、產(chǎn)品總監(jiān)郭人通分享,對于Deep Research這類Agent系統(tǒng),在數(shù)據(jù)基礎設施層面需要在數(shù)據(jù)建模、部署、緩存、多租、冷熱數(shù)據(jù)處理等方面做好優(yōu)化,聚焦信息檢索質(zhì)量,提高單位成本可支撐的檢索迭代輪次,以保證 Agent 對問題的理解度以及對信息的挖掘深度。Zilliz目前已提供系統(tǒng)性解決方案。

對于提高查詢質(zhì)量,目前有一系列經(jīng)過生產(chǎn)驗證的方法,包括查詢改寫,如多查詢條件生成、查詢拆解、意圖識別等,這有助于突破傳統(tǒng)RAG技術的搜索局限性。此外,帶正負樣本的查詢增強、多模態(tài)搜索也能有效提升搜索質(zhì)量。

目前,許多企業(yè)已切入垂直Agent方向,海量領域數(shù)據(jù)也引發(fā)數(shù)據(jù)Infra的變革,基于S3構(gòu)建的數(shù)據(jù)Infra正逐漸獲得更多企業(yè)用戶的選用。今年下半年,Zilliz將推出面向AI應用的數(shù)據(jù)湖解決方案,從五月開始,Zilliz會面向業(yè)界進行介紹,敬請關注。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲Zilliz合伙人、產(chǎn)品總監(jiān)郭人通

四、大模型峰會:判趨勢,剖解法,全面直擊算法、算力、數(shù)據(jù)挑戰(zhàn)

大會第二天舉行的大模型峰會,更加聚焦于大模型產(chǎn)業(yè)鏈底層技術,從模型、中間件、云服務、知識圖譜、存儲、網(wǎng)絡、芯片、數(shù)據(jù)平臺等多維度切入,探討突破大模型算法、算力、數(shù)據(jù)關鍵瓶頸的可行路徑。

現(xiàn)場,焱融科技首次發(fā)布了KV Cache在推理場景性能優(yōu)化數(shù)據(jù)。實測數(shù)據(jù)顯示:在長上下文場景中,使用YRCloudFile KVCache可實現(xiàn)高達13倍的TTFT性能提升,延時縮短超4倍。

1、上交大戴國浩:全面直擊云邊端不同場景推理需求挑戰(zhàn),半分離式方案下周開源

上海交通大學副教授、無問芯穹聯(lián)合創(chuàng)始人戴國浩談道,真正能模仿人類智力的模型往往是推理需求,但現(xiàn)有云側(cè)和端側(cè)很難滿足模型推理需求。

云側(cè)有PD融合式、PD分離式兩種技術路線,其中,PD融合式的技術路線將計算和存儲進行融合的好處是內(nèi)存利用率更高、無需傳遞KV cache,但缺點是不同任務間干擾大;PD分離式技術路線,將計算和存儲資源分離的好處是計算單元容易隔離、抗干擾,但存儲冗余和不均衡會帶來額外開銷。

因此,無問芯穹取長補短打造半分離式方案Semi-PD,實現(xiàn)計算分離存儲融合,Semi-PD將于一周后開源整體代碼,月底開源整個集群代碼,Semi-PD在一體機和分布式集群推理等場景下將帶來顯著性能提升。

其端側(cè)思路是通過輕量化方式讓終端負載變小,SpecEE技術引入機器學習、模型自適應等,可以判斷是否在級聯(lián)結(jié)構(gòu)當前層輸出了正確結(jié)果。該技術能無感兼容任何端側(cè)輕量化方案,整套代碼將在本月開源。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲上海交通大學副教授、無問芯穹聯(lián)合創(chuàng)始人戴國浩

2、智澄AI胡魯輝:人形機器人“不好用”,與大模型數(shù)據(jù)挑戰(zhàn)有差別

智澄AI創(chuàng)始人兼CEO胡魯輝認為,機器人將是未來AI生態(tài)中的重要組成部分,物理智能有望成為AI的下一波浪潮,實現(xiàn)更廣泛的通用人工智能。目前人形機器人泛化能力較差,直接導致成本高昂,歸根結(jié)底就是“不好用”。

與大模型一樣,物理智能面臨著數(shù)據(jù)、模型、環(huán)境、算力等方面的挑戰(zhàn),但挑戰(zhàn)的內(nèi)核有所區(qū)別。物理智能可用的數(shù)據(jù)量更少,需要在“機器人訓練場”中采集數(shù)據(jù),機器人端側(cè)算力限制也對模型能效提出了要求。

智澄AI從世界模型的研發(fā)與人形機器人本體的打造兩個角度切入,打造的TR4機器人能以視覺+力度感知的方案實現(xiàn)物體抓握,無需依賴觸覺。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲智澄AI創(chuàng)始人兼CEO胡魯輝

3、焱融科技張文濤:高性能全閃存儲在訓練與推理中如何破解AI算力瓶頸?

焱融科技CTO張文濤分享說,針對大模型訓練和推理的存儲解決方案,焱融科技通過Multi-Channel技術聚合多個網(wǎng)卡、帶寬等,提供高性能內(nèi)核私有客戶端,能夠滿足高性能元數(shù)據(jù)訪問需求,為企業(yè)提供高效、靈活的存儲支持。

焱融科技在數(shù)據(jù)管理方面,采取智能分層和數(shù)據(jù)加載功能來優(yōu)化管理流程。此外,焱融科技順勢推出的DataInsight數(shù)據(jù)編排管理平臺,幫助企業(yè)解決其應用AI大模型中的海量歷史業(yè)務數(shù)據(jù)管理難題;支持多維度組合查詢,實現(xiàn)百億級數(shù)據(jù)秒級檢索。通過自研DataFlow技術,用戶可自定義數(shù)據(jù)流動策略,確保數(shù)據(jù)按需、快速嵌入業(yè)務流程。平臺還具備增量數(shù)據(jù)自動感知能力,保障用戶從知識庫平臺訪問時獲取最新數(shù)據(jù),進一步提升數(shù)據(jù)流動效率。

在運維方面,焱融科技通過提供目錄集來做好多租戶管理和隔離,并設置了彈性數(shù)據(jù)網(wǎng)絡,使一套存儲能夠支持多種網(wǎng)絡平面,并幫助管理員簡化基礎設施建設。

其產(chǎn)品性能出色,依托于分布式元數(shù)據(jù)集群能夠支撐千億級海量文件,能夠支持高速無損網(wǎng)絡及多種接口,還適配多個國產(chǎn)化平臺。在本屆大會上,焱融科技還首次發(fā)布了KV Cache在推理場景性能優(yōu)化數(shù)據(jù)。

實測數(shù)據(jù)顯示:在長上下文場景中,使用YRCloudFile KVCache可實現(xiàn)高達13倍的TTFT性能提升。在TTFT≤2秒的嚴苛約束下,其支持的并發(fā)數(shù)提升達8倍,且在高并發(fā)負載中延遲可降低4倍以上。張文濤談到Y(jié)RCloudFile KVCache可構(gòu)建PB級KVCache緩存層,有效突破GPU顯存限制,顯著提升緩存命中率與推理上下文長度。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲焱融科技CTO張文濤

4、Zenlayer陳秀忠:token洪流下算力網(wǎng)絡三大趨勢,實時交互、分布式推理、高效IDC

Zenlayer行業(yè)拓展總監(jiān)陳秀忠談道,token是大模型世界的基礎單位,過去8個月,token使得整個網(wǎng)絡世界流量增長,達到移動互聯(lián)網(wǎng)時代的3~4倍。

token的整個生命周期包括AI工廠生產(chǎn),再經(jīng)網(wǎng)絡傳輸給用戶,其在生產(chǎn)過程需要大量算力和電力,在傳輸和消費環(huán)節(jié)需要靠近用戶的推理節(jié)點實現(xiàn)即時交互。

在token洪流下,未來的三個演進趨勢包括實時交互的全球網(wǎng)絡、分布式推理的易用模型服務、高效的IDC?;诖?,Zenlayer構(gòu)建了覆蓋全球的專線網(wǎng)絡、覆蓋亞太地區(qū)的AI機房、在現(xiàn)有邊緣節(jié)點推出模型服務等。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲Zenlayer行業(yè)拓展總監(jiān)陳秀忠

5、清程極智師天麾:如何打造國產(chǎn)模型與國產(chǎn)算力間的橋梁?

清程極智聯(lián)合創(chuàng)始人、產(chǎn)品副總裁師天麾分享說,在DeepSeek、QwQ等國產(chǎn)推理模型爆火之后,大模型私有化部署需求大幅度增加。在國外算力獲取困難、國產(chǎn)顯卡軟件生態(tài)不完善的背景下,打造連接國產(chǎn)模型與國產(chǎn)算力的橋梁尤為迫切。

清程極智已聯(lián)合清華大學開源了赤兔推理引擎,支持在非Hopper架構(gòu)設備(如早期大部分英偉達GPU和大部分國產(chǎn)芯片)上原生運行FP8模型,打破硬件綁定,提升算力使用效率,并能有效保留模型原有精度。

目前清程極智基于赤兔引擎推出多款大模型私有化部署方案,可根據(jù)不同場景需求提供針對性解決方案,結(jié)合企業(yè)業(yè)務,提供從私有化部署到智能體開發(fā)的一站式服務。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲清程極智聯(lián)合創(chuàng)始人、產(chǎn)品副總裁師天麾

6、首都在線張振宇:以全棧國產(chǎn)化為特色,助攻生成式AI規(guī)?;涞?/strong>

首都在線集團智算產(chǎn)品總經(jīng)理張振宇談道,隨著DeepSeek爆火,AI大模型國產(chǎn)化趨勢正在加速,推理市場將迎來大規(guī)模增長。首都在線后續(xù)也會更聚焦于推理算力的布局。

此前首都在線智算云已成功應用于多個生成式AI場景,如自然語言處理、圖像生成、視頻生成等,公司今年將持續(xù)優(yōu)化“一云多模、一云多芯、一云多池”的戰(zhàn)略布局,去構(gòu)建高度靈活的AI服務平臺,我們的平臺不斷拓展支持的模型種類,為用戶提供更豐富的選擇,滿足不同場景需求。

首都在線Maas云平臺通過構(gòu)建云端協(xié)同調(diào)優(yōu)體系,以算力效能優(yōu)化為基礎、模型即服務(MaaS)平臺為核心,為AI開發(fā)者及算力伙伴帶來創(chuàng)新性升級,形成了閉環(huán)式技術解決方案,不僅有效提升了GPU利用率,降低了訓練成本,能夠為客戶提供更加高效、靈活、低成本的算力服務,還為大模型從實驗室走向產(chǎn)業(yè)化提供了關鍵技術支撐。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲首都在線集團智算產(chǎn)品總經(jīng)理張振宇

7、海致科技李思宇:以圖為核心,打通大模型與多模態(tài)行業(yè)知識

海致科技技術總監(jiān)李思宇談道,大模型實際項目落地的Prompt提示詞工程,RAG檢索召回增強、Agent Function/Tool Call、SFT監(jiān)督微調(diào)訓練四種基本方法,其關鍵是讓大模型結(jié)合多模態(tài)行業(yè)知識。

針對此,海致科技的思路是統(tǒng)一知識與數(shù)據(jù)認知,其解決方案以圖為核心,結(jié)合工具將標量數(shù)據(jù)和向量數(shù)據(jù)打通形成有機整體。

通過將大模型與知識圖譜融合,海致科技形成了基礎模型層、語義知識層、邏輯圖譜層、智能體應用層,可基于基礎模型、元數(shù)據(jù)知識體系,在應用層之上構(gòu)建智能體、工作流。

實際落地中,其解決方案接入警情案件等五情數(shù)據(jù),可融合跨不同事件、不同情報數(shù)據(jù),形成完整事件對象關系圖再以此進行信息挖掘,實現(xiàn)匯聚非結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)的整體圖譜。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲海致科技技術總監(jiān)李思宇

8、中昊芯英朱國梁:Scaling Law延續(xù)下的AI芯片軟件棧重構(gòu)

中昊芯英軟件研發(fā)負責人朱國梁介紹,目前,Scaling Law正沿著測試時計算、強化學習與預訓練三條路徑延續(xù)。需要不斷重構(gòu)AI芯片軟件棧來滿足新的算力挑戰(zhàn)。

對大部分廠商而言,超大Batch-Size依舊是優(yōu)先事項,下一個Transformer級別的架構(gòu)尚未出現(xiàn)。

目前在推理方向優(yōu)化,探索方向包括KV緩存卸載、PD分離、稀疏注意力和MoE通信優(yōu)化等。

強化學習方面,隨著強化學習兩階段訓練的范式形成,訓練和推理協(xié)同調(diào)度需求不斷增長。

預訓練方面,需要在訓練通信特征、訓練通算重疊與訓練容錯等方面對現(xiàn)有軟件棧做出修改。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲中昊芯英軟件研發(fā)負責人朱國梁

9、澳鵬董成:大模型愈往垂類應用端發(fā)力,對數(shù)據(jù)質(zhì)量要求愈高

澳鵬Appen中國及韓國區(qū)副總裁董成通過澳鵬在各領域大模型部署中數(shù)據(jù)訓練的最佳實踐,重點分享了對大模型應用趨勢的觀察。以AI Agent為代表,未來,大模型必定應用到具體的垂直領域中,比如金融、醫(yī)療、代碼、音樂、文學等。

這一趨勢對數(shù)據(jù)的高質(zhì)量、專業(yè)度、多垂類提出了越來越高的要求。對此,澳鵬提供了多種AI輔助的前沿數(shù)據(jù)采標工具和方案,包括文本對話、多模態(tài)交互、思維鏈推理工具等。

董成認為,AI大模型行業(yè)正經(jīng)歷顯著變化,Llama和DeepSeek等開源模型在性能上逐漸趕上甚至超過閉源模型,一些企業(yè)也從閉源向著開源方向轉(zhuǎn)變。同時,大模型企業(yè)的研發(fā)越來越關注復雜任務方向,從最初的簡單對話向模型推理、垂直領域應用、多模態(tài)等方向發(fā)展。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲澳鵬Appen中國及韓國區(qū)副總裁董成

10、云軸科技王為:AI實踐應用分四級,基礎設施構(gòu)建面臨四大挑戰(zhàn)

云軸科技CTO王為解讀了當前AI基礎設施構(gòu)建面臨的挑戰(zhàn),包括模型尺寸增加、上下文窗口增加、全模態(tài)支持、多品牌算力支持等。

類比自動駕駛,AI實踐可對應作為工具、作為參考建議、主導到端到端實踐的L1~L4級別。云軸科技已在AI輔助售后、代碼、文檔等方面有所應用。其中AI輔助售后、代碼輔助處于參考建議階段,輔助文檔為主導階段,這背后凸顯出諸多基礎設施的構(gòu)建難題。

AI賦能企業(yè)內(nèi)部的技術架構(gòu)需要穩(wěn)固的智算底座、模型層,以及包含易用開發(fā)、性能評測等工具的運營與應用層。模型層的資源管理員主要關注底層資源使用情況,開發(fā)者只需直接導入模型做精調(diào)、推理等賦能業(yè)務。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲云軸科技CTO王為

11、Alluxio湯文軍:AI時代,高性能分布式緩存如何實現(xiàn)極致I/O優(yōu)化?

Alluxio解決方案架構(gòu)師湯文軍分享說,企業(yè)在搭建和優(yōu)化AI高性能數(shù)據(jù)訪問平臺時,面臨著數(shù)據(jù)方面的業(yè)務壓力、GPU稀缺昂貴且利用率不高、數(shù)據(jù)解決方案復雜等問題。針對這些問題,Alluxio推出了去中心化的Alluxio Enterprise AI產(chǎn)品方案。

具體來看,針對ML/AI GPU訓練對I/O提出的諸多要求,Alluxio使用一致性哈希在worker節(jié)點上緩存數(shù)據(jù)與元數(shù)據(jù),這顯著減少了I/O RPC長度,減少單點故障并降低了Master節(jié)點性能瓶頸;優(yōu)化性能時,使用零拷貝優(yōu)化、并行與隨機讀優(yōu)化,解決了讀放大問題。

最終,Alluxio實現(xiàn)了高性能、低延遲、高可用、容量線性擴展等優(yōu)化效果,這套方案可應用于數(shù)據(jù)預處理、模型訓練、部署、推理等環(huán)節(jié),已在眾多場景實際落地,帶來GPU利用率、運維成本等方面的顯著收益。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲Alluxio解決方案架構(gòu)師湯文軍

12、澎峰科技張先軼:解讀AI算力部署進階路,從一體機到專線模式

澎峰科技創(chuàng)始人&CEO張先軼分享說,用戶在AI算力部署上的策略通常從單機部署開始,例如使用一體機。隨著需求的增長,用戶會逐步擴展到私有化部署,通過MaaS平臺納管更多硬件設備,并分批建設算力資源,還可以將現(xiàn)有服務器納入管理,形成一種類似擴容的方案。

為了進一步提升算力利用率和數(shù)據(jù)隱私安全性,用戶可以借助國產(chǎn)智算中心的模型的專線模式進行混合部署。這種模式不僅能提高計算中心的資源利用率,還能在保障數(shù)據(jù)隱私的同時,支持更多應用場景。從商業(yè)模式上看,專線部署采用ToB性質(zhì)的計費方式。未來,用戶可以在此基礎上進行私有模型的微調(diào)部署,支持更多應用的開發(fā)與擴展。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏▲澎峰科技創(chuàng)始人&CEO張先軼

五、圓桌討論:DeepSeek給AI Infra帶來新機會,國產(chǎn)軟硬件發(fā)展正當時

圓桌討論環(huán)節(jié)以《DeepSeek給AI Infra帶來的啟示與機會》 為主題,由騰訊云專有云及智算首席架構(gòu)師方天戟主持,回顧了過去兩個月AI從業(yè)者們圍繞DeepSeek、具身智能等展開的一系列技術攻關,北京智源人工智能研究院AI框架研究負責人敖玉龍、澎峰科技創(chuàng)始人兼CEO張先軼、沐冰數(shù)據(jù)CTO邸澤民、云軸科技CTO王為分享了對最新產(chǎn)業(yè)趨勢的觀察與思考。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

1、DeepSeek開源帶來震撼,一體機可滿足基礎需求

騰訊云專有云及智算首席架構(gòu)師方天戟強調(diào)DeepSeek具有技術創(chuàng)新性,基于H800在卡間通信受限的情況下,大幅壓縮了大模型成本,使模型本地部署成為現(xiàn)實。

沐冰數(shù)據(jù)CTO邸澤民認為DeepSeek在開源周中一系列開源工作的最大的震撼在于展現(xiàn)了如何在資源受限的約束下,實現(xiàn)最優(yōu)解的工程能力,充分挖掘了現(xiàn)有算力的潛力。DeepSeek團隊不僅想到了精妙的優(yōu)化技巧與方案,還完成了代碼與工程實現(xiàn),并將其完全開源,十分令人尊敬。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲騰訊云專有云及智算首席架構(gòu)師方天戟

談及近期銷售火爆的DeepSeek一體機,方天戟認為這有助于企業(yè)在保護數(shù)據(jù)安全的情況下快速用上DeepSeek,北京智源人工智能研究院AI框架研究負責人敖玉龍指出用戶需要關注DeepSeek一體機部署后的軟硬件更新問題。

云軸科技CTO王為提到DeepSeek一體機為客戶提供了入門的解決方案,通過預裝模型和應用降低了部署門檻,能夠快速滿足基礎需求。但隨著需求增長,客戶可能需要更復雜的算力調(diào)度和混合部署方案。

2、國產(chǎn)芯片軟硬件可用性提升,如何繞開CUDA護城河?

敖玉龍記得在2017年-2018年,他嘗試將大規(guī)模并行技術運用到AI計算中,但當時相關技術尚未完善。過去幾年AI Infra快速發(fā)展,有力地支持了大模型的技術進步。

在智源研究院的工作過程中,他接觸到了端側(cè)與服務器側(cè)的大量國產(chǎn)芯片。目前,國產(chǎn)芯片的硬件、軟件都已具備一定可用性,主要挑戰(zhàn)在于生態(tài)還相對落后,為此智源打造了開源開放統(tǒng)一軟件生態(tài)FlagOS來推動國產(chǎn)芯片生態(tài)發(fā)展。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏▲北京智源人工智能研究院AI框架研究負責人敖玉龍

在ChatGPT爆火之后,關于DSA特定領域芯片或ASIC專用芯片是否會消亡的討論不絕于耳。

邸澤民認為,對于特定領域的計算負載而言,與GPGPU相比,DSA具有性能,成本與能效優(yōu)勢。從目前趨勢來看,Transformer這個模型架構(gòu)的有效性經(jīng)過了驗證,短期內(nèi)出現(xiàn)顛覆性變化的概率不高,那么一定會有對Transformer架構(gòu)計算特點更有針對性設計的專用芯片出現(xiàn),不論是采用TPU的脈動陣列、存算一體或者別的什么技術路線,ASIC夠有效降低推理計算成本,只有不斷降低推理成本,才更能讓大模型的應用實現(xiàn)普惠。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲沐冰數(shù)據(jù)CTO邸澤民

王為也提到一些優(yōu)化技術在GPGPU上效率不是特別高,所以AI推理往ASIC上發(fā)展的可能性非常大。國產(chǎn)算力在推理上替代能力很強,在訓練上還需要一定時間追趕,但應該不會太久。

王為認為,在AI訓練方面,英偉達目前優(yōu)勢比較突出,因為通信性能、通信庫等技術壁壘很高,但現(xiàn)在也有國產(chǎn)卡訓練較大大參數(shù)模型的案例,因此假以時日還是可以趕上的。英偉達如今在數(shù)據(jù)發(fā)布上選擇性披露,著重在低精度上、稀疏算力上等,近年披露的數(shù)據(jù)逐漸偏向商業(yè)宣傳性質(zhì),詳細的技術披露較少,這使得評估其真實性能需要更多測試。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲云軸科技CTO王為

邸澤民預測在AI訓練場景,GPGPU依舊將會繼續(xù)占據(jù)主導地位。在他看來,國產(chǎn)算力如果要通過對PyTorch、TensorFlow等框架兼容,并覆蓋數(shù)千個長尾算子,以實現(xiàn)與英偉達的CUDA護城河的競爭甚至替換,在短期內(nèi)是不現(xiàn)實的。但如果將這種兼容與替換目標進一步收斂、聚焦到特定的模型或者特定領域的模型訓練,比如DeepSeek這樣的語言模型,國產(chǎn)廠商是有適配能力與突破空間的。除了框架與算子適配外,另一個難點在于進一步提升通信庫的效率。

3、混合推理系統(tǒng)是必然趨勢,具身智能將催化AI Infra演進

澎峰科技創(chuàng)始人兼CEO張先軼談道,英偉達在硬件創(chuàng)新上的持續(xù)投入,使其在AI領域保持領先;英偉達在精度上的創(chuàng)新不斷提升了性能峰值,也為其他芯片公司設立了競爭壁壘。

他判斷未來在大規(guī)模部署的情況下,混合推理系統(tǒng)是必然的,能結(jié)合不同硬件的優(yōu)勢以實現(xiàn)更高的性價比和性能。

萬字回顧中國生成式AI大會!50+大咖演講精華干貨爆棚,來沒來都值得收藏

▲澎峰科技創(chuàng)始人兼CEO張先軼

在混合云部署的實踐方面,張先軼認為當前對數(shù)字隱私要求不是特別高的客戶比較容易接受,可以利用智算中心的算力進行補充,比如一些學?;蛑行端。大B端通常對私有化要求會更高。當前做AI機器人的企業(yè),基本采用的是邊緣與云端結(jié)合的方式。

方天戟預測,從長遠來看,相比大語言模型,具身智能可能會成為進一步促進未來AI Infra演進的新應用領域。

敖玉龍?zhí)岬骄呱碇悄軝C器人對端云協(xié)同、通信等方面提出了新要求,目前機器人的大腦模型往往部署在云端,控制運動的小腦模型部署在機器人本體,如何實現(xiàn)低延遲的協(xié)同需要進一步探索。

結(jié)語:中國生成式AI浪潮波濤洶涌

中國生成式AI的每一次突破,從來不是某家企業(yè)的獨角戲,而是產(chǎn)學研用協(xié)同攻堅的交響曲。

開年DeepSeek的爆火,成為中國乃至世界生成式AI產(chǎn)業(yè)的關鍵拐點。它顛覆了“堆砌算力”的固有路徑,開辟出一條“效率優(yōu)先”的創(chuàng)新路徑,催化開源、推理模型與AI Infra研發(fā)熱潮,更為端側(cè)AI與國產(chǎn)AI算力基礎設施的落地應用注入了新動能。

站在技術與產(chǎn)業(yè)共振的歷史節(jié)點,我們每一個人,都正在見證和參與一場激動人心的技術躍遷。

春天來了,生成式AI的浪潮更加波濤洶涌,未來正呼嘯而至。

下一站,也許是基礎模型的飛躍式進化,也許是AI超級應用橫空出世,也許是人形機器人的覺醒,也許是商業(yè)價值的裂變,也許是AGI新路徑的曙光。

生成式AI正以摧枯拉朽之勢重塑傳統(tǒng)產(chǎn)業(yè),創(chuàng)新火種從未如此燎原,我們無比期待看到,中國科技企業(yè)在時代的浪尖揚帆起航。

消息來源:智東西