編者按:

深圳的創(chuàng)新密碼,藏在最微觀的科創(chuàng)脈絡之中。從實驗室的技術突破,到產(chǎn)線的規(guī);涞;從政策試點到場景應用——每一次科技躍遷,都在激蕩起產(chǎn)業(yè)的時代浪潮。央廣網(wǎng)深圳頻道特別策劃推出《科創(chuàng)“圳”時代》,通過深度拆解鮮活樣本,解碼“科技+產(chǎn)業(yè)”的深圳路徑,見證深圳科技的每一次“振翅”,感知城市最強勁的創(chuàng)新脈搏。

央廣網(wǎng)深圳5月19日消息(記者 孔明 見習記者 鐘金秀 實習記者 梁秀美)2026全球人工智能終端展暨第七屆深圳國際人工智能展覽會(以下簡稱“人工智能終端展”)在深圳剛剛落下帷幕,喧囂散去,空氣中沉淀下來的,卻是一種前所未有的務實與焦慮。它徹底告別了前兩年“只賺吆喝不賺錢”的技術狂歡,猛然向全行業(yè)推開了一扇“算總賬”的大門。一個殘酷的現(xiàn)實擺在面前:智能體在臺前運行得越是歡暢,幕后Token的消耗量就越是一個令人窒息的天文數(shù)字。

高昂的GPU顯存、被卡脖子的先進晶圓,以及那道難以跨越的“內(nèi)存墻”,宛如三道緊緊扣死的枷鎖,共同構(gòu)成了本屆展會上,全行業(yè)都在負重尋找解法的“高價Token”成本死結(jié)。如何踏平這道高聳的存力高墻,真正讓居高不下的Token成本“退燒”?

面對這個行業(yè)痛點,深圳再次展現(xiàn)出獨特的創(chuàng)新速度與供應鏈韌性。在“人工智能終端展”上,一家來自深圳福田的國家級專精特新“小巨人”企業(yè)——銓興科技,用一種以柔克剛、虛實結(jié)合、借力打力的“深圳式創(chuàng)新”方案,開啟了一場關乎技術平權(quán)與商業(yè)落地的“深南突圍”。

銓興科技的展臺(央廣網(wǎng)發(fā) 主辦方供圖)

拐點已至:高價Token背后的“存儲窒息”

當AI浪潮洶涌而來之際,銓興科技并非赤手空拳,他們手里握著存儲芯片從設計到制造全產(chǎn)業(yè)鏈的“通關密碼”。大模型引爆的算力狂潮,讓無數(shù)資本與企業(yè)如過江之鯽般涌入算力中心。在這場圍獵算力紅利的基建狂潮中,既做內(nèi)存又做閃存的銓興科技,瞬間被推到了風口的最前線:數(shù)據(jù)中心擴容帶來的服務器級內(nèi)存與大容量企業(yè)級SSD需求呈井噴態(tài)勢,直接化作源源不斷的訂單,推著銓興的云端業(yè)務迎來了幾何級數(shù)的狂飆,結(jié)結(jié)實實地啃下了AI時代的第一波紅利。然而,隨著這場軍備競賽走向白熱化,天價的算力賬單很快讓很多企業(yè)感到陣痛,開始高呼吃不消。

“AI絕對是未來的超級風口,而且AI跟存儲天然綁定,接下來的大卡點一定在存儲上!比蜷W存控制芯片巨頭群聯(lián)電子董事長潘建成的這番斷言,讓銓興科技總經(jīng)理郭威成在有些“懵懵懂懂”的狀態(tài)下,一腳跨進了未知的深水區(qū)。

“其實你會發(fā)現(xiàn),大量算力實際上是在浪費的。”因為存儲帶寬和算力架構(gòu)的嚴重失衡,數(shù)據(jù)在計算核心與存儲單元之間的傳輸速度根本跟不上步調(diào),導致芯片空有澎湃的算力,卻因“內(nèi)存墻”的阻隔拿不到數(shù)據(jù),被迫陷入了痛苦的饑餓與空轉(zhuǎn)之中。

既然如此,能不能反向操作?用團隊深耕存儲30年的深厚底蘊,把算力硬生生從云端拉回本地,把高昂的云端Token成本給砸下來?

借力打力:用“日常電力”對沖“Token賬單”

“Token的產(chǎn)出基本上來自云端。但我們發(fā)現(xiàn)并非所有問題都需要云端來解決!痹诟吆啊叭f物皆上云”的時代,人們習慣了哪怕問一個極其簡單的問題,也要動用消耗海量參數(shù)的云端超級大模型,這無疑是“大炮打蚊子”,在白白浪費大量算力資源的同時,也讓企業(yè)支付了高昂的算力成本。

為了打破這個僵局,銓興科技用一套“混合模型協(xié)同”的思路,重塑了產(chǎn)業(yè)的分工邏輯:把簡單的問題留給本地端的小模型來消化,只有遇到復雜問題時再移交給云端。在這個精妙的架構(gòu)里,云端大模型退到幕后,成了一個高階的“導師”,而在前線沖鋒陷陣的則是輕量化的本地小模型,回答不了再逐層往后走。

最讓人松一口氣的是,這個方案完全不需要獨立的GPU顯卡,直接借力英特爾、海光的集成顯卡就能流暢運行,350億參數(shù)的模型已經(jīng)可以直接部署在用戶的本地設備中。這意味著,在不需要額外花錢購買云端Token的情況下,企業(yè)僅憑日常的設備電力,就能實現(xiàn)AI智能體的流暢交互。

用觸手可及的“日常電費”代替高昂的“Token費”,從底層拉起了一道保障企業(yè)數(shù)據(jù)私密性的安全防線,一站式解決了端側(cè)應用場景中最大、最難解決的“最后一公里”痛點。企業(yè)花大價錢租用的算力,也真正用在了刀刃上,實現(xiàn)了算力生態(tài)的“效率減負”。“云邊端協(xié)同,將會降低存儲需求,同時讓Token費用大幅下滑,節(jié)省50%到70%,最終推動AI普惠。”

銓興科技的存儲產(chǎn)品(央廣網(wǎng)發(fā) 主辦方供圖)

以輕克重:把重資產(chǎn)調(diào)成“輕量模式”

在傳統(tǒng)的AI架構(gòu)里,運行大模型像是一場豪賭:企業(yè)動輒采購百萬級的獨立GPU算力設備,以及極為稀缺且價格高昂的高帶寬顯存,沉重的固定資產(chǎn)投入讓無數(shù)嘗試部署企業(yè)級AI的玩家望而卻步。

在本次人工智能終端展上,銓興科技發(fā)布了“新一代AI超顯存融合解決方案”,試圖以顯存擴容技術打破“僵局”。該方案搭載高性能企業(yè)級AISSD,結(jié)合自主研發(fā)的算法平臺與智能體軟件,通過系統(tǒng)級軟硬件協(xié)同設計,硬生生為GPU擴展出了一個高效的外部顯存池。在不依賴昂貴高帶寬顯存的情況下,它用相對廉價的固態(tài)硬盤與傳統(tǒng)內(nèi)存搭建起混合架構(gòu),再用軟硬一體化打通了“任督二脈”:高頻訪問數(shù)據(jù)交由最快速、最高效的通道全力處理;低頻訪問數(shù)據(jù)則分流卸載到存儲體系中,允許其速度稍慢,從而換取了極高的經(jīng)濟性。

這種“軟硬結(jié)合”的精準分流,上演了一場絕妙的降維打擊:直接將AI硬件從“百萬級”的重資產(chǎn),降維成了“小盒子”或普通筆記本就能輕松承載的輕資產(chǎn)。它不需要昂貴的GPU,卻能顯著提升本地大模型推理的吞吐能力,降低單位Token的生成成本,為大規(guī)模AI智能體部署及邊緣側(cè)智能應用開辟出了一條兼顧性能與經(jīng)濟性的硬核技術路徑。

灣區(qū)韌性:AI+的跨界蝶變

放眼大灣區(qū),還有無數(shù)個在“紅!崩锞潘酪簧、歷經(jīng)周期洗禮的企業(yè)。他們深諳從設計到制造的每一個密碼,當AI生產(chǎn)力風暴席卷而來時,這股習慣于在務實中創(chuàng)新的力量,也迎來了屬于自己的高光時刻:他們不信眼花繚亂的概念,只信積淀數(shù)十年的智造底蘊,那是將所有傳統(tǒng)產(chǎn)業(yè)用AI“再做一遍”的絕對底氣。

說到底,AI普惠從來不是一場單純的技術炫技,而是一場關于成本的“極限生存賽”。在這場隱形的較量中,像銓興科技這樣的一批深圳專精特新企業(yè),正像一顆顆破土扎根的鋼釘,死死卡在產(chǎn)業(yè)鏈最吃勁的關隘上。我們有理由相信,當重重關隘被逐一撞破,中國AI產(chǎn)業(yè)將真正飛入千行百業(yè)、飛進千家萬戶。

編輯:郭媛
更多精彩資訊請在應用市場下載“央廣網(wǎng)”客戶端。歡迎提供新聞線索,24小時報料熱線400-800-0088;消費者也可通過央廣網(wǎng)“啄木鳥消費者投訴平臺”線上投訴。版權(quán)聲明:本文章版權(quán)歸屬央廣網(wǎng)所有,未經(jīng)授權(quán)不得轉(zhuǎn)載。轉(zhuǎn)載請聯(lián)系:cnrbanquan@cnr.cn,不尊重原創(chuàng)的行為我們將追究責任。
長按二維碼
關注精彩內(nèi)容