國內人工智能領域兩大領軍企業DeepSeek與寒武紀近日同步推進重要技術進展,引發行業高度關注。9月29日傍晚,DeepSeek通過官方渠道率先發布新一代實驗性模型DeepSeek-V3.2-Exp,該版本在原有V3.1-Terminus架構基礎上引入創新的稀疏注意力機制,重點優化長文本場景下的訓練與推理效率。
據技術團隊介紹,此次升級的DeepSeek Sparse Attention技術通過動態調整計算資源分配,有效降低了長序列處理過程中的算力消耗。為加速生態建設,DeepSeek同步下調API調用價格超50%,并完成官方應用、網頁端及小程序的全平臺更新。開發者現可通過原有接口直接調用新模型,享受更高效的算力支持與更低的開發成本。
緊隨其后,寒武紀于18時11分通過開發者平臺宣布完成技術適配。其自主研發的vLLM-MLU推理引擎源代碼已實現開源,開發者可在寒武紀軟硬件一體化平臺上直接部署DeepSeek-V3.2-Exp模型。技術文檔顯示,此次適配通過Triton算子開發與BangC融合算子技術,使新模型在寒武紀芯片上的計算效率達到行業領先水平。
寒武紀研發團隊透露,針對稀疏注意力機制特性,公司采用計算通信并行策略進行深度優化。這種軟硬件協同創新模式,使得長序列場景下的訓練推理成本顯著降低。此前雙方在DeepSeek系列模型上的合作已驗證了這種技術路徑的可行性,此次實驗性版本的快速適配進一步鞏固了技術優勢。
行業分析師指出,兩家企業從模型發布到生態適配的緊密協作,展現了中國AI產業鏈在關鍵技術環節的協同能力。這種同步推進的技術演進模式,不僅縮短了新技術的產業化周期,更為下游應用提供了更具性價比的解決方案。特別是在需要處理超長文本的金融、法律、科研等領域,相關技術突破將帶來顯著效率提升。
技術文檔顯示,寒武紀此次開源的推理引擎包含完整的模型部署指南與性能測試工具。開發者可通過指定代碼倉庫獲取相關資源,按照文檔指引即可在寒武紀MLU系列芯片上實現模型部署。這種開放的技術生態建設,有望吸引更多開發者參與AI應用創新。
市場觀察人士認為,此次技術聯動標志著中國AI產業從單點突破轉向系統化創新。通過模型架構創新與硬件加速技術的深度融合,國內企業正在構建具有自主知識產權的技術體系。這種發展模式或將改變全球AI技術競爭格局,為產業升級提供新的技術路徑。
更多>同類資訊國際支付巨頭Visa迎新帥:張文翊接棒大中華區總裁,多元履歷賦能支付新未來09-30DeepSeek-V3.2-Exp模型開源發布,華為云MaaS平臺部署采用長序列親和并行策略09-30DeepSeek-V3.2-Exp模型開源發布,華為云適配,官方API價格直降超五成09-30螞蟻百寶箱與友盟攜手,以一站式服務賦能開發者,共赴智能體開發新時代此外,在教育領域,友盟和螞蟻百寶箱共同為國民級家校協同教育工具“班級小管家”注入 AI 動能,基于螞蟻百寶箱智能體平臺能力及友盟平臺數據產品能力,服務了師生、家長在教育各環節家校協同場景,便利學生在課堂練習…09-30嘀嗒出行港股飆升,AI大模型應用拓展至多領域且“天樞系統”上線09-30訊飛潮汐力案例入選!以AI聲紋技術助力浙江制造業智能轉型與發展近日,浙江省經濟和信息化廳正式發布《2025年首批浙江省人工智能賦能制造業典型案例名單》,訊飛潮汐力《應用工業聲紋監測技術推動制造業企業智能生產與制造設備運行維護場景實現遠程聲紋監測及狀態識別》案例成功入選。…09-30螞蟻百寶箱與友盟強強聯合,以一站式Agent服務,為開發者開啟智能體時代新篇09-30產學研多棲AI大牛許主洪或轉戰阿里通義,助力多模態大模型研發新突破09-30?深度求索DeepSeek V3.2基礎版已現身Hugging Face,國慶前或迎正式發布?09-29?DeepSeek-V3.2與智譜GLM-4.6大模型發布在即,科技圈迎新動態?09-29AI賦能教育新突破:從作業批改到個性化輔導,高階AI老師正重塑學習生態09-29DeepSeek-V3.2-Exp模型上線:引入稀疏注意力機制,API調用成本直降超五成09-29南寧“多快好省”發力 搭建中國—東盟AI產業合作新橋梁南寧積極打造可信數據專區,中國—東盟可信數據專區(測試版)已建成,初步形成“境外中心+境內智算中心”雙架構,為東盟國家在人工智能數據、算力和模型領域的合作提供體系化支撐。 南寧致力將南A中心打造成為中國—東盟…09-29“AI引擎+全球航道”雙驅動,阿里專有云擘畫未來十年增長新藍圖據介紹,阿里專有云面向國際市場主要包括三種服務方式:一是主權云,基于專有云構建本地的公共云,比如與當地運營商合作,構建當地的“專有公共云”,像泰國、南非都采用這種方式,在滿足當地合規要求的同時支持客戶本地…09-29許主洪加盟阿里通義:或投身基礎前沿大模型研發,助力多模態創新突破在9月底舉辦的2025云棲大會期間,阿里云智能集團首席技術官、通義實驗室負責人周靖人透露,連續發布數十款模型背后有戰略考量:全球AI模型進展都在加速,整個通義家族一直在跟全球AI領域的領先者進行你追我趕,A…09-29點擊查看更多 +全站最新
?迪拜男子錯過試乘“未來”車:揮金表換蘿卜快跑無人車體驗?
?小米17系列9月25日亮相:跳過16直指17,新機能否改寫高端市場格局??
每天車訊:2025年9月28日現代發布新戰略,特斯拉印度交付,小米SU7 Ultra亮相日本
科大訊飛Air 2掛耳藍牙耳機評測:運動伴侶,高保真音質+超長續航暢享音樂
科大訊飛智能辦公本X3 LAMY聯名款:AI賦能,高效記錄,辦公學習新利器
科大訊飛智能助聽器:助老年人聽清世界,暢享溫馨交流時光熱門內容
第22屆東博會AI元素亮眼:數字智能體引路 機器人炫技展風采
AI云競爭下半場:華為以超節點、企業Agent等破局,誰能領跑產業?
2025網安周:每日互動劉宇談AI時代,知識安全成關鍵,共筑數字新未來
中國大模型DeepSeek首登Nature封面,R1訓練成本僅約208萬引關注
華為全聯接大會2025啟幕,發布全球最強算力超節點與集群
有鹿機器人+連合直租:以智能租賃模式,開啟高端場景清潔新未來
本文鏈接:http://m.rrqrq.com/showinfo-45-28425-0.htmlDeepSeek與寒武紀同步發力:新模型發布與適配優化共啟AI新篇
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com