国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区

當(dāng)前位置:首頁 > 科技  > 軟件

引領(lǐng)大模型推理效率革命!浪潮存儲領(lǐng)先發(fā)布推理加速存儲 AS3000G7

來源: 責(zé)編: 時間:2025-07-31 09:55:49 119觀看
導(dǎo)讀 2025 年 7 月 25 日,浪潮存儲營銷總監(jiān)張業(yè)興出席中國信息通信研究院主辦的 2025(第二屆)產(chǎn)融合作大會。會上,張業(yè)興發(fā)表題為《融存智用運(yùn)籌新數(shù)據(jù) —— 浪潮存儲金融解決方案和實(shí)踐》的主題演講,并代表浪潮存儲領(lǐng)

2025 年 7 月 25 日,浪潮存儲營銷總監(jiān)張業(yè)興出席中國信息通信研究院主辦的 2025(第二屆)產(chǎn)融合作大會。會上,張業(yè)興發(fā)表題為《融存智用運(yùn)籌新數(shù)據(jù) —— 浪潮存儲金融解決方案和實(shí)踐》的主題演講,并代表浪潮存儲領(lǐng)先發(fā)布推理加速存儲 AS3000G7。該產(chǎn)品憑借“以存代算”的技術(shù)創(chuàng)新,有效破解 KV Cache 重復(fù)計算帶來的算力和時延損耗難題,為大模型推理場景提供突破性解決方案,加速推動大模型在金融、科研等領(lǐng)域的規(guī)模化落地。Iid28資訊網(wǎng)——每日最新資訊28at.com

Iid28資訊網(wǎng)——每日最新資訊28at.com

大模型推理效能瓶頸:吞吐量和時延Iid28資訊網(wǎng)——每日最新資訊28at.com

當(dāng)前人工智能大模型的應(yīng)用已滲透千行百業(yè),既推動著產(chǎn)業(yè)效能的跨越式提升,也深刻重構(gòu)著生產(chǎn)生活的底層邏輯,成為驅(qū)動數(shù)字經(jīng)濟(jì)發(fā)展與社會智能化升級的核心力量。隨著大模型應(yīng)用的普及和相關(guān)技術(shù)的發(fā)展,各行各業(yè)對大模型應(yīng)用的關(guān)注點(diǎn)逐漸從大模型的訓(xùn)練轉(zhuǎn)到大模型的推理。據(jù) IDC 數(shù)據(jù)顯示,智能算力規(guī)模在未來 5 年增長 1.7 倍,用于推理的工作負(fù)載將從 2023 年的 40% 上升到 2027 年的 70% 以上。因此,大模型推理將會成為未來大模型應(yīng)用的焦點(diǎn)。然而,當(dāng)前大模型推理仍然需要借助 GPU 服務(wù)器來實(shí)現(xiàn),而 GPU 服務(wù)器,也是整個大模型落地中最昂貴的投資。因此,充分發(fā)揮 GPU 服務(wù)器的利用率來提升大模型推理效率是大模型的落地關(guān)鍵,推理效率的高低直接決定著大模型從“實(shí)驗室”到“生產(chǎn)線”的落地速度。Iid28資訊網(wǎng)——每日最新資訊28at.com

大模型推理效率面臨兩大核心瓶頸:吞吐量(Tokens / s)和時延。吞吐量是指系統(tǒng)在單位時間內(nèi)能處理的 tokens 的數(shù)量,數(shù)值越高表明 LLM 服務(wù)資源利用率越高、系統(tǒng)成本越低。時延則是用戶接收每個 token 的平均耗時,其中首字時延(TTFT)是長文本對話場景中“實(shí)時交互體驗”的核心指標(biāo),直接影響用戶體驗。Iid28資訊網(wǎng)——每日最新資訊28at.com

大模型的推理包含兩個階段,第一個階段是預(yù)填充 (Prefilling) 階段。Prefilling 階段處理輸入,構(gòu)建初始上下文并緩存成 KV Cache (key-value 鍵值對),緩存在 GPU 的 HBM 顯存里。第二個階段是解碼 (Decode) 階段,解碼階段則利用 Prefilling 階段生成的 KV Cache,迭代地生成輸出 Token,最終給出推理答案。Iid28資訊網(wǎng)——每日最新資訊28at.com

根據(jù)大數(shù)據(jù)統(tǒng)計分析,超過 76% 的對話都是多輪的,多輪對話會產(chǎn)生大量的 KV Cache,上一輪的對話產(chǎn)生的 KV Cache 也會作為下一輪推理的輸入基礎(chǔ),為連續(xù)交互提供上下文支撐。但實(shí)際場景中,GPU HBM 顯存容量存在明顯限制,因此多輪對話中的 KV Cache 會被強(qiáng)制丟棄,在下一輪對話中需要消耗算力來重新計算。以 DeepSeek 70B 模型為例,其每 10 分鐘產(chǎn)生的 KV Cache 高達(dá) 25TB,但每張 GPU HBM 顯存只有幾十 GB,因此,在服務(wù)完一個請求后,需清空顯存以接納新請求,KV Cache 被強(qiáng)制丟棄,在后續(xù)對話中,原本可復(fù)用的 KV Cache 需要重新計算。這種重復(fù)計算直接時延增加(首字響應(yīng)變慢),同時造成 GPU 算力空轉(zhuǎn)(重復(fù)執(zhí)行相同計算),導(dǎo)致吞吐量下降,最終導(dǎo)致資源利用率降低。因此,高效管理 KV Cache 緩存成為提升推理效率的關(guān)鍵。Iid28資訊網(wǎng)——每日最新資訊28at.com

存儲產(chǎn)品托管 KV Cache,實(shí)現(xiàn)“以存代算”Iid28資訊網(wǎng)——每日最新資訊28at.com

浪潮存儲 AS3000G7 作為業(yè)內(nèi)領(lǐng)先推理加速存儲,可存儲所有 KV Cache 及多輪對話結(jié)果。其創(chuàng)新架構(gòu)通過將 KV Cache 從 GPU 寫入本機(jī)內(nèi)存,再經(jīng)高速網(wǎng)絡(luò)緩存至 AS3000G7,下輪對話時按需拉取緩存無需重新計算,徹底實(shí)現(xiàn)“以存代算”,顯著節(jié)省算力消耗并提升資源利用率。Iid28資訊網(wǎng)——每日最新資訊28at.com

Iid28資訊網(wǎng)——每日最新資訊28at.com

作為業(yè)內(nèi)領(lǐng)先推理加速存儲產(chǎn)品,AS3000G7 以四大核心優(yōu)勢重塑推理效率:Iid28資訊網(wǎng)——每日最新資訊28at.com

降低響應(yīng)延遲:將歷史 Token 緩存至 AS3000G7 存儲層,下輪對話從 NVMe SSD 硬盤中拉取歷史 token 的 KV Cache,減少 GPU 重復(fù)計算帶來的資源消耗,TTFT 降低 90%;Iid28資訊網(wǎng)——每日最新資訊28at.com

承載更多并發(fā):TTFT 在 400ms 以內(nèi)的前提下,系統(tǒng)可支持的吞吐量(Token / s)可達(dá)原方案 5 倍,單位 GPU 資源可承載更多推理請求;Iid28資訊網(wǎng)——每日最新資訊28at.com

降低 GPU 功耗:TTFT 的降低與并發(fā)的提升,單 Token 平均功耗下降 60%,在承載同等規(guī)模 token 負(fù)載時,GPU 服務(wù)器整機(jī)功耗降低。Iid28資訊網(wǎng)——每日最新資訊28at.com

生態(tài)兼容適配:廣泛兼容國產(chǎn)與海外芯片的異構(gòu)算力平臺,深度適配 vLLM 框架下的 deepseek 等主流大模型,優(yōu)化推理體驗。Iid28資訊網(wǎng)——每日最新資訊28at.com

在某頭部客戶聯(lián)合測試中,采用 1 臺 GPU 服務(wù)器搭配 1 臺 AS3000G7 推理加速存儲的組合方案實(shí)現(xiàn):Iid28資訊網(wǎng)——每日最新資訊28at.com

穩(wěn)定支撐 500 + 并發(fā)對話,TTFT 降低 90%,響應(yīng)速度大幅提升Iid28資訊網(wǎng)——每日最新資訊28at.com

同硬件配置下吞吐量(Tokens / s)提升 5 倍,在不增加 GPU 資源的情況下,實(shí)現(xiàn)更高并發(fā)的推理請求Iid28資訊網(wǎng)——每日最新資訊28at.com

單 token 功耗降低 70%,單位算力成本降低 60%,推理性價比提升Iid28資訊網(wǎng)——每日最新資訊28at.com

Iid28資訊網(wǎng)——每日最新資訊28at.com

隨著大模型推理需求的持續(xù)攀升,AS3000G7 的推出恰逢其時。其通過“以存代算”的技術(shù)創(chuàng)新突破 KV Cache 重計算瓶頸,為 AI 規(guī)模化應(yīng)用筑牢存儲根基。未來,隨著多模態(tài)與實(shí)時交互場景的普及以及存儲與計算的協(xié)同優(yōu)化,KV Cache“以存代算”將成為降本增效的核心競爭力,為智能時代的推理存儲構(gòu)建新基準(zhǔn)。Iid28資訊網(wǎng)——每日最新資訊28at.com

本文鏈接:http://m.rrqrq.com/showinfo-26-174465-0.html引領(lǐng)大模型推理效率革命!浪潮存儲領(lǐng)先發(fā)布推理加速存儲 AS3000G7

聲明:本網(wǎng)頁內(nèi)容旨在傳播知識,若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 80 億美元,甲骨文創(chuàng)始人埃里森之子收購派拉蒙獲批準(zhǔn)

下一篇: 華為新款鴻蒙旗艦平板電腦正式開售:預(yù)裝 HarmonyOS 5,鴻蒙電腦應(yīng)用登陸平板

標(biāo)簽:
  • 熱門焦點(diǎn)
  • 一加Ace2 Pro真機(jī)揭曉 鈦空灰配色質(zhì)感拉滿

    終于,在經(jīng)過了幾波預(yù)熱之后,一加Ace2 Pro的外觀真機(jī)圖在網(wǎng)上出現(xiàn)了。還是博主數(shù)碼閑聊站曝光的,這次的外觀設(shè)計還是延續(xù)了一加11的方案,只是細(xì)節(jié)上有了調(diào)整,例如新加入了鈦空灰
  • 6月安卓手機(jī)性價比榜:Note 12 Turbo斷層式碾壓

    6月份有一個618,雖然這是京東周年慶的日子,但別的電商也都不約而同的跟進(jìn)了,反正促銷沒壞處,廠商和用戶都能滿意。618期間一些產(chǎn)品也出現(xiàn)了歷史低價,那么各個價位段的產(chǎn)品性價比
  • 6月安卓手機(jī)性能榜:vivo/iQOO霸占旗艦排行榜前三

    2023年上半年已經(jīng)正式過去了,我們也迎來了安兔兔V10版本,在新的驍龍8Gen3和天璣9300發(fā)布之前,性能榜的榜單大體會以驍龍8Gen2和天璣9200+為主,至于那顆3.36GHz的驍龍8Gen2領(lǐng)先
  • 5月iOS設(shè)備好評榜:iPhone 14僅排第43?

    來到新的一月,安兔兔的各個榜單又重新匯總了數(shù)據(jù),像安卓陣營的榜單都有著比較大的變動,不過iOS由于設(shè)備的更新?lián)Q代并沒有那么快,所以相對來說變化并不大,特別是iOS好評榜,老款設(shè)
  • 0糖0卡0脂 旭日森林仙草烏龍茶優(yōu)惠:15瓶到手29元

    旭日森林無糖仙草烏龍茶510ml*15瓶平時要賣為79.9元,今日下單領(lǐng)取50元優(yōu)惠券,到手價為29.9元。產(chǎn)品規(guī)格:0糖0卡0脂,添加草本仙草汁,清涼爽口,富含茶多酚,保留
  • CSS單標(biāo)簽實(shí)現(xiàn)轉(zhuǎn)轉(zhuǎn)logo

    轉(zhuǎn)轉(zhuǎn)品牌升級后更新了全新的Logo,今天我們用純CSS來實(shí)現(xiàn)轉(zhuǎn)轉(zhuǎn)的新Logo,為了有一定的挑戰(zhàn)性,這里我們只使用一個標(biāo)簽實(shí)現(xiàn),將最大化的使用CSS能力完成Logo的繪制與動畫效果。新logo
  • 自律,給不了Keep自由!

    來源 | 互聯(lián)網(wǎng)品牌官作者 | 李大為編排 | 又耳 審核 | 谷曉輝自律能不能給用戶自由暫時不好說,但大概率不能給Keep自由。近日,全球最大的在線健身平臺Keep正式登陸港交所,努力
  • 小米公益基金會捐贈2500萬元馳援北京、河北暴雨救災(zāi)

    8月2日消息,今日小米科技創(chuàng)始人雷軍在其微博上發(fā)布消息稱,小米公益基金會宣布捐贈2500萬元馳援北京、河北暴雨救災(zāi)。攜手抗災(zāi),京冀安康!以下為公告原文
  • 三星獲批量產(chǎn)iPhone 15全系屏幕:蘋果史上最驚艷直屏

    按照慣例,蘋果將繼續(xù)在今年9月舉辦一年一度的秋季新品發(fā)布會,有傳言稱發(fā)布會將于9月12日舉行,屆時全新的iPhone 15系列將正式與大家見面,不出意外的話
Top 国产精品嫩草99av在线_一区在线视频观看_欧美高清一区_欧美 日韩 国产 一区_99精品欧美一区二区三区_久久大香伊蕉在人线观看热2_一色屋精品视频在线观看网站_在线亚洲国产精品网站_亚洲区一区二区三区_你懂的视频一区二区
久久嫩草精品久久久精品一| 一级成人国产| 久久久久综合网| 亚洲成av人综合在线观看| 91精品国产黑色紧身裤美女| 欧美三级特黄| 国产在线不卡一区| 一区二区三区成人| 欧美日本在线播放| 欧美日韩成人一区二区三区| 亚洲国产成人精品视频| 国产欧美日韩视频一区二区 | 色哟哟国产精品| 国产区二精品视| 国产尤物一区二区| 国产精品第五页| 日韩欧美国产系列| 91久久精品网| 亚洲看片一区| 欧美69wwwcom| 99re视频精品| 国产精品一卡二卡在线观看| 亚洲一区免费观看| 国产精品三级电影| 日韩女优毛片在线| 日韩精品一区二区三区三区免费| 免费观看91视频大全| 欧美一级在线免费| 在线精品一区二区| 91蝌蚪porny| 欧美日韩在线一二三| 久久精品一本| 免费成人在线观看| 国产美女一区| 国产99久久久国产精品潘金| 久久综合久久鬼色| 色诱亚洲精品久久久久久| 亚洲国产一区二区三区高清| 《视频一区视频二区| 欧美午夜电影网| 欧美日韩综合| 欧美日本一道本在线视频| 久久亚洲精品欧美| 在线一区二区视频| 欧美日韩国产bt| 欧美一区二区女人| 91精品在线免费观看| 欧美日韩视频在线第一区 | 成人av免费在线观看| 奇米一区二区三区av| 久久精品国产一区二区| 国产一区在线观看麻豆| 久久99精品国产麻豆不卡| 蜜桃91丨九色丨蝌蚪91桃色| 国产一区二区0| 99九九99九九九视频精品| 欧美承认网站| 久久一区中文字幕| 日韩色在线观看| 欧美激情一区二区三区不卡 | 欧美va日韩va| 亚洲欧美日韩电影| 亚洲手机成人高清视频| 亚洲日本免费电影| 亚洲国产精品v| 一区二区国产视频| 成人午夜免费视频| 日韩午夜激情视频| av午夜精品一区二区三区| 精品久久久久久亚洲综合网| 亚洲欧美日韩视频二区| 欧美成人在线免费观看| 粉嫩高潮美女一区二区三区| 午夜国产不卡在线观看视频| 亚洲国产精品激情在线观看| 欧美老女人在线| 国产精品久久久久久久久久直播 | 亚洲在线网站| 合欧美一区二区三区| av一二三不卡影片| 婷婷综合另类小说色区| 国产成人自拍网| 99伊人成综合| 精品国产一区二区三区忘忧草| 亚洲蜜臀av乱码久久精品蜜桃| 丝袜美腿亚洲一区二区图片| 欧美一区二区三区久久精品茉莉花 | 91丨porny丨国产| 亚洲欧美国产不卡| 性欧美大战久久久久久久久| 狠狠色狠狠色合久久伊人| 国产精品久久7| 精品国产一区二区三区久久久蜜月| 亚洲第一av色| 在线综合亚洲| 国产精品久久久久四虎| 成人激情小说网站| 欧美一级在线观看| 激情图区综合网| 久久精品日韩欧美| 午夜不卡av在线| 99亚洲伊人久久精品影院红桃| 精品少妇一区二区三区在线播放 | 国产99精品在线观看| 噜噜噜躁狠狠躁狠狠精品视频| 国产成人免费高清| 亚洲第一福利视频在线| 国产日产精品一区二区三区四区的观看方式| 91看片淫黄大片一级| 欧美chengren| 国产精品多人| 亚洲电影成人| 免费视频一区| 奇米精品一区二区三区四区 | 亚洲欧美怡红院| 综合久久国产九一剧情麻豆| 亚洲人123区| 亚洲精品v日韩精品| 丰满少妇在线播放bd日韩电影| 69av一区二区三区| 波多野结衣在线aⅴ中文字幕不卡| 欧美一级理论性理论a| 粉嫩13p一区二区三区| 久久亚洲精品国产精品紫薇| 欧美一区二区三区在线播放 | 国产精品欧美久久久久一区二区| a美女胸又www黄视频久久| 粉嫩在线一区二区三区视频| 成人精品鲁一区一区二区| 日本一区二区成人| 久久久7777| 粗大黑人巨茎大战欧美成人| 日韩欧美亚洲另类制服综合在线| 99精品视频在线免费观看| 中文字幕av一区二区三区免费看 | 99伊人成综合| 久色婷婷小香蕉久久| 欧美大片拔萝卜| 色av一区二区| 亚洲国产婷婷| 亚洲在线一区二区三区| 欧美日韩另类综合| 丝袜亚洲另类欧美综合| 久久五月婷婷丁香社区| 亚洲欧美精品| 日本高清无吗v一区| 91精品欧美综合在线观看最新| 中文字幕中文字幕一区| 一区二区三区视频在线观看| 久久机这里只有精品| bt7086福利一区国产| 国产日韩一区二区三区在线| 欧美三级韩国三级日本三斤| 久久精品一区二区三区av| 国产日韩欧美三区| 欧美视频官网| 亚洲人快播电影网| 免费观看成人鲁鲁鲁鲁鲁视频| 波多野结衣一区二区三区| 中文字幕欧美三区| 欧美三级中文字| 久久精品二区三区| 亚洲黄色毛片| 合欧美一区二区三区| 成人网页在线观看| 三级在线观看一区二区| 国产欧美精品区一区二区三区| 在线观看免费视频综合| 国产日韩亚洲| 国产精品日韩一区二区三区| 国产精品久久国产愉拍| 亚洲视频综合| 欧美视频亚洲视频| 亚洲午夜精品久久久久久浪潮 | 91麻豆精品国产综合久久久久久| 欧美综合天天夜夜久久| 色播五月激情综合网| 精品毛片乱码1区2区3区| 亚洲午夜久久久久久久久久久| 成人在线综合网| 久久精选视频| 国产精品久线在线观看| 国产高清精品网站| 久久精品成人| 国产精品久久久爽爽爽麻豆色哟哟| 韩国v欧美v日本v亚洲v| 免费中文字幕日韩欧美| 中文字幕第一区综合| 国产精品一区二区在线看| 亚洲欧美精品| 亚洲图片欧美激情| 91亚洲永久精品| 91精品国产综合久久久久久 | 亚洲午夜免费视频| 黄色精品一区| 久久亚洲一区二区三区四区| 国产一区二区伦理片| 久久久噜噜噜久久狠狠50岁| 中文字幕欧美一| 99精品欧美一区二区蜜桃免费|