新加坡國(guó)家人工智能計(jì)劃(AISG)近日完成了一次重要戰(zhàn)略調(diào)整,在東南亞語(yǔ)言大模型開(kāi)發(fā)領(lǐng)域選擇與中國(guó)科技企業(yè)展開(kāi)深度合作。其最新發(fā)布的“Qwen-SEA-LION-v4”模型采用阿里巴巴通義千問(wèn)(Qwen)開(kāi)源架構(gòu),在東南亞語(yǔ)言處理能力評(píng)估中登頂開(kāi)源榜單,標(biāo)志著區(qū)域性AI技術(shù)格局發(fā)生顯著變化。
傳統(tǒng)西方開(kāi)源模型在東南亞市場(chǎng)遭遇適配瓶頸。以meta的Llama系列為代表的模型雖在通用性能上領(lǐng)先,但其英語(yǔ)優(yōu)先的設(shè)計(jì)理念導(dǎo)致處理印尼語(yǔ)、泰語(yǔ)等區(qū)域語(yǔ)言時(shí)效率低下。特別是緬甸語(yǔ)等非拉丁語(yǔ)系文字,因缺乏原生支持,需要額外開(kāi)發(fā)適配層,顯著增加了本地化開(kāi)發(fā)成本。AISG團(tuán)隊(duì)經(jīng)過(guò)技術(shù)評(píng)估發(fā)現(xiàn),依賴硅谷技術(shù)路線難以滿足東南亞多語(yǔ)言環(huán)境的復(fù)雜需求。
阿里巴巴的Qwen3架構(gòu)展現(xiàn)出獨(dú)特優(yōu)勢(shì)。該模型在預(yù)訓(xùn)練階段即融入36萬(wàn)億token的多元數(shù)據(jù),覆蓋119種語(yǔ)言體系,形成原生多語(yǔ)言處理能力。這種設(shè)計(jì)使模型不僅能識(shí)別東南亞文字符號(hào),更能從語(yǔ)法結(jié)構(gòu)層面理解語(yǔ)言邏輯。AISG基于此架構(gòu)開(kāi)發(fā)的Sea-Lion v4特別優(yōu)化了分詞技術(shù),采用字節(jié)對(duì)編碼(BPE)方案精準(zhǔn)切分泰語(yǔ)、緬甸語(yǔ)等無(wú)空格語(yǔ)言,翻譯準(zhǔn)確率較西方模型提升40%,推理速度提高25%。
商業(yè)落地層面的考量成為合作關(guān)鍵推手。東南亞中小企業(yè)占企業(yè)總數(shù)的97%,普遍缺乏高端算力資源。Qwen-Sea-LION-v4通過(guò)模型壓縮技術(shù),可在32GB內(nèi)存的消費(fèi)級(jí)設(shè)備上運(yùn)行,使開(kāi)發(fā)者無(wú)需依賴云端服務(wù)即可本地部署。這種“輕量化部署”特性與區(qū)域市場(chǎng)形成完美契合,相較需要H100集群的西方方案,部署成本降低超過(guò)80%。
技術(shù)合作呈現(xiàn)雙向賦能特征。阿里提供通用推理框架的同時(shí),AISG貢獻(xiàn)了經(jīng)過(guò)嚴(yán)格清洗的1000億東南亞語(yǔ)言token數(shù)據(jù)集。該數(shù)據(jù)集東南亞內(nèi)容占比達(dá)13%,是Llama2數(shù)據(jù)集的26倍,且完全規(guī)避版權(quán)爭(zhēng)議。這種數(shù)據(jù)與技術(shù)的深度融合,使Sea-Lion v4在Sea-Helm評(píng)估中以顯著優(yōu)勢(shì)領(lǐng)跑同量級(jí)開(kāi)源模型,在機(jī)器翻譯、語(yǔ)義理解等核心指標(biāo)上超越西方競(jìng)品。
此次技術(shù)合作引發(fā)行業(yè)連鎖反應(yīng)。馬來(lái)西亞數(shù)字部隨即宣布將基于該模型開(kāi)發(fā)國(guó)家級(jí)政務(wù)AI系統(tǒng),泰國(guó)朱拉隆功大學(xué)已啟動(dòng)醫(yī)療問(wèn)診場(chǎng)景的本地化訓(xùn)練。技術(shù)觀察家指出,這種“東方技術(shù)+區(qū)域數(shù)據(jù)”的合作模式,可能重塑全球AI技術(shù)分布格局,特別是在多語(yǔ)言處理領(lǐng)域形成新的技術(shù)標(biāo)準(zhǔn)。
本文鏈接:http://m.rrqrq.com/showinfo-48-9099-0.html新加坡AI計(jì)劃戰(zhàn)略轉(zhuǎn)向:棄Meta選阿里千問(wèn) 破解東南亞語(yǔ)言適配難題
聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。郵件:2376512515@qq.com
上一篇: 軟銀子公司65億美元完成收購(gòu),Ampere Computing成其全資子公司
下一篇: 谷歌強(qiáng)勢(shì)逆襲:Gemini 3超越ChatGPT,自研芯片挑戰(zhàn)英偉達(dá)地位