8 月 7 日,元象 XVERSE 公司宣布開源其百億參數(shù)的高性能通用大模型 XVERSE-13B,可免費商用。
開源信息:
Hugging Face:https://huggingface.co/xverse/XVERSE-13B
Github:https://github.com/xverse-ai/XVERSE-13B
據(jù)稱,XVERSE-13B 大模型基于標準 Transformer 結(jié)構(gòu),在 1.4 萬億高質(zhì)量、多樣化 tokens 的訓(xùn)練數(shù)據(jù)上,從零訓(xùn)練(train from scatch)了 130 億參數(shù)大模型,支持 40 多種語言,上下文窗口大小為 8192 。元象近期還將發(fā)布大模型 Chat 版,開箱即用,持續(xù)優(yōu)化開發(fā)者體驗。
在多項權(quán)威的標準中文和英文測評中,XVERSE-13B 性能超越了 Llama-2-13B、Baichuan-13B 等國內(nèi)外開源大模型代表。它具備了高性能、全開源、可商用等諸多優(yōu)勢,能大大降低高校和企業(yè)部署使用大模型的成本,不僅實現(xiàn)了國產(chǎn)可替代,也是中文應(yīng)用更好的選擇。
秉持開源精神,XVERSE-13B 代碼采用 Apache-2.0 協(xié)議,向?qū)W術(shù)研究完全開源,企業(yè)只需簡單登記,即可免費商用。
哈爾濱工業(yè)大學(xué)(下稱“哈工大”)作為我國最早從事自然語言處理研究的頂級科研團隊,已經(jīng)率先使用 XVERSE-13B 大模型推進相關(guān)研究工作。哈工大計算機科學(xué)與技術(shù)學(xué)院張偉男教授表示,“開源是互聯(lián)網(wǎng)時代主流模式,不僅能貢獻社區(qū),推動技術(shù)持續(xù)創(chuàng)新,還能利用協(xié)同解決算法透明性、穩(wěn)定性、公眾信任度等共性問題。”
元象 XVERSE 創(chuàng)始人姚星表示:“真實世界的感知智能(3D),與真實世界的認知智能(AI),是探索通用人工智能(AGI)的必由之路,也是元象持續(xù)探索 3D 與 AI 前沿技術(shù)的動力。XVERSE-13B 是我們在國產(chǎn)技術(shù)自立自強上邁出的一小步,而開源開放將激發(fā)大模型生態(tài)活力,讓 AI 的未來發(fā)展邁出一大步,為實體經(jīng)濟、數(shù)字經(jīng)濟的發(fā)展注入強勁動力。我們期待與眾多企業(yè)與開發(fā)者攜手,開創(chuàng)大模型商用新紀元!”
投稿/爆料:tougao@youxituoluo.com
稿件/商務(wù)合作: 六六(微信 13138755620)
加入行業(yè)交流群:六六(微信 13138755620)
版權(quán)申明:本文經(jīng)原作者授權(quán)發(fā)布,不代表VR陀螺立場,如需轉(zhuǎn)載請直接聯(lián)系原作者
元宇宙數(shù)字產(chǎn)業(yè)服務(wù)平臺
下載「陀螺科技」APP,獲取前沿深度元宇宙訊息