阿里云發(fā)布通義千問2.5，中文性能全面趕超GPT-4 Turbo，中文能力地表最強(qiáng)

2024-05-09 23:01:15來源：威易網(wǎng)作者：王陽(yáng)

相比此前的通義千問2.1版，通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%，中文能力更是持續(xù)領(lǐng)先業(yè)界。

通義大模型發(fā)布一周年之際，迎來重要的歷史性時(shí)刻。5月9日，阿里云正式發(fā)布通義千問2.5，模型中文性能全面趕超GPT-4 Turbo，成為地表最強(qiáng)中文大模型。同時(shí)，通義千問1100億參數(shù)開源模型在多個(gè)基準(zhǔn)測(cè)評(píng)收獲最佳成績(jī)，超越Llama-3-70B，成為開源領(lǐng)域最強(qiáng)大模型。

歷經(jīng)一年多追趕，國(guó)產(chǎn)大模型終于進(jìn)入核心競(jìng)技場(chǎng)，可與國(guó)外一流大模型一較高下。

奮力追趕一年，成就最強(qiáng)中文大模型

大模型技術(shù)爆發(fā)一年多，行業(yè)競(jìng)爭(zhēng)態(tài)勢(shì)激烈而又多變。通義千問走了一條最“卷”的路，2023年4月問世以來，始終專注于基礎(chǔ)模型的技術(shù)研發(fā)，從初代模型升級(jí)至2.5版本。相比此前的通義千問2.1版，通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%，中文能力更是持續(xù)領(lǐng)先業(yè)界。根據(jù)權(quán)威基準(zhǔn)OpenCompass的測(cè)評(píng)結(jié)果，通義千問2.5得分追平GPT-4 Turbo，是該基準(zhǔn)首次錄得國(guó)產(chǎn)大模型取得如此佳績(jī)。

同時(shí)，通義還發(fā)布了1100億參數(shù)開源模型Qwen1.5-110B，該模型在MMLU、TheoremQA、GPQA等基準(zhǔn)測(cè)評(píng)中超越Meta的Llama-3-70B，在HuggingFace開源大模型排行榜Open LLM Leaderboard上進(jìn)入榜首，再度證明通義開源系列業(yè)界最強(qiáng)的競(jìng)爭(zhēng)力。

通義多模態(tài)模型和專有能力模型也具備業(yè)界頂尖影響力。在多個(gè)多模態(tài)標(biāo)準(zhǔn)測(cè)試中，通義千問視覺理解模型Qwen-VL-Max得分超越Gemini Ultra和GPT-4V，這款模型已在多家企業(yè)落地；代碼大模型CodeQwen1.5-7B則是HuggingFace代碼模型榜單Big Code的榜首模型，也是國(guó)內(nèi)用戶規(guī)模第一的智能編碼助手通義靈碼的底座。

從曾經(jīng)的追趕者到如今的并行者，通義大模型頻頻霸榜，可以說是國(guó)產(chǎn)大模型一年來砥礪前行、奮力追趕的縮影。

一年間，通義還發(fā)展出了業(yè)界領(lǐng)先的文生圖、智能編碼、文檔解析、音視頻理解等能力，企業(yè)客戶和開發(fā)者可以通過API調(diào)用、模型下載等方式接入通義，個(gè)人用戶可從APP、官網(wǎng)和小程序免費(fèi)使用通義。大會(huì)當(dāng)日，原通義千問APP宣布更名為“通義APP”，將通義大模型全套能力集于一身，致力于成為“通情達(dá)義”的全能AI助手。

堅(jiān)定開源路線，成為中國(guó)最強(qiáng)開源大模型

去年8月，通義宣布加入開源行列，隨之啟動(dòng)馬不停蹄的開源狂飆，沿著“全模態(tài)、全尺寸”開源路線陸續(xù)推出十多款模型。目前，通義開源模型下載量已經(jīng)超過700萬。

大模型的訓(xùn)練和迭代成本極高，絕大部分的AI開發(fā)者和中小企業(yè)都無法負(fù)擔(dān)。Meta、阿里云等推動(dòng)的大模型開源風(fēng)潮，讓開發(fā)者不必從頭訓(xùn)練模型，還把模型選型的主動(dòng)權(quán)交給了開發(fā)者，大大加速了大模型的應(yīng)用落地進(jìn)程。

為順應(yīng)不同場(chǎng)景用戶需求，通義推出參數(shù)規(guī)模橫跨5億到1100億的八款大語(yǔ)言模型，小尺寸模型如0.5B、1.8B、4B、7B、14B，可便捷地在手機(jī)、PC等端側(cè)設(shè)備部署；大尺寸模型如72B、110B能支持企業(yè)級(jí)和科研級(jí)的應(yīng)用；中等尺寸如32B試圖在性能、效率和內(nèi)存占用之間找到最具性價(jià)比的平衡點(diǎn)。此外，通義還開源了視覺理解模型Qwen-VL、音頻理解模型Qwen-Audio、代碼模型CodeQwen1.5-7B、混合專家模型Qwen1.5-MoE。

通義72B、110B開源模型都曾登頂Open LLM Leaderboard榜首。在開放研究機(jī)構(gòu)LMSYS Org推出的基準(zhǔn)測(cè)試平臺(tái)Chatbot Arena上，通義72B模型多次進(jìn)入“盲測(cè)”結(jié)果全球Top 10，創(chuàng)造了國(guó)產(chǎn)大模型的先例。

長(zhǎng)期沉淀的良好口碑為通義開源模型贏得一眾鐵粉，每有開源動(dòng)作都會(huì)早早被開發(fā)者“蹲守”，也總能獲得生態(tài)伙伴第一時(shí)間支持。“開發(fā)者的反饋和開源社區(qū)的生態(tài)支持，是通義大模型技術(shù)進(jìn)步的重要助力。”阿里云CTO周靖人透露，未來通義大模型還會(huì)持續(xù)開源。

開源開放，打造最受中國(guó)企業(yè)歡迎的大模型

通義正在成為最受中國(guó)企業(yè)歡迎的大模型。根據(jù)最新數(shù)據(jù)，通義通過阿里云服務(wù)企業(yè)超過9萬、通過釘釘服務(wù)企業(yè)超過220萬，現(xiàn)已落地PC、手機(jī)、汽車、航空、天文、礦業(yè)、教育、醫(yī)療、餐飲、游戲、文旅等領(lǐng)域。

5月9日，小米旗下的人工智能助手“小愛同學(xué)”與阿里云通義大模型達(dá)成合作，強(qiáng)化其在圖片生成、圖片理解等方面的多模態(tài)AI 生成能力，并在小米汽車、手機(jī)等多類設(shè)備落地；微博、眾安保險(xiǎn)、完美世界游戲等企業(yè)也宣布接入通義大模型，將大模型應(yīng)用于社交媒體、保險(xiǎn)、游戲等領(lǐng)域。

此前，通義大模型還曾“上天入地”服務(wù)客戶，中國(guó)科學(xué)院國(guó)家天文臺(tái)人工智能組基于通義千問開發(fā)了新一代天文大模型“星語(yǔ)3.0”，這是大模型首次應(yīng)用于天文觀測(cè)領(lǐng)域；陜煤建新煤礦等十余座礦山推出由通義支持的新型礦山重大風(fēng)險(xiǎn)識(shí)別處置系統(tǒng)，成為大模型在礦山場(chǎng)景的首次規(guī)�；涞亍�

一直以來，阿里云都強(qiáng)調(diào)要成為“AI時(shí)代最開放的云”，通過開放的算力平臺(tái)、開源的自研模型、優(yōu)質(zhì)的模型服務(wù)，幫助客戶抓住大模型時(shí)代的機(jī)遇。如今，開源開放戰(zhàn)略正為阿里云帶來新的商業(yè)增長(zhǎng)。

關(guān)鍵詞：阿里云通義千問 GPT

阿里云發(fā)布通義千問2.5，中文性能全面趕超GPT-4 Turbo，中文能力地表最強(qiáng)

相關(guān)閱讀:

阿里云發(fā)布通義千問2.5，中文性能全面趕超GPT-4 Turbo，中文能力地表最強(qiáng)