記者林茂仁/即時報導 2025-06-30 11:11 ET

華為30日宣布開源盤古70億參數的稠密模型。圖為華為「盤古大模型3.0」。(取自中國網)
2025上半年的最後一天,
華為想「開」了!華為30日宣布開源(開放原始碼)盤古70億參數的稠密模型、盤古Pro MoE 720億參數的混合專家模型和基於昇騰的模型推理技術。這是華為的
AI大模型首度開源。
一財網報導,在華為之前,阿里巴巴、騰訊及
百度都陸續將大模型開源,集體開源行動背後,既是對AI進入應用為王時代的回應,也有各家加速搶佔市場高地、應對國際競爭的戰略布局。
一位AI應用從業者分析,去年此時業界討論開源閉源路線之爭時,業界都還在發力底層大模型,究竟哪種模式更好還沒得到真正、充分的驗證。但很快DeepSeek、阿里已經用事實說明了,開源成為推動AI技術進步和產業發展的重要力量。
在華為內部,對於開源也經歷許久的權衡與糾結。例如,從業務層面,基於昇騰下的軍團以及政企業務線板塊的算力買賣或面臨著一定的壓力。但最終,華為站在了開源大軍的隊伍裡。
華為內部的一位技術專家表示,盤古72B是兼顧性能與推理成本的黃金尺寸,最適合行業用戶用AI改造業務,華為以前很少對外發聲,盤古也沒有開源,所以大家對昇騰算力具體的情況不是特別瞭解,對模型的情況也不瞭解,外界就充滿了猜疑,甚至認為昇騰訓練不出來先進的大模型,但實際上目前的昇騰算力已經具備了訓練出世界一流大模型的能力,只有越來越開放,才能讓大模型及應用走出實驗室。
華為此次開源則選擇兩款用量相對較多的模型。其中70億參數的稠密模型部署門檻較低,在智慧客服、知識庫等多種場景中均可應用,而盤古Pro MoE 720億參數的混合專家模型更適合處理相對複雜的任務。
華為此前披露,盤古Pro MoE大模型,在參數量僅為720億,啟動160億參數量的情況下,通過動態啟動專家網路的創新設計可以實現「以小打大」的性能,甚至可以達到千億級模型的性能表現。
而競爭對手的速度並不慢。從2023年至今,阿里通義團隊已開源200多款模型,對開源模型競賽始終保持著高度投入。例如今年春節DeepSeek爆火期間,阿里雲就曾連續三個淩晨開源三款大模型,一位接近阿里雲的人士透露,目前阿里雲的大模型已基本全部開源,所有開源模型均免費使用。
華為30日表示,此舉是華為踐行昇騰生態戰略的又一關鍵舉措,推動大模型技術的研究與創新發展,加速推進人工智慧在千行百業的應用與價值創造。
從成本角度來看,業界推測,百度、華為之所以在此時選擇將相關大模型開源,意味著兩家公司已經將成本降得足夠低。此前百度董事長李彥宏稱大模型推理成本正以每年90%的速度遞減。
開源的最終目標仍然是實現商業價值的轉化。儘管開源了大模型,開發者還可以選擇使用百度、華為智慧雲的算力服務來進行模型訓練、推理和部署。這意味著大模型廠商們仍然可以通過提供高級的企業級解決方案和定製化服務、API介面和雲服務等方式實現商業閉環。
對於開源閉源兩種路線,也有分析人士指出,開閉源並存的路線共同構成人工智慧領域競爭與共生的多元環境,開源趨勢會促進和推動行業在這之上的商業化,快速迭代、快速試錯、共創共擔。但與此同時,業務場景、用戶觸達不能只靠開源。閉源模型核心邏輯在於能夠構成商業閉環,有大量的用戶反饋、在固定的渠道裡形成壁壘,假設最終其能找到真正擊中用戶痛點的地方,且通過用戶的反饋能夠去提升能力,就能占住一個賽道進行商業化變現。
打出開源牌的背後,對華為而言,開源與追趕輝達CUDA生態密不可分。AI新創公司─九章雲極的一名內部人士表示,未來在 AI 算力領域,業界對輝達的依賴或將逐步轉向多元化選擇,這種轉變不僅體現在推理環節的技術替代,更將延伸至訓練場景的全鏈條能力重構。
開源也伴生挑戰。接近華為人士表示,開源雖帶來諸多好處,但也意味著其他企業和開發者可以基於盤古模型進行二次開發,可能會出現一些與華為內部業務競爭的產品或解決方案。這意味著,華為內部業務線需要持續地進行技術優化,從而保持自身的競爭優勢。
華為內部人士認為, To B專案的成敗跟軟體是否開源實質上關聯不大,本質上還是看廠商產品能力、交付能力以及對客戶需求的理解。但無論是誰,都無法忽視開源的力量,而業界圍繞場景落地的較量才剛剛開始 。