在线观看免费成人av_久久久久久久久久久综合_国产精品视频一区二区三区四区五区_另类小说第一页_天天干在线影院_九一免费在线观看_草草久久久无码国产专区_成人短视频在线观看免费_无码熟妇人妻av在线电影_中文字幕第一页亚洲_成人黄色片视频_日韩精品久久一区二区

首頁 > 生活分享 > 免費教學 > 還得是華為!Pangu Ultra MoE架構:不用GPU,你也可以這樣訓練準萬億MoE大模型

還得是華為!Pangu Ultra MoE架構:不用GPU,你也可以這樣訓練準萬億MoE大模型

發布時間:2025-05-30 14:41:39

Pangu Ultra MoE 是一個全流程在昇騰 NPU 上訓練的準萬億 MoE 模型,此前發布了英文技術報告[1]。最近華為盤古團隊發布了 Pangu Ultra MoE 模型架構與訓練方法的中文技術報告,進一步披露了這個模型的細節。

超大規模和極高稀疏性的 MoE 模型極具挑戰,訓練過程中的穩定性往往難以保障。針對這一難題,盤古團隊在模型架構和訓練方法上進行了創新性設計,成功地在昇騰 NPU 上實現了準萬億 MoE 模型的全流程訓練。

盤古團隊提出 Depth-Scaled Sandwich-Norm(DSSN)穩定架構和 TinyInit 小初始化的方法,在昇騰 NPU 上實現了 10+ T tokens 數據的長期穩定訓練。此外,他們還提出了 EP group loss 負載優化方法,這一設計不僅保證了各個專家之間能保持較好的負載均衡,也提升了專家的領域特化能力。同時,Pangu Ultra MoE 使用了業界先進的 MLA 和 MTP 架構,在訓練時使用了 Dropless 訓練策略。

  • 技術報告標題:Pangu Ultra MoE 模型架構與訓練方法

  • 技術報告地址:https://raw.gitcode.com/ascend-tribe/pangu-ultra-moe/raw/main/Pangu_Ultra_MoE_CN_Report.pdf

破解準萬億 MoE 模型性能瓶頸

打造芯片協同的先進架構

近期,盤古團隊在 MoE 模型訓練領域再進一步,重磅推出參數規模高達 718B 的準萬億全新模型 ——Pangu Ultra MoE。該模型旨在實現超大規模 MoE 架構在模型效果與效率之間的最佳平衡。

為了達到這個目標,研究團隊在設計 Pangu Ultra MoE 架構的時候,充分考慮昇騰硬件特性,在昇騰 NPU 平臺上,融合計算、通信和內存等多維度指標,構建了大規模系統模擬器,并系統性地探索約一萬個不同的 MoE 結構組合,最終搜索出一套在訓練與推理吞吐上均達最優的架構方案。

Pangu Ultra MoE 是一個超大規模、高稀疏比的架構,同時也包含 MLA 和 MTP 等先進架構和特有的 DSSN 穩定性架構和 EP group loss 負載優化。下面是 Pangu Ultra MoE 的主要的架構和訓練特性:

  • 超大規模和超高稀疏比:采用 256 個路由專家,每個 token 激活 8 個專家,模型總參數量 718B,激活量 39B。

  • MLA 注意力機制:引入 MLA(Multi-head Latent Attention),有效壓縮 KV Cache 空間,緩解推理階段的內存帶寬瓶頸,優于傳統 GQA 方案。

  • MTP 多頭擴展:采用單頭 MTP 進行訓練,后續復用 MTP 參數擴展至多頭結構,實現多 Token 投機推理,加速整體推理過程。

  • Dropless 訓練:采用 Dropless 訓練可以避免 Drop&Pad 訓推不一致問題,并且提升訓練的數據效率。

  • RL 訓練:采用迭代難例挖掘與多能力項均衡的獎勵函數,并參考 GRPO 算法,提升了模型的訓練效率與最終推理性能。

以下是 Pangu Ultra MoE 昇騰親和設計考慮:

  • 隱藏維度貼合硬件:設置 7680 維隱藏層,精準匹配昇騰芯片的 16×16 MatMul 單元,充分發揮 Cube 核心的計算潛力。

  • 層數親和流水線并行:設置 61 層 Transformer 結構,并預留額外 MTP 層空間,保障計算負載均衡的 PP/VPP 流水線調度,減少 pipeline 氣泡,提升整體并行效率。

  • 專家規模符合冪次規律:路由專家數量設為2?=256,在 TP×EP 并行下提升 All-to-All 通信效率,有效加速分布式訓練。

Pangu Ultra MoE 的預訓練階段在 6k 到 10k 張 NPU 上進行,全流程采用 dropless 訓練模式。預訓練階段進行了長序列擴展,最終模型具備 128k 長序列能力。在后訓練階段,Pangu Ultra MoE 移除了負載均衡輔助損失,保留專家間已有的特化能力,從而進一步提升模型對目標數據的學習效率。如表1所示,最終模型在多個權威開源評測集上展現出一流的效果。

表 1: Pangu Ultra MoE 與目前主流模型效果對比

免費教學更多>>

央視“第一發布”車企首秀 長安馬自達EZ-60獲央視認證 又有兩款行星關節模組成功下線,萬里揚機器人業務再曝進展 因韓美關稅協議陷入停滯,現代汽車集團承壓 速騰聚創單月激光雷達交付量超12萬臺 Grab將向遠程駕駛服務公司Vay投6,000萬美元 實測卓馭10萬元級城市領航輔助:上車端到端2.0模型,復雜路口、人車混行都能應對 硬派越野破局者福特智趣烈馬重慶預售 三季度銷量營收均創新高后,蔚來汽車還是虧損近35億 北京越野BJ40探險家發布,老外觀、新內飾,配分時四驅,兩種動力 福特智趣烈馬正式亮相,全能新能源露營 SUV 滿足日常與戶外需求 嵐圖泰山上市 自成豪華SUV標桿 中國汽車開始書寫豪華車市場新規則 油電同智有高招 一汽奧迪轉型穩中求進 奔馳“小G”諜照曝光,外觀很方正硬朗,背掛小書包,2027年發布 安森美推出一項突破性的功率半導體技術 第十三屆汽車與環境創新論壇 蔚來全新ES8交付破萬 尚元智行獲近億元A輪融資 實力蟬聯汽車新供應鏈百強,移遠智能座艙模組彰顯硬核實力! 東風日產天籟·鴻蒙座艙第四季度上市 三電系統持續升級 技術打磨精細化 浩思動力斬獲“2025蓋世汽車金輯獎中國汽車新供應鏈百強”稱號 日產汽車預警當前財年將虧損18億美元,股價應聲下跌 小馬智行通過港交所聆訊,“全球Robotaxi第一股”回港上市進入倒計時 70萬級超豪華轎車9月銷量榜:尊界S800一騎絕塵,市場格局重塑 連續7個月銷量破萬,微小卡“金九”表現如何?遠程/福田/奇 瑞前三 阿里投融,穹徹智能完成新一輪融資 報廢機動車細則修改破局:82萬噸退役動力電池回收有了新路徑 尹同躍與任正非在深圳華為總部會晤 零跑汽車明年將在歐洲投產B10純電SUV,對標大眾ID.4與斯柯達Elroq 挪威提議擴大電動汽車征稅范圍,特斯拉車型將被納入
在线观看免费成人av_久久久久久久久久久综合_国产精品视频一区二区三区四区五区_另类小说第一页_天天干在线影院_九一免费在线观看_草草久久久无码国产专区_成人短视频在线观看免费_无码熟妇人妻av在线电影_中文字幕第一页亚洲_成人黄色片视频_日韩精品久久一区二区
成年人黄色在线观看| 天堂av在线网站| 欧美 日韩精品| 欧美日韩午夜爽爽| 91小视频在线播放| 色片在线免费观看| 日韩中文字幕组| 日韩中文字幕三区| 欧美男女爱爱视频| 青青在线视频免费观看| 精品国产无码在线| 久久久精品视频国产| 免费一区二区三区在线观看| 熟女人妇 成熟妇女系列视频| 黄色一级视频在线播放| a级黄色片免费| 成人午夜免费在线视频| 视色,视色影院,视色影库,视色网| 午夜一级免费视频| 国产主播自拍av| 亚洲一二三av| 欧美啪啪免费视频| japanese在线播放| 精品91一区二区三区| 91插插插影院| 波多野结衣网页| 婷婷视频在线播放| 成人高清dvd| 成人网站免费观看入口| 国产69精品久久久久久久| 国产日韩av网站| 日韩精品视频久久| 亚洲色图38p| 欧美日韩一区二区三区69堂| 欧美大片久久久| 69精品丰满人妻无码视频a片| 国产a级黄色大片| 无码中文字幕色专区| 999香蕉视频| 国产一区二区在线免费播放| 亚洲国产日韩欧美在线观看| 五月天中文字幕在线| 国产又黄又爽免费视频| 成人免费a级片| 欧美s码亚洲码精品m码| 无需播放器的av| 亚洲精品mv在线观看| 国产 欧美 日韩 一区| 两根大肉大捧一进一出好爽视频| 天天摸天天碰天天添| 日本美女视频一区| 大片在线观看网站免费收看| 一区二区传媒有限公司| xx欧美撒尿嘘撒尿xx| 国产一级片中文字幕| 欧美一区二区激情| 亚洲成人福利在线观看| 公共露出暴露狂另类av| 国产精品va无码一区二区| 亚洲欧洲日本精品| 黄色一级大片免费| 黄色片视频在线免费观看| 久久久久xxxx| 男人的天堂狠狠干| wwwwwxxxx日本| 国产精品一线二线三线| 人人爽人人av| 欧美交换配乱吟粗大25p| 可以免费观看av毛片| 99热这里只有精品7| 久久精品一区二| 91精品国产吴梦梦| 亚洲少妇第一页| 激情成人开心网| 三上悠亚av一区二区三区| 欧美人与动牲交xxxxbbbb| 亚洲天堂av线| 老太脱裤让老头玩ⅹxxxx| 欧美特黄aaa| 国产在线观看福利| 四虎4hu永久免费入口| 国产成人亚洲精品无码h在线| 中文字幕第50页| av免费观看大全| 91精产国品一二三产区别沈先生| 国产精品久久中文字幕| 超碰成人在线免费观看| 国产成人精品无码播放| 妞干网在线播放| 99中文字幕在线| 亚洲精品中文字幕无码蜜桃| 中文精品无码中文字幕无码专区| mm131国产精品| 欧美牲交a欧美牲交| 青青草免费在线视频观看| 精品人妻少妇一区二区| 波多野结衣激情| 免费成年人高清视频| 国产日韩成人内射视频| 成熟丰满熟妇高潮xxxxx视频| 亚洲免费在线播放视频| 超碰av在线免费观看| 你懂的av在线| 精品丰满人妻无套内射| 熟女熟妇伦久久影院毛片一区二区| 成人3d动漫一区二区三区| 久操网在线观看| 国产内射老熟女aaaa| 午夜啪啪免费视频| 天堂视频免费看| 黄色三级视频在线| 久久精品.com| 亚洲熟女乱色一区二区三区| 日本a视频在线观看| www.日本三级| 400部精品国偷自产在线观看| 伊人五月天婷婷| 亚洲免费av一区| 亚洲这里只有精品| 久久婷婷国产91天堂综合精品| 国产肥臀一区二区福利视频| 午夜免费福利小电影| 免费国产黄色网址| 成人午夜精品久久久久久久蜜臀| 国产小视频免费| 大胆欧美熟妇xx| www.亚洲视频.com| 黄色a级片免费看| 成人免费毛片在线观看| av网站大全免费| 97在线国产视频| 免费看国产曰批40分钟| 国产h视频在线播放| 精品国产一二三四区| 国内外成人激情视频| 精品一卡二卡三卡| 国产黄色特级片| 在线免费观看视频黄| 在线看免费毛片| 中文字幕黄色大片| 欧美一区二区三区综合| 日本a级片在线播放| 久久久久久久久久久99| 麻豆av免费在线| 亚洲欧美国产中文| 999热精品视频| 日本aa在线观看| 成年人观看网站| 日日噜噜夜夜狠狠| 天天色天天干天天色| 337p亚洲精品色噜噜狠狠p| 免费av手机在线观看| 欧美精品一区二区三区免费播放| 91人人澡人人爽人人精品| av丝袜天堂网| 手机av在线免费| 蜜臀av性久久久久蜜臀av| 男人的天堂狠狠干| 爆乳熟妇一区二区三区霸乳| www.色欧美| 免费特级黄色片| 能看的毛片网站| 小说区视频区图片区| 老太脱裤让老头玩ⅹxxxx| 日本888xxxx| 97超碰在线视| 国产一区视频免费观看| 欧洲在线免费视频| 亚洲人成无码网站久久99热国产 | www.日本三级| 久草资源站在线观看| 天天综合成人网| xxxx18hd亚洲hd捆绑| 国产视频1区2区3区| 大胆欧美熟妇xx| 超碰在线公开97| 成人短视频在线观看免费| 日韩中文字幕免费在线| 天天操天天干天天玩| 日本成人黄色网| 8x8ⅹ国产精品一区二区二区| 成人在线激情网| 国产免费内射又粗又爽密桃视频| 国产v亚洲v天堂无码久久久| 国产911在线观看| 日韩欧美精品在线观看视频| 男插女免费视频| 午夜dv内射一区二区| 天堂а√在线中文在线| 国产免费又粗又猛又爽| 久久综合久久网| 国产5g成人5g天天爽| 日本一极黄色片| 91九色丨porny丨国产jk| 一本之道在线视频| 亚欧在线免费观看| 成人午夜视频在线观看免费| 午夜精品免费看| 欧美激情精品久久久久久小说| 国产乱子伦精品无码专区|