亞洲資本網(wǎng) > 創(chuàng)業(yè) > 正文
華為發(fā)布盤古大模型3.0,“沒時(shí)間做詩”
2023-07-08 07:25:13來源: 觀察者網(wǎng)

(編輯/呂棟)

7月7日,第六屆世界人工智能大會(huì)(WAIC)正在上海如火如荼地進(jìn)行,大模型是絕對(duì)的關(guān)鍵詞,而正當(dāng)各大廠商的大模型“爭(zhēng)奇斗艷”時(shí),華為卻推出了一個(gè)“不做詩”的大模型。


(資料圖片)

“盤古大模型不做詩,也沒有時(shí)間做詩,因?yàn)樗钊氲礁餍懈鳂I(yè)中去,讓AI賦予各行各業(yè)價(jià)值?!?月7日下午,在華為開發(fā)者大會(huì)2023(Cloud)上,華為云CEO張平安說道。

張平安在會(huì)上宣布,盤古大模型3.0正式發(fā)布,該模型是一個(gè)完全面向行業(yè)的大模型系列。

華為云CEO張平安

據(jù)他介紹,盤古大模型3.0包括“5+N+X”三層架構(gòu):

L0層包括自然語言、視覺、多模態(tài)、預(yù)測(cè)、科學(xué)計(jì)算五個(gè)基礎(chǔ)大模型,提供滿足行業(yè)場(chǎng)景中的多種技能需求。盤古3.0為客戶提供100億參數(shù)、380億參數(shù)、710參數(shù)和1000億參數(shù)的系列化基礎(chǔ)大模型,匹配客戶不同場(chǎng)景、不同時(shí)延、不同響應(yīng)速度的行業(yè)多樣化需求。同時(shí)提供全新能力集,包括NLP大模型的知識(shí)問答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力,都可以供客戶和伙伴企業(yè)直接調(diào)用。

L1層是N個(gè)行業(yè)大模型,華為云既可以提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù),金融,制造,礦山,氣象等大模型;也可以基于行業(yè)客戶的自有數(shù)據(jù),在盤古大模型的L0和L1層上,為客戶訓(xùn)練自己的專有大模型。L2層為客戶提供了更多細(xì)化場(chǎng)景的模型,更加專注于政務(wù)熱線、網(wǎng)點(diǎn)助手、先導(dǎo)藥物篩選、傳送帶異物檢測(cè)、臺(tái)風(fēng)路徑預(yù)測(cè)等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場(chǎng)景,為客戶提供“開箱即用”的模型服務(wù)。

據(jù)披露,盤古大模型采用完全分層解耦設(shè)計(jì),可以快速適配、快速滿足行業(yè)的多變需求??蛻艏瓤梢詾樽约旱拇竽P图虞d獨(dú)立的數(shù)據(jù)集,也可以單獨(dú)升級(jí)基礎(chǔ)模型,也可以單獨(dú)升級(jí)能力集。在L0和L1大模型的基礎(chǔ)上,華為云還為客戶提供了大模型行業(yè)開發(fā)套件,通過對(duì)客戶自有數(shù)據(jù)的二次訓(xùn)練,客戶就可以擁有自己的專屬行業(yè)大模型。同時(shí),根據(jù)客戶不同的數(shù)據(jù)安全與合規(guī)訴求,盤古大模型還提供了公用云、大模型云專區(qū)、混合云多樣化的部署形態(tài)。

“盤古為行業(yè)而生,就要為行業(yè)著想”,張平安表示 ,如今盤古大模型已在金融、金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路等諸多行業(yè)發(fā)揮著巨大價(jià)值。

“大家知道其他人都可以使用行業(yè)里最成熟的GPU,最成熟的軟件,但是華為不可以,所以華為只能依賴我們自己打造的AI的根技術(shù)?!彼f道。

張平安透露,華為在最底層構(gòu)建了以鯤鵬和昇騰為基礎(chǔ)的AI算力云平臺(tái),以及異構(gòu)計(jì)算架構(gòu)CANN、全場(chǎng)景AI框架昇思MindSpore,AI開發(fā)生產(chǎn)線ModelArts等,為大模型開發(fā)和運(yùn)行提供分布式并行加速,算子和編譯優(yōu)化、集群級(jí)通信優(yōu)化等關(guān)鍵能力。

“基于華為的AI根技術(shù),大模型訓(xùn)練效能可以調(diào)優(yōu)到業(yè)界主流GPU的1.1倍?!彼硎?。

算力是訓(xùn)練大模型的基礎(chǔ)。

在本次大會(huì)上,張平安宣布單集群2000P Flops算力的昇騰AI云服務(wù)在華為云的烏蘭察布和貴安AI算力中心同時(shí)上線。昇騰AI云服務(wù)除了支持華為全場(chǎng)景AI框架昇思MindSpore外,還支持Pytorch、Tensorflow等主流AI框架。同時(shí),這些框架中90%的算子,都可以通過華為端到端的遷移工具平滑遷移到昇騰平臺(tái)。例如,美圖僅用30天就將70個(gè)模型遷移到了昇騰,同時(shí)華為云和美圖團(tuán)隊(duì)一起進(jìn)行了30多個(gè)算子的優(yōu)化以及流程的并行加速,AI性能較原有方案提升了30%。

此外,在大模型訓(xùn)練過程中經(jīng)常會(huì)遇到GPU故障,研發(fā)人員不得不經(jīng)常重啟訓(xùn)練,時(shí)間長,代價(jià)大。昇騰AI云服務(wù)可以提供更長穩(wěn)的AI算力服務(wù),千卡訓(xùn)練30天長穩(wěn)率達(dá)到90%,斷點(diǎn)恢復(fù)時(shí)長不超過10分鐘。

關(guān)鍵詞:

專題新聞
  • 熱點(diǎn)關(guān)注!太原打胎的醫(yī)院哪家比較好?
  • 2023年7月7日雞蛋價(jià)格小幅上漲
  • 西藏最大風(fēng)電項(xiàng)目首臺(tái)風(fēng)機(jī)吊裝完成
  • 經(jīng)濟(jì)日?qǐng)?bào)金觀平:樓市政策應(yīng)強(qiáng)化中長期調(diào)節(jié)
  • 政經(jīng)譚 | 香港金管放寬針對(duì)住宅逆周期措施 九江、清遠(yuǎn)調(diào)控松綁
  • 絲襪英語怎么說(絲襪足腳用英語怎么說)
最近更新

京ICP備2021034106號(hào)-51

Copyright © 2011-2020  亞洲資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com