國產中文大語言模型“天河天元”發佈

感謝IT之家網友雨雪載途的線索投遞!

5 月 18 日,2023 第七屆世界智能大會於國家會展中心(天津)正式開始,大會智能科技展期爲期四天。

此次智能科技展統籌規劃了 8 大展館和室外展區,設置了信息技術應用創新、人工智能、5G + 工業互聯網、智能交通、智能製造、智慧生活、數字金融、數字健康、國際與省市等主題展示區,以及智能駕駛、5G 兩大體驗專區。

天河新一代超級計算機是中國新一代百億億次超級計算機,也在此次展會迎來首次亮相。多年來,天河超級計算機從千萬億次到百億億次(IT之家注:新一代超級計算機非天河一號,其系統雙精度浮點峯值計算性能達 200P Flops、數據存儲能力不低於 20PB、峯值功耗不高於 8 兆瓦,比“天河一號”算力提高了 150 倍),不斷挑戰世界算力速度極限,而天津依託天河佔據了全國超過 20% 的超級計算算力資源。

爲充分發揮超算在算力方面的優勢,推動國產異構超級計算機平臺在 AI 應用開發和服務領域中的應用,國家超算天津中心在第七屆世界智能大會期間舉行的世界智能科技創新合作峯會上發佈了“天河 E 級智能計算開放創新平臺”和“天河天元大模型”。

據介紹,中文大語言模型的數據集非常稀缺。國家超算天津中心蒐集整理了網頁數據、各種開源訓練數據、中文小說數據、古文數據、百科數據、新聞數據,以及專業領域的中醫、醫藥、問診、法律等多種數據集,訓練數據集總 token 數達到 350B,最終訓練打造出了自己的中文語言大模型 —— 天河天元大模型。

天河新一代超級計算機實現了從硬件到軟件環境全面自主的信息技術應用創新,官方也在展區展示了天河新一代超級計算機上採用的計算芯片、主板等核心技術。

據悉,“天河 E 級智能計算開放創新平臺”將帶來突破百億億次的跨模態的超級計算算力,支撐傳統的科學工程計算,並服務智能混合計算,打造全方位的算力賦能創新和數字經濟高質量發展載體。

未來,國家超算天津中心還將在“天河天元大模型”的基礎上啓動深度訓練面向醫療、工業、法律等領域的專業模型。未來大模型將在深度學習平臺的支撐下成爲產業智能化基座。

本文來源於:IT之家

點擊此處查看原文>>>

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com