浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源
发表于:2025-11-16 作者:千家信息网编辑
千家信息网最后更新 2025年11月16日,感谢CTOnews.com网友 航空先生 的线索投递!CTOnews.com 11 月 27 日消息,浪潮信息今日发布了"源 2.0"基础大模型,并宣布全面开源。源 2.0 基础大模型包括 1026
千家信息网最后更新 2025年11月16日浪潮信息发布“源 2.0”基础大模型,千亿参数代码开源
感谢CTOnews.com网友 航空先生 的线索投递!
CTOnews.com 11 月 27 日消息,浪潮信息今日发布了"源 2.0"基础大模型,并宣布全面开源。源 2.0 基础大模型包括 1026 亿、518 亿、21 亿等三种参数规模的模型。
据介绍,源 2.0 通过使用中英文书籍、百科、论文等高质量中英文资料,降低了互联网语料内容占比。为了获取中文数学数据,浪潮信息清洗了从 2018 年至今约 10PB 的互联网数据,但仅获取到了约 10GB 的数学数据。
为了更高效地获得相对匮乏的高质量中文数学及代码数据集,源 2.0 采用了基于大模型的数据生产及过滤方法,在保证数据的多样性的同时也在每一个类别上提升数据质量。
算力方面,源 2.0 采用了非均匀流水并行的方法,综合运用流水线并行 + 优化器参数并行 + 数据并行的策略,让模型在流水并行各阶段的显存占用量分布更均衡,避免出现显存瓶颈导致的训练效率降低的问题。
源 2.0 在评测上进行了代码生成、数学问题求解、事实问答方面的能力测试,测试结果显示,源 2.0 整体表现处于中上水平。
源 2.0 采用全面开源策略,全系列模型参数和代码均可免费下载使用。CTOnews.com附 GitHub 页面和论文链接:
代码开源链接:
https://github.com/IEIT-Yuan/Yuan-2.0
论文链接:
https://github.com/IEIT-Yuan/Yuan-2.0/blob/main/docs/Yuan2.0_paper.pdf
数据
模型
代码
数学
参数
流水
论文
链接
信息
基础
浪潮
浪潮信息
中英
互联网
方法
方面
显存
策略
质量
问题
数据库的安全要保护哪些东西
数据库安全各自的含义是什么
生产安全数据库录入
数据库的安全性及管理
数据库安全策略包含哪些
海淀数据库安全审计系统
建立农村房屋安全信息数据库
易用的数据库客户端支持安全管理
连接数据库失败ssl安全错误
数据库的锁怎样保障安全
计算机网络技术专业考研究生
linux软件开发日志
多线程 数据库查询
浪潮服务器可以无线连接吗
甘肃政法大学网络安全复试题
长沙网络安全大学
怎么把源程序导入数据库
全国网络安全宣传周 官网
数据库表能不能不要主键
有限元软件开发行业
网络安全训练营服务
网络安全著名案例
粤商通服务器
杭州仲艺互联网科技有限公司
原神有多少国家的服务器
人民网络安全平台
马车8服务器维护
春考网络技术和信息技术
虹口区推广网络安全共同合作
中国的4g网络技术
网络安全策划书怎么写范文
sybase数据库日志
鄂州维护网络安全
网络技术发展面临的问题
长岛游戏软件开发公司
常州网络技术咨询价格
服务器管理制度 应急处理
杭州互联网智慧社区软件开发
软件开发工程师证书考什么
中国的4g网络技术
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售