阿里云宣布通义千问 720 亿参数模型开源
CTOnews.com 12 月 1 日消息,阿里云宣布开源通义千问 720 亿参数模型 Qwen-72B、18 亿参数模型 Qwen-1.8B 及音频大模型 Qwen-Audio,目前已上线阿里魔搭社区。
本次开源的模型中除预训练模型外,还同步推出了对应的对话模型,面向 72B、1.8B 对话模型提供了 4bit / 8bit 量化版模型,便于开发者们推理训练。
CTOnews.com注:阿里云此前已经开源了 70 亿参数模型 Qwen-7B 以及 140 亿参数模型 Qwen-14B。
据介绍,Qwen-72B 搭载了强大的系统指令(System Prompt)能力,用户只用一句提示词就可定制自己的 AI 助手,要求大模型扮演某个角色,或者执行特定的回复任务。
官方表示,Qwen-72B 在 10 个权威基准测评创下开源模型最优成绩,成为业界最强开源大模型,性能超越开源标杆 Llama 2-70B 和大部分商用闭源模型。
未来,企业级、科研级的高性能应用,也有了开源大模型这一选项。通义千问还开源了 18 亿参数模型 Qwen-1.8B 和音频大模型 Qwen-Audio。
至此,通义千问共开源 18 亿、70 亿、140 亿、720 亿参数的 4 款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现"全尺寸、全模态"开源。
CTOnews.com附模型链接:
通义千问-72B-预训练:
https://modelscope.cn/models/qwen/Qwen-72B
通义千问-72B-Chat:
https://modelscope.cn/models/qwen/Qwen-72B-Chat
通义千问-72B-Chat-Int8:
https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int8
通义千问-72B-Chat-Int4:
https://www.modelscope.cn/models/qwen/Qwen-72B-Chat-Int4
通义千问-1.8B-预训练:
https://modelscope.cn/models/qwen/Qwen-1_8B
通义千问-1.8B-Chat:
https://modelscope.cn/models/qwen/Qwen-1_8B-Chat
通义千问-1_8B-Chat-Int8:
https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int8
通义千问-1_8B-Chat-Int4:
https://www.modelscope.cn/models/qwen/Qwen-1_8B-Chat-Int4
通义千问-Audio-预训练:
https://modelscope.cn/models/qwen/Qwen-Audio
通义千问-Audio-Chat:
https://modelscope.cn/models/qwen/Qwen-Audio-Chat
模型下载(以通义千问-72B-Chat-Int4 为例):
from modelscope import snapshot_downloadmodel_dir = snapshot_download("qwen/Qwen-72B-Chat-Int4")
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售