大模型 + 垂直领域应用 度小满开源国内首个千亿级中文金融大模型
如今,大模型技术在领域的应用不断加深,持续助推行业转型升级。度小满多年来持续布局大模型等前沿科技,推动各项技术在领域的应用与推广。近日,度小满正式开源国内首个千亿级中文大模型 -"轩辕",展现了其在大模型技术领域的科技实力。
度小满聚焦大模型技术,轩辕表现超越市场主流开源大模型
据悉,轩辕大模型是在 1760 亿参数的 Bloom 大模型基础上训练而来,在名词理解、市场评论、数据分析和新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的领域优势。
在场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了 150 次回答中 63.33% 的胜率,充分凸显了其在领域的显著优势。在通用能力评测中,轩辕有 10.2% 的任务表现超越 ChatGPT 3.5,61.22% 的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等 13 个主要维度。
为了提升轩辕大模型对领域问题的理解能力,度小满将自身业务中积累的领域的千亿 tokens 的中文预训练数据集用来训练模型。该数据集涵盖了研报、股票、、银行、等各个方向的专业知识。度小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与 ChatGPT 达到持平成为可能,且显著提升了模型在垂直领域的性能。
度小满积极创新,探索大模型在领域的应用
作为 AI 新基建,大模型在及各个行业有着广泛的应用场景。轩辕大模型开源后,对机构有何意义?
许冬亮认为,生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在场景中会有广泛的应用。在前台,生成式大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有 24 小时在线的专业客户经理成为可能。出色的内容生成能力也将引发营销内容生产能力的大幅提升。在中台,生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式,进而大幅提升企业内部办公效率,甚至引发研发测试模式变革,全方位的提升企业内部运营效率。在后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。
度小满依托于百度人工智能技术,已经开展了一系列基于大模型的应用。以风险管理为例,度小满已经将大型语言模型 LLM 应用在互联网文本数据、征信报告的解读上,通过用文本数据构造的预训练模型以及 AI 算法,能够将征信报告解读出 40 万维的风险变量,更好的识别小微企业主的信贷风险。今年 5 月份,这一工程荣获了"吴文俊人工智能科学技术奖"。今年 2 月份,百度基于文心大模型技术推出的生成式对话产品"文心一言"(英文名:ERNIE Bot)开放生态合作,度小满成为首家接入的科技公司。
此次,度小满开源国内首个千亿级中文大模型,展现出了深厚的技术功底。一直以来,度小满就持续在前沿科技领域探索,不断以科技创新破解服务难点、痛点,助力实体经济发展。未来,度小满将继续探索大模型等技术在场景中的运用,为用户带来更优质的服务。
相关文章
- 25 周年纪念作,情怀拉满但诚意欠缺:《勇者斗恶龙 怪物仙境 3》
- 联想拯救者 Y700 2023 平板推送 ZUI 15.0.723 系统灰度测试:新增“USB 网络共享”,优化底部小白条
- Streacom 推出 SG10 高端被动散热机箱:可解热 600W,1300 美元
- 3D 角色扮演策略游戏《少女前线 2:追放》公测开启,安卓、iOS、PC 多端互通
- 新能源车市:价格战开局,价值战结束
- 雪天这样拍,照片更为味道
- Cybertruck:未来物种重新定义汽车
- 2022 年我国未成年网民规模突破 1.93 亿,普及率达 97.2%
- 上映 7 天,《名侦探柯南:黑铁的鱼影》内地票房破亿、豆瓣 6.6 分
- 小岛工作室推出《死亡搁浅》联名手机手柄,预计明年发售