千家信息网

英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍、8GB 以上显卡可本地运行,支持 OpenAI 的 Chat API

发表于:2025-11-18 作者:千家信息网编辑
千家信息网最后更新 2025年11月18日,CTOnews.com 11 月 16 日消息,微软 Ignite 2023 大会已于今天拉开帷幕,英伟达高管出席本次大会并宣布更新 TensorRT-LLM,添加了对 OpenAI Chat API
千家信息网最后更新 2025年11月18日英伟达预告新版 TensorRT-LLM:推理能力飙升 5 倍、8GB 以上显卡可本地运行,支持 OpenAI 的 Chat API

CTOnews.com 11 月 16 日消息,微软 Ignite 2023 大会已于今天拉开帷幕,英伟达高管出席本次大会并宣布更新 TensorRT-LLM,添加了对 OpenAI Chat API 的支持

CTOnews.com今年 10 月报道,英伟达面向数据中心和 Windows PC,推出 Tensor RT-LLM 开源库。最大的特点是,如果 Windows PC 配备英伟达 GeForce RTX GPU,TensorRT-LLM 可以让 LLM 在 Windows PC 上的运行速度提高四倍。

英伟达在今天 Ignite 2023 大会上,宣布更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增强 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。

TensorRT-LLM 可以通过英伟达的 AI Workbench 在本地完成,开发者可以使用这个统一、易用的工具包,在 PC 或工作站上快速创建、测试和定制预训练的生成式 AI 模型和 LLM。英伟达还为此推出了抢先体验注册页面。

英伟达将于本月晚些时候发布 TensorRT-LLM 0.6.0 版本更新,推理性能提高 5 倍,并支持 Mistral 7B 和 Nemotron-3 8B 等其它主流 LLM。

用户可以在 8GB 显存以上的 GeForce RTX 30 系列和 40 系列 GPU 上运行,一些便携式 Windows 设备也能使用快速、准确的本地 LLM 功能。

相关阅读:

《英伟达推出 Tensor RT-LLM,使大语言模型在搭载 RTX 的 PC 平台上运行速度提高 4 倍》

英伟 支持 运行 大会 模型 更新 功能 性能 速度 推理 最大 为此 主流 将于 工具 工具包 帷幕 平台 开发者 数据 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 网络安全服务有什么 零基础软件开发难学吗 细菌蛋白质数据库 在线教育的网络技术发展趋势 网络安全课程专业 国内外数据库技术研究现状 双十一电信网络安全知识问答 进销存软件开发需要多久 江苏东趣网络技术服务 宁波哪里有软件开发公司电话 数据库中如何增加数据库文件 服务器电脑的应用场合 tbc现在哪个服务器人多 学生网络技术服务指导 同一个区的服务器如何赚元宝 博罗中等专业学校计算机网络技术 深信服网络安全号厂家价格 手机我的世界架设服务器 flatfile数据库格式特点 北京创本互动网络技术 黑莓9930网络技术 湖南软件开发品牌大全 数据库中主要的运算符有 特别重大网络安全防护期 网络安全法论对隐私权的保护 广发数据库崩溃 西安软件开发公司前台的图片 如何导出建数据库的sql 软件开发需要的人员组成 服务器u口怎么管理
0