英伟达预告新版TensorRT-LLM,推理能力飙升 5 倍、支持 Chat API
IT之家
2023-11-16 11:15:17

原标题:英伟达预告新版TensorRT-LLM,推理能力飙升 5 倍、支持 Chat API

IT之家 11 月 16 日消息,微软 Ignite 2023 大会已于今天拉开帷幕,英伟达高管出席本次大会并宣布更新 TensorRT-LLM,添加了对 OpenAI Chat API 的支持

IT之家今年 10 月报道,英伟达面向数据中心和 Windows PC,推出 Tensor RT-LLM 开源库。最大的特点是,如果 Windows PC 配备英伟达 GeForce RTX GPU,TensorRT-LLM 可以让 LLM 在 Windows PC 上的运行速度提高四倍。

英伟达在今天 Ignite 2023 大会上,宣布更新 TensorRT-LLM,添加 OpenAI 的 Chat API 支持,并增强 DirectML 功能,改善 Llama 2 和 Stable Diffusion 等 AI 模型的性能。

TensorRT-LLM 可以通过英伟达的 AI Workbench 在本地完成,开发者可以使用这个统一、易用的工具包,在 PC 或工作站上快速创建、测试和定制预训练的生成式 AI 模型和 LLM。英伟达还为此推出了抢先体验注册页面。

英伟达将于本月晚些时候发布 TensorRT-LLM 0.6.0 版本更新,推理性能提高 5 倍,并支持 Mistral 7B 和 Nemotron-3 8B 等其它主流 LLM。

用户可以在 8GB 显存以上的 GeForce RTX 30 系列和 40 系列 GPU 上运行,一些便携式 Windows 设备也能使用快速、准确的本地 LLM 功能。

相关内容

热门资讯

怪猎物语3发售即翻车?仅48%... 今天咱们来聊一聊卡普空刚出炉的新作《怪物猎人物语3:命运双龙》,相信不少怪猎老粉今天都在蹲着点等解锁...
AI时代学术期刊如何守住“生命... 当人工智能不断深入各行各业,作为知识生产前沿阵地的学术期刊,将如何守住自己的“生命线”?3月13日,...
浪潮通用软件申请应用软件补丁动... 国家知识产权局信息显示,浪潮通用软件有限公司申请一项名为“一种应用软件补丁动态依赖管理方法、系统及计...
EA《战地风云6》将于3月17... IT之家 3 月 15 日消息,EA 宣布旗下《战地风云 6》将于 3 月 17 日至 24 日开启...
浙江培育一流创新生态 本报杭州3月14日讯(记者李景)记者从近期举行的浙江省建设一流创新生态打造最具竞争力营商环境大会上获...