NVIDIA 通过企业级生成式 AI 微服务为聊天机器人、AI 助手和摘要工具带来商业智能

huqihua 4个月前 (12-05)

Cadence、Dropbox、SAP、ServiceNow 率先使用 NVIDIA NeMo Retriever 优化语义检索,实现准确的 AI 推理

亚马逊云科技re:Invent — 太平洋时间 2023 年 11 月 28 日 —NVIDIA 今日宣布推出一项生成式 AI 微服务,支持企业将自定义大语言模型与企业数据相连接,使其 AI 应用能够提供高度准确的响应。

NVIDIA NeMo™ RetrieverNVIDIA NeMo(一个用于构建、自定义和部署生成式 AI 模型的框架和工具系列)的一项全新服务,通过企业级检索增强生成(RAG)功能,帮助组织加强其生成式 AI 应用。

作为一项语义检索微服务,NeMo Retriever 借助经 NVIDIA 优化的算法,帮助生成式 AI 应用作出更加准确的回答。使用该微服务的开发者,可以将其 AI 应用与位于各个云和数据中心的业务数据相连通。该服务为AI 代工添加了 NVIDIA 优化的 RAG 功能,并被整合到亚马逊云科技Marketplace上的NVIDIA AI Enterprise软件平台中。

Cadence、Dropbox、SAP 和 ServiceNow 等公司已率先与 NVIDIA 合作,将生产就绪型 RAG 功能整合至其自定义生成式 AI 应用和服务中。

NVIDIA 创始人兼首席执行官黄仁勋表示:“具有 RAG 功能的生成式 AI 应用是企业的下一个杀手级应用。借助 NVIDIA NeMo Retriever,开发者可以创建自定义生成式 AI聊天机器人、AI 助手和摘要工具。它们能够访问企业的业务数据,通过准确且有价值的生成式 AI 智能来提高生产力。”

全球头部企业借助NeMo Retriever 提高大语言模型(LLM)准确性

电子系统设计领导厂商 Cadence 为超大规模计算、5G 通信、汽车、移动、航空航天、消费和医疗市场的企业提供服务。该公司正与 NVIDIA 合作,为工业电子设计领域的生成式 AI 应用开发 RAG 功能。

Cadence 总裁兼首席执行官 Anirudh Devgan 表示:“生成式 AI 引入了创新方法来满足客户需求,比如能在设计流程早期发现潜在缺陷的工具等。我们的研究人员正在与 NVIDIA 合作,使用 NeMo Retriever 进一步提高生成式 AI 应用的准确性和相关性,以便发现问题,并帮助客户更快地将优质产品推向市场。”

破解精确的生成式 AI 应用的“密码”

与开源 RAG 工具套件不同,NeMo Retriever 是通过具有商业可行性的模型、API 稳定性、安全补丁和企业级支持,来为生产就绪型生成式 AI 赋能。

经 NVIDIA 优化的算法使 Retriever 的嵌入模型能够产出准确性最高的结果。经过优化的嵌入模型能够捕捉单词之间的关系,使 LLM 能够处理和分析文本数据。

企业可以使用 NeMo Retriever 将 LLM 连接到多个数据源和知识库,这样用户就可以轻松地与数据交互,并通过简单的对话指令获得准确且最新的答案。通过使用由 Retriever 驱动的应用,企业可以使用户安全地访问多种数据格式的信息,如文本、PDF、图像和视频等。

借助 NeMo Retriever,企业能够以更少的训练获得更准确的结果,加快产品上市时间,并减少生成式 AI 应用开发产生的能耗。

通过 NVIDIA AI Enterprise 实现可靠、简单且安全的部署

企业可以在几乎任何数据中心或云端的 NVIDIA 加速计算上部署由 NeMo Retriever 驱动的应用,以便在推理过程中运行。NVIDIA AI Enterprise 可支持通过NVIDIA Triton推理服务器™、NVIDIA TensorRT™、NVIDIA TensorRT-LLM及其他NVIDIA AI软件进行加速的高性能推理。

供应情况

开发者可以注册并抢先体验NVIDIA NeMo Retriever

关于 NVIDIA

自 1993 年成立以来,NVIDIA(NASDAQ: NVDA)一直是加速计算领域的先驱。NVIDIA 1999 年发明的 GPU 驱动了 PC 游戏市场的增长,并重新定义了现代计算机图形,开启了现代 AI 时代,正在推动跨市场的工业数字化。NVIDIA 现在是一家全栈计算公司,其数据中心规模的解决方案正在重塑整个行业。

本新闻稿中的部分声明包括但不限于有关以下内容的声明:我们的产品、服务和技术,包括 NVIDIA NeMo Retriever、NVIDIA NeMo、NVIDIA AI Enterprise 的优势、影响、性能和供货情况;部分企业率先与 NVIDIA 一起将生产就绪型 RAG 功能整合到其自定义生成式 AI 应用和服务;具有 RAG 功能的生成式 AI 应用成为企业的下一个杀手级应用;企业拥有数百个自定义生成式 AI 聊天机器人、AI 助手和摘要工具,它们能够通过访问企业的数据,提供准确和有价值的智能;全球头部企业借助 NeMo Retriever 提高 LLM 的准确性,包括其带来的好处和影响等均为前瞻性声明,存在风险与不确定性,且最终结果可能与预期存在极大差异。可能导致实际结果出现极大差异的重要因素包括:全球经济状况;我们在制造、组装、包装和测试产品方面对第三方的依赖性;技术发展和竞争的影响;新产品和技术的发展或对我们现有产品和技术的改良;市场对我们的产品或合作伙伴产品的接受情况;设计、制造或软件缺陷;消费者偏好或需求的变化;行业标准和界面的变化;将我们的产品或技术集成到系统中时意外损耗的性能;以及 NVIDIA 近期提交给美国证券交易委员会 (SEC) 的报告(包括但不限于 Form 10-K 年报及 Form 10-Q 季报)中屡次具体说明的其他因素。提交给 SEC 的报告副本发布在公司网站上,且可免费从 NVIDIA 获得。这些前瞻性声明不能保证未来的表现,仅在规定日期有效。除非法律另有要求,否则 NVIDIA 对更新这些前瞻性声明以反映未来事件或环境不承担任何责任。

©2023 NVIDIA Corporation。版权所有。NVIDIA、NVIDIA 徽标、NVIDIA NeMo、NVIDIA Triton 推理服务器、NVIDIA TensorRT 是 NVIDIA Corporation 在美国和其他国家的商标和/或注册商标。其他公司和产品名称可能为与之相关的各自公司的商标。功能、价格、供货情况和规格如有变更,恕不另行通知。

最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!

镁客网


科技 | 人文 | 行业

微信ID:im2maker
长按识别二维码关注

硬科技产业媒体

关注技术驱动创新

分享到