新闻中心

【技术专家真人讲解,全程干货!】基于NVAIE的NIM部署和Blueprint实践

NVIDIA 专家面对面技术沙龙 | 丽蟾技术专家演讲内容全总结

在最近的 NVIDIA 专家面对面技术沙龙中,丽蟾科技的技术部专家分享了对 NIM 部署和 Blueprint 实践的深度解析。本次分享的核心内容是如何利用 NIM TOOLs 构建定制化专属 NIM,以增强 RAG 2.0 的 Blueprint 落地。更重要的是,这些能力正在成为企业构建 AI Agent(智能体) 的关键基石。

接下来,一起看看本次讲解的关键技术要点!

什么是 NVIDIA Blueprint?

在 NVIDIA 的体系中,Blueprint(蓝图)用于构建 AI 应用
Blueprint 由若干 NIM(NVIDIA Inference Microservices) 组成,按照特定业务流程进行编排串联,Blueprint 和 Blueprint 之间并不完全独立,小的 Blueprint 也可以成为大的 Blueprint 的一部分。开发者可以基于 NVIDIA 官方 NIM,再结合业务需求组装,形成“自有蓝图”。

这意味着,企业不再需要从零开始,而是像搭积木一样,快速搭建出属于自己的 AI 系统。比如,一个 AI Agent 通常需要具备感知、理解、推理、行动等能力,而使用好 NVIDIA Blueprint ,则可以提高效率,把部分模块标准化、流程化。


本推文发布时已有十余个 NVIDIA Blueprint,仍在持续增加

为什么强调 Blueprint?因为部署便利性!

RAG:提升知识可用性与生成质量

在介绍详细的内容前,先厘清 RAG Fine-tune 两者之间的关系:
RAG(检索增强生成):解决知识可用性问题,用于扩展模型的知识边界,主要为模型补充私域知识,减少幻觉
Fine-tune(微调):用于优化模型的表现行为,包括模型的表达方式,如输出格式、表达立场等,提高模型特定领域的理解能力,如更好的服从复杂的指令
结论:两者并不互斥,可以结合使用 👉 RAG 解决知识不足,微调解决表达问题,其核心目标是优化语言模型的能力

为什么企业需要 RAG?


RAG 能有效解决通用大模型在专业领域的不足,减少所谓的“幻觉”(即模型生成不准确但看似合理的内容)。而通过与私域数据的结合,RAG 提供了回答问题所需的信息,确保了回答的高准确性。

自建 RAG 的挑战

多数团队在实践时会遇到三大难点:
文档解析:真实数据包含 PDF、Office、图片、音视频,开源方案解析不全
检索效果:embedding 模型性能欠佳,召回结果常常不相关
生成质量:语言模型理解能力不足,不能很好的遵循指令
为此,引入了功能丰富的 NVIDIA Blueprint RAG 2.0 / 2.2,以下是其中一部分核心功能:
多模态解析:支持文本、表格、图片、OCR、扫描件
混合搜索:语义相似度 + 关键词
答案自检:模型反思机制


来看看实体案例↓

丽蟾技术团队在两个企业应用的落地场景中发现:


办公协作:eCopilot(WPS 插件)是一款人智能办公助手,支持表格公式生成、文案润色、PPT 辅助等功能;NVIDIA Blueprint RAG 2.2 帮助连入企业知识库,理解企业知识库内容,辅助生成文档内容。

深度研究(商业/学术):可自动找资料、生成大纲并进行反思迭代,直至产出成稿;NVIDIA Blueprint RAG 2.2 助力理解研究课题,生成大纲,并根据大纲自动寻找匹配相关资料,自动总结并编写报告,对报告进行反思修正等。

NVIDIA Blueprint RAG 2.0 的核心优势


一份来自上海禹创数维技术有限公司的测试报告详细分析了 NVIDIA Blueprint RAG 2.0 的核心优势。测试中,企业英文管理文档被导入系统,经过多维度的逐项评估,最终完成了与其他竞品的对比。

本次测试选取了四类竞品进行对比:NVIDIA Blueprint RAG 2.0、国内某在线 RAG、Dify、RAG Flow

结论:
在已测九个主要指标上,NVIDIA Blueprint RAG 2.0 表现最佳
国内在线 RAG 整体也很强,但语义检索的首次反馈和部分图片文字识别上略有不足
剩下两种方案在表格/图文混检场景表现相对不足

关键分水岭:多模态解析能力


多模态解析不仅能解析 PDF,还能对图片、表格、扫描件等多种数据形式进行解析。解析图片时,通过 VLM 模型生成语义描述,作为后续检索的“文字代理”。解析文档时进行版面分析、表格提取、图片解析等,极大提高信息提取的完整性。

同时,演讲还分享了更多的可优化空间:

1. 优化 embedding 模型
引入 Hard Negative 样本
实测带来约 24% 检索效果提升

2. 替换/增强大语言模型
默认 Llama 3.1 可替换为 DeepSeek 等
标准化 API → 上层 Blueprint 无需改动

这些提升将进一步增强企业级 AI 应用的处理能力和生成质量。

NIM 的自制与部署

    NIM 是推理模型的容器化提供标准 API使其能够与 NVIDIA Blueprint 无缝集成。

    演讲中,技术展示了如何自制并优化 NIM 来提升 NVIDIA Blueprint 的效能与 NIM 的创建:
    准备支持包括但不限于多模态的各类社区模型
    打包镜像并进行调试、性能测试和合规检测
    推送至丽蟾 CGC 平台,供 NVIIDA Blueprint 进行拉取与复用

    通过自制 NIM,企业可以定制推理模块,增强 AI 应用的灵活性与效率。

    图片完整演讲与现场演示,请复制链接至浏览器:https://mp.weixin.qq.com/s/-NnEeIwojsAEBWMYqSjiWw

    丽蟾 CGC 平台:AI 部署的加速器

    丽蟾 CGC 平台(China GPU Cloud)作为 NGC 的中国镜像站,不仅持续同步官方内容,并支持第三方/自研 NIM 发布。
    通过 CGC 平台,开发者可以轻松实现以下功能:
    支持第三方/自研 NIM 发布
    本地化部署指令模板,加速 NIM 的部署速度
    本地镜像源支持,避免首次部署时的等待问题


    当前 NGC 已有超百个 NIM,CGC 正在持续同步与扩充。CGC 平台不仅加速 NIM 部署,也让企业更快进入 AI Agent 的构建周期 ——从模型到智能体只需几步,大幅缩短研发和试点落地的时间。

    CGC 网址:https://cgc.chancloud.com/

    NVIDIA Blueprint 的实际应用

    RAG Blueprint 不仅解决了大模型在知识可用性上的天然缺陷,还能在多模态解析、检索准确性、生成质量和合规性上展现出显著优势,适配范围覆盖面极广。

    eCopilot 文档创作:结合 NVIDIA Blueprint RAG 2.2 和 DeepSeek,为企业资料提供精准的自动化写作与引用。
    Infplane Research Agents:使用 NVIDIA Blueprint RAG 2.2 融合在线多元论文数据库与用户自定义的本地知识库,为学术研究提供自动问答与引用回链,提升综述与选题效率。
    谛听智能内容审核:依托 NVIDIA VSS Blueprint,结合生成式 AI、VLM 与 LLM,支持视频摘要、视觉问答等功能,适用于安防、媒体与内容管理。

    通过对等多个实际应用的落地实践可以看到:NVIDIA Blueprint,尤其是 NVIDIA Blueprint RAG 2.0/2.2 已经从技术探索走向企业级应用落地,成为提升生产力和保障合规性的关键工具。随着自研 NIM 与可替换大模型的不断引入,其潜力仍在持续释放

    结论

    NVIDIA Blueprint RAG 2.x 的总体框架中:上层是标准 RAG 流程,中间是解析模块。增强能力包括多模态问答、多用户会话、答案自检(反思)、混合搜索(语义相似度 + 关键词搜索)等。

    其中基础能力需要的模块包含:大语言模型、向量化模型、重排(Rerank)、版面要素识别(页元素、表格、图形)、OCR 等。可选模块如文档内容解析(PASS)、NeMo Guard 等可提升安全性与合规性。

    NVIDIA Blueprint RAG 的多模态解析能力显著提升企业级 RAG 的解析、检索与生成质量;通过自研 embedding 与可替换的大语言模型,还可进一步增强整体效果。

    通过丽蟾技术团队的专业级分享,开发者对 NIM 的部署与优化有了更深入的了解,并能够通过丽蟾 CGC 平台实现更快速、更高效的 AI 应用部署,一起跟上科技时代的脚步,共同探索 AI 带来的无限可能!

    LICHAN CGC

    网址:cgc.chancloud.com

    丽蟾 CGC(China GPU Cloud)是面向中国开发者的一站式 AI 微服务资源平台,也是目前唯一获得 NVIDIA NGC 官网跳转链接的中国平台。目前已经同步上线 80+ 海外热门 NVIDIA NIM。

    上海丽蟾科技,作为 NVIDIA 首批云合作伙伴 NCP(NVIDIA Cloud Partner)和 CND(China NIM Distrubutor)合作伙伴,致力于打造领先的 GPU 架构智能计算解决方案,包括智算云服务和智算中心 AI 基础设施建设及用户赋能。丽蟾云是丽蟾科技在 AI 智算中心领域多年深耕后推出的创新 AI 服务平台。丽蟾云不仅提供了灵活高效的算力资源调度与监控管理工具,还实现了资源管理和训练推理的一体化服务。

    丽蟾云是丽蟾科技在 AI 智算中心领域多年深耕后推出的创新 AI 服务平台。丽蟾云不仅提供了灵活高效的算力资源调度与监控管理工具,还实现了资源管理和训练推理的一体化服务。

    联系客服

     扫描二维码

    获取更多资讯

    滚动至顶部