1. 产品概述1.1 术语表与缩写1.2 相关文档与原型链接2. 背景与机会2.1 业务背景与现状2.2 竞争与替代方案2.3 产品定位与差异化3. 目标与成功指标3.1 年度/阶段目标(OKR)3.1.1 阶段一:高精度数据获取3.1.2 阶段二:数据可视化3.1.3 阶段三:高精度洞察与建议3.2 核心KPI(如回答可用率、检索命中率、P95时延)3.3 非目标与出清4. 用户画像与角色权限4.1 典型画像:企业管理员/数据管理员/主题负责人/员工用户4.2 多租户与角色模型(RBAC/ABAC 概览)4.3 数据访问范围与最小权限原则5. 关键使用场景与用例5.1 数据取数与指标问答5.2 文档知识问答与溯源5.3 多轮追问与可视化洞察5.4 用例清单(Given-When-Then 验收标准)5.4.1 6. 端到端业务流程6.1 数据源接入6.2 知识库构建(清洗-切片-Embedding-索引)6.3 主题初始化流程(包括数据集建立)6.4 对话检索-生成-可视化闭环流程(问—取—析—答—呈现)7. 功能需求总览7.1 模块结构图与数据流7.2 功能优先级与里程碑(MVP/后续增量)7.2.1 功能优先级分层7.2.2 里程碑版本规划表8. 数据管理平台8.1 数据源接入8.1.1 连接类型(关系库/仓库/对象存储/第三方系统)8.1.2 功能描述8.2 知识库管理8.2.1 文档上传/清洗/分块策略与重叠配置(暂定)8.2.2 向量化与索引(混合检索:向量+关键词)8.2.3 片段预览/编辑/删除与重建Embedding8.3 主题(Topic)管理8.3.1 主题数据集知识库绑定8.3.2 主题级语义描述与复用(包括数据集创建)8.3.3 数据集(Dataset)定义与治理(暂定)8.3.4 预置数据看板8.4 账户与范围配置8.4.1 企业/员工账户、项目/主题可见性8.4.2 数据范围授权策略与审计9. 对话平台9.1 会话与上下文管理(历史记忆与话题切换)功能定义业务价值技术要点性能指标 / 安全性注意事项9.2 RAG 检索链路(召回-重排-引用片段展示与出处追溯)功能定义业务价值技术要点性能指标 / 安全性注意事项9.3 Agent 工具编排(取数、计算、图表、复核)功能定义业务价值技术要点性能指标 / 安全性注意事项9.4 结果呈现(自然语言摘要+图表渲染+导出)功能定义(图表部分待定)业务价值技术要点性能指标 / 安全性注意事项UI/UX 要点(摘要)9.5 反馈与学习(用户反馈、偏好与评测闭环)10. 非功能需求10.1 性能与容量(并发、P95/P99、缓存与冷启)10.2 可靠性与SLA(可用性目标、降级与熔断)10.3 兼容性与可移植性(多云/混合部署)10.4 可用性与无障碍(i18n/l10n)10.5 运维与可维护性(配置化、灰度、回滚)11. 架构设计与技术选型11.1 总体架构图与组件说明11.2 检索增强(索引结构、重排策略、引用规范)11.3 Agent 编排(规划器/执行器/工具集成机制)11.4 多租户数据隔离与租户上下文传播11.5 部署拓扑与网络(VPC、出入口、专线/代理)12. 数据与权限治理12.1 数据分类分级与保留策略12.2 租户隔离策略(库/表/行/列级隔离与密钥分域)12.3 访问控制与审计(最小权限、越权防护、溯源日志)12.4 数据新鲜度与同步策略(延迟与一致性)13. 指标体系与可观测性13.1 产品指标:可用率、答案可信度、引用覆盖率、幻觉率13.2 技术指标:检索召回/重排、延迟分布、错误率13.3 日志/指标/追踪三件套与A/B实验13.4 质量面板与告警阈值14. 质量保障与验收标准14.1 测试策略(单元/集成/E2E/对抗与红队)14.2 LLM 评测集与对话回放(离线/在线)14.3 UAT 场景与通过标准14.4 发布准入清单(Go/No-Go)15. 安全与合规15.1 身份与密钥管理(SSO、SCIM、密钥轮换)15.2 传输/存储加密与密钥托管15.3 租户边界测试与数据泄露防护15.4 合规清单(示例:ISO 27001、SOC 2、GDPR/中国本地化要求)16. 商业与计费策略16.1 套餐与限额(席位、调用配额、存储与索引配额)16.2 计费与对账(周期、账单、税务发票)16.3 成本监控(模型/向量/带宽/出口)与优化建议17. 运维与支持17.1 发布管理(版本策略、变更日志、灰度)17.2 备份与灾备(RPO/RTO、跨域/跨云)17.3 支持SLA与问题分级(L1/L2/L3)17.4 客户成功与内嵌帮助(文档、引导与巡检)18. 风险、假设与依赖18.1 技术风险(模型更新不确定性、向量漂移、供应商锁定)18.2 业务风险(接入复杂度、数据不可用、指标口径争议)18.3 关键假设与验证计划18.4 外部依赖与备选方案19. 路线图与里程碑19.1 MVP 范围(首批场景与必要能力)19.2 里程碑与时间线19.3 能力分期与扩展版图(如多Agent协同、自动补数与复核)20. 附录20.1 原型稿与交互动效说明20.2 数据字典与指标口径附表20.3 API/工具清单与示例20.4 参考资料与术语来源
1. 产品概述
本产品是一款面向企业级场景的 SaaS 平台,核心为融合大型语言模型(LLM)与多智能体(multi-agent)架构的智能对话系统,聚焦于“主题 + 数据集 + 知识库”三位一体的语义化配置方式。其技术优势在于:借助 LLM 的深层自然语言理解与推理能力,结合检索增强生成(RAG)和工具调用体系,实现高度上下文感知、可追踪且具自适应能力的智能问答与任务执行链路。相比传统规则引擎或单一 LLM,本系统通过智能体分工与协作,提升任务分解、跨系统交互与持续学习能力,使对话平台不仅是“问答”,更是“问—取—析—答—可视化”的闭环数据分析平台。
我们定位于服务企业内部的业务分析师、数据产品经理、一线运营/销售、客服/人力等角色,帮助他们快速获取组织数据、流程准则与政策答案,显著降低“取数”与“读文档”壁垒。产品通过语义主题将各类数据集与知识文档统一语义映射,确保问答口径高度一致、指标定义统一,支撑一致性决策与洞察复用。同时,多轮追问、自动补数与结果复核机制,让用户在复杂业务场景下也能获得可靠、可审计的回答路径。
期待愿景是成为企业智能协作中枢——通过 RAG、LLM 和多代理协同,实现“自然语言直达指标/结论,自动生成建议与可视化”的高效洞察体验。我们不仅是知识查询助手,更是业务洞察伴侣,替代繁琐的数据检索流程,引领企业从“信息获取”迈向“智能洞察”新时代。
1.1 术语表与缩写
序号 | 术语 | 描述 |
1 | LLM (Large Language Model) | 大规模预训练语言模型,通常基于 Transformer 架构,以高参数规模(数十亿参数)实现深层自然语言理解与生成,用于处理复杂语义与长上下文任务。 |
2 | RAG (Retrieval‑Augmented Generation) | 一种增强 LLM 输出准确性和上下文相关性的生成方式,通过实时检索外部数据源(如文档库、数据库)并将检索结果注入模型提示词,从而减少幻觉问题并提升领域事实可靠性。 |
3 | Agent(智能体) | AI 代理或智能体是一种能感知环境、进行决策并自主执行任务的软件实体,可理解用户输入、规划子任务、调用工具,并在必要时调整行为以实现目标 。 |
4 | Multi-Agent System(多智能体系统,MAS) | 由多个智能体组成的分布式系统,它们能协同感知、决策与行动,以完成单一智能体难以解决的复杂任务;其特征包括自治性、局部视角、分散控制与协作能力 。 |
5 | Embedding(向量) | 指把文本/表格等内容编码为向量以支持语义检索。 |
6 | Chunking | 指切分长文档为片段并设置重叠以保留上下文。 |
1.2 相关文档与原型链接
2. 背景与机会
随着数字化进程加深,企业对决策效率和知识赋能的需求不断升级,尤其在跨系统协同与主动洞察方面。传统 BI 系统虽已部署多年,但其架构多采用批处理、静态仪表盘和人工报表,无法满足实时性与灵活性的双重挑战:通常存在报表时效延迟、对非结构化数据支持不足、洞察与下一步行动脱节等核心短板 。此外,传统 BI 面临高昂维护成本、集成复杂、扩展性差等隐性负担,导致低采用率与决策脱节 。
在此背景下,基于 LLM 与多智能体架构的企业级对话平台成为新机遇。它通过“主题‑数据集‑知识库”一体化语义配置,采用 RAG + 智能体编排,实现自然语言查询、跨系统调用与自洽执行闭环,从“被动展示”走向“主动触发与自动响应”。不同于传统 BI 静态、后置的决策支持,它能够及时理解业务意图,跨系统联动,多维生成答案与自动化执行,显著提升决策速度与业务执行力。
2.1 业务背景与现状
在数字化转型持续加速的当下,企业对实时洞察、业务触发型自动化以及跨系统智能协作的诉求日益迫切。尽管传统 BI 系统已成为基础设施的重要组成,并能提供 KPI 报表及仪表板,但这类系统普遍存在数据静态、依赖批处理、结构化场景适配差、模块脱节等局限——尤其难以应对非结构化知识查询与业务行动闭环的需求。同时,报表更新滞后、缺乏语义认知能力及行动建议能力,导致业务响应效率与决策时效显著下降。本产品通过引入 LLM 驱动的智能体架构,支持自然语言交互、多系统检索与自动化响应,旨在填补传统 BI 中的“洞察—执行”裂缝。
2.2 竞争与替代方案
本产品定义为“企业级智能对话与数据洞察平台”,核心技术基于 RAG(Retrieval‑Augmented Generation)结合基于LLM的MAS,面向关键业务场景提供自问自答和闭环业务执行能力。RAG 架构允许系统实时检索企业知识库与数据源,并结合 LLM 在产生答案时附带来源引用与上下文支持,提高精度与可信度 。而多智能体系统使得平台能够按角色分工(如检索、逻辑推理、结果生成与可视化)协同工作,实现自动化流程编排与目标驱动支持 。
差异化优势包括:
- 语义一致性:通过“主题‑数据集‑知识库”语义配置,确保业务指标与口径一致,消除部门间理解偏差;
- 主动决策与执行能力:智能体不仅洞察,还能在授权范围内主动触发操作或提出建议,实现从被动报表展示向主动运营驱动的转型 ;
- 企业治理与安全合规:内嵌访问权限管控、审计日志、文档溯源,使得整个系统同时具备灵活响应与安全可追溯的能力。
2.3 产品定位与差异化
3. 目标与成功指标
3.1 年度/阶段目标(OKR)
3.1.1 阶段一:高精度数据获取
- 实现 LLM 辅助下 ≥ 90% 回答可用率;
- 5分钟内实现单次响应;
3.1.2 阶段二:数据可视化
- 成功设计数据可视化语言模态规范覆盖全部可视化设计组件;
- 具有初步的可视化看板设计功能;
- 系统可以准确绘制获取的数据;
3.1.3 阶段三:高精度洞察与建议
- 提供准确上下文敏感洞察与建议;
3.2 核心KPI(如回答可用率、检索命中率、P95时延)
3.3 非目标与出清
4. 用户画像与角色权限
4.1 典型画像:企业管理员/数据管理员/主题负责人/员工用户
4.2 多租户与角色模型(RBAC/ABAC 概览)
4.3 数据访问范围与最小权限原则
5. 关键使用场景与用例
5.1 数据取数与指标问答
场景概述
面向一线运营/销售与业务分析师的“自然语言直达指标”能力:用户用中文提问“上周渠道 GMV 与环比如何?按省份分布?”,系统基于“主题(Topic)+ 数据集 + 指标口径/维度定义”的语义层,自动解析意图、生成合规 SQL、执行并返回统一口径的结果与可视化,同时提供可追溯的溯源链路(指标定义、SQL、数据集版本)。语义层可保证跨工具一致的指标口径,避免“同名不同义”。
参与角色
- 员工用户(提问者)
- 项目负责人(定义 Topic、确认指标口径)
- 数据管理员(维护数据源、行列级权限策略)
触发条件与入口
- 员工登录对话平台 → 选择业务 Topic(已绑定数据集与指标定义) → 在输入框提出问题(可从历史收藏/模板问题进入);
- 或在数据管理面板预览数据集时,点击“用对话查询”;
输出结果与价值
- 统一口径指标结果(表格与图表)、自然语言摘要、可复用查询视图;
- 自助分析:非技术用户以自然语言获得洞察,降低 SQL 依赖;
5.2 文档知识问答与溯源
场景概述
面向政策/流程/售后 FAQ 的文档级知识问答:用户询问“VIP 退货政策?是否支持 7 天无理由”,系统通过混合检索(向量 + 关键词)与重排序实现高召回与高相关,LLM 生成答案并附带引用片段与来源(页码/位置/时间戳),实现可验证的“有据可依”的回答。
参与角色
- 员工用户(提问者)
- 知识库管理员(上传、清洗、切片、标注元数据)
- 系统(混合检索器、重排序与生成代理)
触发条件与入口
- 对话平台选择 Topic 后,对话会根据用户意图动态引入知识片段;
- 数据管理平台完成文档入库(切片与向量索引);
- 系统在数据洞察过程也会动态引入需要的知识片段;
输出结果与价值
- 具备来源的答案(含引用与时间),可以预览引用的知识片段;
- 降低幻觉与合规风险,提升问答可验证性与复核效率;
5.3 多轮追问与可视化洞察
场景概述
面向“探索式分析”的多轮对话 + 可视化洞察:用户先问“本月新增用户同比如何”,追问“按渠道拆分”“只看华北”“给我 Top 5 城市柱状图”。系统在维护对话态(时间窗口、筛选条件、群组粒度)的同时,自动推断合适的图形编码并渲染交互式图表(可切换条形/折线/地图),支持继续以自然语言对图表做二次筛选与钻取。可视化采用“图形语法”式声明(如 Vega/Vega-Lite),提高一致性与可复用性。
参与角色
- 员工用户(探索式分析)
- 项目负责人(配置默认图表模板与度量优先级)
- 系统(对话态管理、查询改写、可视化渲染器)
触发条件与入口
- 在对话平台系统返回数据获取的内容,同时系统判定需要可视化后,或用户明确开启数据可视化按键;
- 主题预设可视化看板(如 KPI 卡、趋势、排行),作为系统可直接引入的可视化界面,通过语义自动判别;
输出结果与价值
- 数据可视化+自然语言洞察摘要 (支持发布/下载);
- 分析连续性:多轮改写与上下文保持,使探索路径顺滑连贯;
5.4 用例清单(Given-When-Then 验收标准)
场景:
5.4.1
6. 端到端业务流程
总体目标:将“数据源→元数据→知识片段→向量索引→主题(Topic)→对话问答→可视化输出”贯通为稳定、可追溯的闭环,使业务人员通过自然语言即可“问—取—析—答—呈现”,持续沉淀统一口径与知识资产。
图 6.1 业务流程
6.1 数据源接入
数据源类型
- 结构化:OLTP/OLAP 数据库(如 MySQL、PostgreSQL、Snowflake、BigQuery 等)
- API:SaaS/内部服务接口(REST/GraphQL)
- 文件上传:CSV/Parquet/Excel 等
接入流程(认证 → 配置 → 同步校验)
- 认证:录入连接信息与凭据(密钥/令牌/证书);
- 配置:设置库名称和描述;
- 同步校验:执行连通性与权限校验、字段计数/空值率核验、增量基准位点;支持定时/事件触发的增量元数据抽取;
6.2 知识库构建(清洗-切片-Embedding-索引)
- 内容切片(Chunking):将文档分割为可检索的片段,优先采用语义切片(按句/段相似度聚合)以保持语义完整;格式化文档按照json格式形成片段;
- LLM索引增强:使用大模型多生成不同的语义索引片段,以提高召回率;
- Embedding(向量化):将片段转为向量用于相似度检索;选择在语料域表现稳定的句向量模型,关注维度、吞吐、延迟与成本;
- 索引(Index):在向量数据库中构建近似最近邻(ANN)索引;常用 HNSW(图索引,查询延迟低、召回优)与 IVF-Flat(倒排细分 + 原始向量重查,便于速度/精度权衡);
- 混合检索与Rerank;
图 6.2 RAG知识库
6.3 主题初始化流程(包括数据集建立)
“主题(Topic)”的作用
主题是围绕业务域的语义容器,绑定 数据集 + 知识库 + 背景语义信息 + 权限,为对话提供统一口径、可复用的上下文边界。
创建与绑定步骤
- 创建主题:填写业务域描述、适用场景。
- 绑定数据集:从数据源中中选择表/视图;配置字段语义;设置数据集语义信息(名称与描述)。
- 绑定知识库:设置主题相关知识库。
- 权限配置:按租户/项目进行 RBAC/ABAC 授权(最小权限),限定能访问的数据范围与文档域。
6.4 对话检索-生成-可视化闭环流程(问—取—析—答—呈现)
全链路说明
- 问(用户输入):用户在选定主题下以自然语言提问(可自动补齐意图与参数)。
- 取(检索):基于主题边界执行混合检索(向量 + 关键词);如需结构化指标,生成/校对 目标并取数。
- 析(分析/推理):对取回的数据与片段进行聚合、对比、异常检测、时间序列分析等。
- 答(生成):LLM 使用Prompt 模板进行上下文注入(系统指令 + 查询 + 检索片段/指标摘要),控制语气、格式与“只据所引”;可加入安全与注入防护指引。
- 呈现(可视化/导出):根据语义建议生成图表(条形/折线/面积/散点/地理等),支持页面交互与导出 PNG/SVG/JSON 规格。
图 6.3 EIS 对话系统流程
7. 功能需求总览
本章旨在为研发与测试团队提供 Eyes Intelligent System(EIS)的功能全景图与端到端数据流,明确模块边界、输入输出与依赖关系,并以阶段化里程碑定义上线优先级与验收标准,确保功能交付与质量目标(参见第 3 章 OKR)保持一致。
7.1 模块结构图与数据流
图 7.1 系统架构图
图 7.2 数据流转可视化
7.2 功能优先级与里程碑(MVP/后续增量)
7.2.1 功能优先级分层
P0(MVP,必须上线)
- 租户/认证、基础 RBAC;OIDC 对接(单点登录)。
- 连接器(MySQL/Postgres),连通与健康检查。
- 元数据目录:库/表/字段扫描。
- 知识库:文档上传、切片、Embedding、基本混合检索。
- 主题(Topic):数据集建立/知识库绑定、语义信息定义。
- 对话平台:意图解析 →(检索|取数)→ 基础分析 → 文本回答;引用溯源。
P1(高优先级,可迭代)
- 检索增强:BM25+向量的 Query Routing 与 Rerank 策略中心。
- SQL 生成强化:多表联结与安全模板校对;查询代价守护。
- 分析能力:异常检测、同环比/同比、A/B 汇总。
- 数据可视化:图形语法规范化、可视化编辑器、看板保存与配置。
- 观测/审计:链路追踪(Trace)、问答可用率与召回率面板。
P2(增值特性)
- 模型与检索 A/B 实验;召回-精排策略自动化调参与回归基线。
- 私有向量库热更新/删除治理、索引重建与容量预估。
- 数据血缘可视化与影响分析;离线物化视图与加速层。
- 插件/工具市场与 SDK;多区域高可用与冷备。
建议 KPI(与第 3 章对齐)
- 回答可用率 ≥ 90%(抽样标注);端到端 P95 时延 ≤ 5 分钟(含冷启动/大查询);
- 检索证据命中率(Top-k 中含黄金片段)≥ 85%;
- 可视化渲染成功率 ≥ 99%;审计覆盖率 100%。
7.2.2 里程碑版本规划表
版本阶段 | 时间 | 主要功能列表 | 验收标准 |
MVP | 60days | 认证/租户;
MySQL/Postgres+文件接入;
元数据扫描;
知识库切片+Embedding+LLM增强索引;
混合检索;
Topic 绑定;
对话问答(检索/取数/基础分析);
引用溯源; | 可用率≥90%;
P95≤5min;
|
表 7.1 开发规划表(部分)
8. 数据管理平台
数据管理平台是 Eyes Intelligent System 的“语义与数据底座”。它负责把分散在关系型数据库、数据仓库、对象存储与第三方业务系统中的结构化/半结构化/非结构化数据,统一完成接入、编目、清洗、向量化(Embedding)与索引,并通过“主题(Topic)”形成可复用的语义层与指标口径,向上支撑对话平台稳定、可追溯、可授权的 问—取—析—答—可视化 全链路。其目标用户包括:
- 企业管理员:多租户与安全策略、合规与审计。
- 数据管理员:数据源接入、元数据/知识库构建、主题与数据集配置。
8.1 数据源接入
功能定义:统一管理 关系库/数据仓库/对象存储/第三方系统 API 的连接、认证、元数据同步与可用化;提供稳定的连接池、超时/重试与熔断策略。
业务价值:打通企业数据孤岛,以标准协议接入并沉淀语义;对上提供“主题—数据集”的可复用能力。
技术要点:
- 关系库/仓库通过 JDBC/ODBC 与数据目录 API 完成元数据扫描(表、列、类型、主键/外键、示例),如getTables/getColumns、SQLTables/SQLColumns。
- 对象存储走 S3 兼容 REST API + SigV4 认证;优先 SDK,其次签名直连;支持多端点与虚拟主机/路径式寻址。
- 第三方系统采用 OAuth 2.0 / Bearer Token、API Key 等方式,并处理 429/限流 与 Retry-After。
- 超时/重试建议 指数退避 + 抖动(Jitter),区分交互式与后台任务。
8.1.1 连接类型(关系库/仓库/对象存储/第三方系统)
用途与协议
- 关系型数据库/数据仓库(MySQL、PostgreSQL、SQL Server、Oracle、Snowflake、BigQuery、Databricks 等):JDBC/ODBC 读元数据与执行 SQL;
图 8.1 数据源接入流程
Notice: 如果连接测试不通过,无法接入到系统中
8.1.2 功能描述
- 数据源连接:用户需要填写:数据库类型、连接地址、端口、用户、密码、数据库名称(可选),在验证连接性后,为数据源创建名称和描述信息(可选),便可以创建一个新的数据源连接
- 数据源信息预览:用户可以查看到连接的数据源中的数据库和库中数据表,以及数据(5行),不足以 “-” 呈现
- 用户可以通过名称快速找到目标库或库表
- 用户可以通过名称、描述进行查询筛选,按照不同方式排序或分类显示
8.2 知识库管理
8.2.1 文档上传/清洗/分块策略与重叠配置(暂定)
功能定义:支持 PDF、DOCX、Markdown、HTML、TXT、CSV/TSV、PPTX、日志等格式上传,完成抽取、清洗、切片(Chunking)与元数据标注(来源、时间、标签、访问范围、适用主题)。
业务价值:将非结构化知识资产语义化,支持溯源、片段级编辑与再索引,显著提升问答可用率与可解释性。
技术要点:
- 切片策略:按字符/标点/标题/段落/表格/页面等切分,推荐 固定窗口 + 重叠(如 512–1,000 tokens,重叠 10–20%)以保留上下文;对长表/代码块用结构化切分器。
- 清洗:页眉/脚注/目录/噪声去除,保留表格/列表语义标记与原文定位(页码/段号/URL)。
- 元数据:为每个 Chunk 记录来源/时间戳/作者/版本/访问域,以便授权与审计。
关键注意事项:
- 以“来源—片段—字段级”的可追溯链路支撑引用展示与复核;Chunk 重叠过小会丢上下文,过大影响索引体积与召回精度。
8.2.2 向量化与索引(混合检索:向量+关键词)
功能定义:对清洗后的片段进行向量化(Embedding),构建向量索引(如 HNSW/IVF-Flat/FAISS)与关键词倒排(BM25),并支持多路召回与 RRF 融合、可选重排(Rerank)。
业务价值:相较单一路径,混合检索综合提升召回率与精确率,减少“错过”和“跑偏”。
技术要点:
- Embedding 模型:支持多模型与命名空间(例如通用英文/多语种/代码/法律等),不同模型产生的向量不可直接比较,更换模型需再嵌入。
- 向量索引:HNSW/IVF 等近似最近邻(ANN)结构以平衡速度与精度;FAISS 为主流实现之一。
- 关键词索引:BM25 倒排索引;与向量检索结果通过 RRF 融合并可加 reranker。
关键注意事项:
- Embedding 模型升级或清洗规则改变需评估“再嵌入”成本;
8.2.3 片段预览/编辑/删除与重建Embedding
功能定义:提供片段级预览、定位、批量编辑/合并/拆分、软删除/恢复;支持“原文改动、模型升级、质量抽检失败、字段语义变更”触发的自动/手动 重建 Embedding 与重索引。
业务价值:保证知识新鲜度与一致性,支持 A/B 向量空间对比与召回监控。
技术要点:
- 片段变更自动重向量化与重建索引;集合级模型切换需重向量化(多数向量库不支持在线整库换模)。
关键注意事项(可选):
- 版本化与回滚:为片段保存版本历史与哈希,便于审计与差异对比;避免无差别全量重嵌入。
8.3 主题(Topic)管理
功能定义:以“主题(业务域)”为语义容器,绑定 数据集 与 知识库,沉淀指标口径/维度/业务规则与筛选模板,形成统一的语义背景。
业务价值:以主题为边界统一语义与权限,加速模型获取数据。
8.3.1 主题数据集知识库绑定
作用:主题承载“业务语义 + 可用资源 + 权限边界”。同一主题下配置一组数据集(多张库表)与一组知识库(文档集合与索引),供对话时选择与检索。
图 8.2 主题管理架构
8.3.2 主题级语义描述与复用(包括数据集创建)
功能定义:为主题配置 语义描述字段(业务背景、数据血缘、FAQ)、数据集创建模板(含字段语义)。
业务价值:增强意图识别/召回与问答可解释性;通过“语义层”实现一次定义、处处复用。业界实践强调在建模层集中定义指标并下发到 BI/应用,保障一致口径。
技术要点:
- 语义字段用于检索重排与工具路由(实体映射)。
- 数据集创建:支持从元数据/样例自动生成新的计算字段与字段描述;
- 基础:主题名称、主题描述。
- 语义字段:
- 数据集描述(用于对话入口检索);
- 字段与别名(custom=客户,xxx项目的客户);
8.3.3 数据集(Dataset)定义与治理(暂定)
注意:现在是“先接入数据源→为主题建立数据集”,数据集是对话与可视化的唯一取数单元。
8.3.3.1 数据集来源
- 绑定数据源后,通过引入数据表定义数据集。
- 数据集的核心单位是表。
8.3.3.2 字段映射
- 定义字段的映射名称和语义描述
8.3.3.4 生命周期与版本
- 状态机:Draft → In Review → Published → Deprecated;
- 发布需通过样例查询与样例可视化校验;变更需生成变更日志并通知引用者(看板/主题问答)。
8.3.3.5 权限与范围(轻量)
- 数据集的可见范围在主题内配置(只读/可导出可下载开关);
- 行列裁剪(Row/Column Level)按简单属性做范围映射(如地区=华北、渠道 in {A,B})。
8.3.4 预置数据看板
8.4 账户与范围配置
授权粒度
- 按主题:可见、可检索、可引用可视化。
- 按看板:可查询、可分享、可导出。
8.4.1 企业/员工账户、项目/主题可见性
8.4.2 数据范围授权策略与审计
9. 对话平台
对话平台是 Eyes Intelligent System 的“唯一入口、核心舞台”。它承载用户与系统的所有交互,包括多轮上下文理解、检索增强生成(RAG, Retrieval-Augmented Generation:先检索、后生成)、多工具协作的 Agent 编排,以及“自然语言 + 可视化”的结果呈现。对话平台依赖第 8 章的数据管理平台提供的主题(Topic)语义层、数据集与知识库索引、权限范围:
- 知识库与索引:从数据管理平台同步的向量索引与倒排索引,作为 RAG 的召回入口。
- 数据集与口径:Topic 绑定的指标/维度定义与数据源连接信息,作为取数与计算工具的约束。
- 权限控制:员工账户的数据范围、知识库可见性、结果分享的有效期策略。
业界实践表明,RAG 可显著降低“幻觉”,并通过出处可追溯提升信任度,但质量取决于检索质量与实现细节,仍需人工监督与复核。
9.1 会话与上下文管理(历史记忆与话题切换)
功能定义
- 上下文管理:在多轮对话中保持语义连续,避免重复输入;支持“短期记忆(滑动窗口)+ 长期会话摘要”的混合策略。
- 话题切换:在同一会话内显式/隐式切换 Topic 与数据范围;或一键开启新话题,清空临时上下文但保留会话摘要。
- 存储与合规:对话与摘要安全存储,可配置脱敏策略与保留周期。
业务价值
- 提高连续追问效率与答案稳定性,减少“重复讲述”的摩擦。
- 在跨话题决策中,确保切换后的口径/数据范围即时生效,避免“串话”。
- 可复用历史摘要作为“会话模板”,提升团队协作效率。
技术要点
- 短期上下文:基于窗口(最近 N 轮消息)保证即时对齐。
- 长期记忆:按阈值触发会话摘要(LLM 生成)并存档,或落至向量库以便跨会话检索回放(“记忆检索”)。常见实现是“缓冲+摘要”的组合内存。
- 话题切换:UI 上提供“新主题”与“切换 Topic”操作;后端重置窗口记忆、保留长期摘要,并更新数据范围上下文(绑定新的 Topic、指标口径、可用数据集)。
- 数据与隐私:会话原文与摘要分层存储;敏感字段(PII)可选脱敏;摘要与向量化文本分区加密;保留期与可删除权由企业策略配置。
性能指标 / 安全性注意事项
- P95 轮次延迟(纯语言轮次,不含大规模取数):≤ 2.0s;
- 摘要更新时间:会话长度 > M 条或上下文 token > T 时触发,触发延迟 ≤ 800ms;
- 隐私:敏感字段脱敏准确率 ≥ 99%;支持会话级清除与导出审计。
图 9.1 会话状态流转
9.2 RAG 检索链路(召回-重排-引用片段展示与出处追溯)
功能定义
- 召回(Retrieve):对接数据管理平台的混合检索(向量 + 关键词 BM25),并支持时间、Topic、标签、权限的过滤。
- 重排(Re-Rank):采用Reranker模型重排结果。
- 引用片段展示:在答案中高亮关键句,并与来源片段建立锚点。
- 出处追溯:展示文档名、段落、时间戳;会展示原切片内容。
业务价值
- 高召回 + 高精确:混合检索提升召回率,重排提升前列相关性,综合提升可用率。
- 可信与可审计:引用片段与出处链接让答案“可验证、可复现”,降低“幻觉”风险。
技术要点
- 混合检索:并行执行向量检索与关键词检索,使用 **RRF(Reciprocal Rank Fusion)**融合结果;支持时效性加权。
- 重排模型:Qwen3-Reranker系列。
- 引用与追溯:答案结构化携带 source_id, page, chunk_id, score, retrieval_time;UI 侧可展示原文。
- 与第 8 章交互点:读取知识库向量索引/倒排索引、文档元数据、Topic 绑定、可见性权限。
性能指标 / 安全性注意事项
- 检索召回率@k ≥ 0.9(离线标注集);重排精确率@k ≥ 0.7;
- 端到端延迟(P95):召回+重排 ≤ 1.2s(10k 候选量级);
- 引用准确率 ≥ 99%(source_id/页码正确性);
- 权限隔离:检索/重排仅限可见集合;跨租户零泄漏。
图 9.2 RAG流程
9.3 Agent 工具编排(取数、计算、图表、复核)
功能定义
- 任务分解与路由:调度 Agent 将用户意图拆解为子任务(取数、计算、可视化、复核)。
- 工具目录(按 Topic 与权限暴露):
- 数据取数:API 查询、缓存与分页;
- 计算:聚合、同比环比、指标衍生;
- 结果复核:二次检索核对、交叉计算、规则校验(VDS 原则)。
- VDS 原则落实:全流程强调可预测性、可计算性、稳定性(PCS);禁止 LLM 直接做数值计算,一律通过计算工具执行并留痕。
业务价值
- 多步推理 + 工具化确保结论可复现、可审计;
- 复核闭环显著降低错误代价。
技术要点
- ReAct 策略:推理-行动交错,外部检索/取数作为行动,再将观察反馈纳入后续推理。
- 工具适配层:统一工具协议(inputs/schema、outputs/schema、cost/latency 画像);工具选择时兼顾口径、权限、时效与成本。
- 复核策略:二次检索对拍、重算抽样、边界条件警示;对“不确定/冲突”给出置信与下一步建议。
性能指标 / 安全性注意事项
- 工具命中率 ≥ 95%(在可用工具集合内正确选择);
- 复核触发准确率 ≥ 95%(对异常检测的召回/精确);
- 端到端取数+计算(P95):≤ 3.5s(百万行级聚合,含缓存);
- 安全:工具调用按租户/Topic 白名单与参数校验;所有步骤链路留痕。
图 9.3 简易 Agent 设计
9.4 结果呈现(自然语言摘要+图表渲染+导出)
功能定义(图表部分待定)
- 呈现形态:
- 自然语言:一句话结论 + 细节说明 + 局限性/置信提示;
- 图表:柱状、折线、饼图、KPI 卡、漏斗、热力等;
- 引用与出处:锚点与高亮;
- 导出:PDF、Excel、图片(含水印/口径说明/时间戳)。
- 交互能力:过滤器、下钻、缩放、悬浮提示、下载、联动筛选(Dashboard 式)。
- 分享:内部群、外链、邮件;链接带有效期与权限校验;可撤销。
业务价值
- 用一句话+一张图直达业务结论;
- 交互探索与导出共享,支持跨团队复用;
- 出处与口径可视,减少误读。
技术要点
- 图表渲染标准:采用 Vega/Vega-Lite(声明式 JSON 规范,交互语法丰富、可扩展)。
- 交互细节:原生支持 selection、tooltip、联动筛选;可启用 HTML Tooltip 插件增强提示。
- 可移植性:VL 规范可在前端/后端生成与导出(PNG/SVG),嵌入看板或导出静态报告。
- 导出与水印:PDF/图片加水印、生成时间、Topic、指标口径;Excel 导出保留字段语义与口径。
- 多语言与本地化:文案包 + 数字/日期区域化(en-US/zh-CN 等)。
性能指标 / 安全性注意事项
- 首屏渲染(P95) ≤ 1.0s(缓存命中);
- 交互响应 ≤ 100ms(本地交互,如 Tooltip/筛选);
- 导出完成 ≤ 3s(百万级明细 Excel 采用异步生成 + 通知下载);
- 安全:外链分享需登录/口令/有效期,多维度审计(谁在何时看了什么)。
UI/UX 要点(摘要)
- 响应式布局(移动端仅展示核心 KPI 与关键图);
- 图表“可读性优先”:色彩/标注/单位/口径提示清晰;
- 图上可点“查看出处”,侧栏同步滚动到引用片段;
- 一键“复制图表为图片 / 复制数据为表格 / 复制引用”。