RAG 工程与检索系统设计

Name: RAG 工程与检索系统设计
Availability: OnlineOnly
Author: 杨艺韬

一本系统讲解 RAG 从 demo 到生产的工程专著。

RAG 不是"向量数据库 + 大模型"这么简单。真正的生产级 RAG 系统要处理文档解析、分块、Embedding、索引构建、权限过滤、混合召回、重排序、上下文压缩、引用溯源、增量更新、质量评估、成本延迟控制，以及 Agent 长期记忆。任何一环做错，最终都会表现为同一个症状：模型看似会回答，实际不可信。

本书从一次用户提问的完整生命周期出发，拆解 RAG 系统的每个工程边界：知识如何进入系统、问题如何变成检索请求、候选证据如何被筛选、上下文如何被打包、答案如何被验证、系统如何被评估和运营。目标不是教你调一个框架 API，而是建立一套能迁移到企业知识库、代码检索、客服问答、研究助手、Agent Memory 的工程心智模型。

适合谁读

有一定编程经验的 AI 应用开发者、RAG 系统架构师、搜索与推荐工程师、Agent 框架设计者，以及所有想把"知识库问答 demo"推进到生产环境的技术人。

版权声明

本书采用 CC BY-NC 4.0 许可协议。转载或引用请署名 杨艺韬 并附原文链接，禁止商业用途。

RAG 工程与检索系统设计

适合谁读

目录

开篇

第一部分：RAG 系统全景

第二部分：知识进入系统

第三部分：表示与索引

第四部分：召回、排序与上下文

第五部分：Agent Memory 与 GraphRAG

第六部分：生产化

版权声明

RAG 工程与检索系统设计 ​

适合谁读 ​

目录 ​

开篇 ​

第一部分：RAG 系统全景 ​

第二部分：知识进入系统 ​

第三部分：表示与索引 ​

第四部分：召回、排序与上下文 ​

第五部分：Agent Memory 与 GraphRAG ​

第六部分：生产化 ​

版权声明 ​

RAG 工程与检索系统设计

适合谁读

目录

开篇

第一部分：RAG 系统全景

第二部分：知识进入系统

第三部分：表示与索引

第四部分：召回、排序与上下文

第五部分：Agent Memory 与 GraphRAG

第六部分：生产化

版权声明