1. 基础
1.1 RAG 为什么出现
大模型问题:
幻觉问题,基于概率
数据新鲜度
数据安全
1.2 基础
标量(没有方向的量),向量(一维数组),矩阵(二维数组),张量(多维数组)
知识库就相当于外挂硬盘。
RAG 就是对知识库向量化。
2. RAG介绍
来源 2020年 facebook 的 论文
采用向量搜索的好处,是支持语义检索
不足
基于语义相似度
缺乏总结性检索
知识库权限问题
GarphRAG
- 把知识放到图数据库
2.1 RAG 实践
教程:https://www.youtube.com/watch?v=p1AwNrOWTRQ
- 知识库 -> 拆块 -> 向量化 -> 向量数据库
- 提问 -> 向量化 -> 向量数据库 -> 匹配TOPK -> 大模型(归纳总结)
问题:
- 解决方案1
- 向量模型 + 重排序模型
- 解决方案2
- 使用 MCP 调用数据库
- 解决方案3
- 使用大模型的超大上下文