4_RAG学习
1. 基础
1.1 RAG 为什么出现
大模型问题:
- 幻觉问题,基于概率
- 数据新鲜度
- 数据安全
1.2 基础
- 标量(没有方向的量),向量(一维数组),矩阵(二维数组),张量(多维数组)
- 知识库就相当于外挂硬盘。
- RAG 就是对知识库向量化。
2. RAG 介绍
- 来源 2020 年 facebook 的 论文
- 采用向量搜索的好处,是支持语义检索
- 不足
- 基于语义相似度
- 缺乏总结性检索
- 知识库权限问题
- GarphRAG
- 把知识放到图数据库
2.1 RAG 实践
教程:https://www.youtube.com/watch?v=p1AwNrOWTRQ
- 知识库 -> 拆块 -> 向量化 -> 向量数据库
- 提问 -> 向量化 -> 向量数据库 -> 匹配 TOPK -> 大模型(归纳总结)
问题:
- 解决方案 1
- 向量模型 + 重排序模型
- 解决方案 2
- 使用 MCP 调用数据库
- 解决方案 3
- 使用大模型的超大上下文