4_RAG学习

1. 基础

1.1 RAG 为什么出现

大模型问题:

  • 幻觉问题,基于概率
  • 数据新鲜度
  • 数据安全

1.2 基础

  • 标量(没有方向的量),向量(一维数组),矩阵(二维数组),张量(多维数组)
  • 知识库就相当于外挂硬盘。
  • RAG 就是对知识库向量化。

2. RAG 介绍

  • 来源 2020 年 facebook 的 论文
  • 采用向量搜索的好处,是支持语义检索
  • 不足
    • 基于语义相似度
    • 缺乏总结性检索
    • 知识库权限问题
  • GarphRAG
    • 把知识放到图数据库

2.1 RAG 实践

教程:https://www.youtube.com/watch?v=p1AwNrOWTRQ

  • 知识库 -> 拆块 -> 向量化 -> 向量数据库
  • 提问 -> 向量化 -> 向量数据库 -> 匹配 TOPK -> 大模型(归纳总结)

问题:

  • 解决方案 1
    • 向量模型 + 重排序模型
  • 解决方案 2
    • 使用 MCP 调用数据库
  • 解决方案 3
    • 使用大模型的超大上下文

3. 教程