0%

RAG学习

1. 基础

1.1 RAG 为什么出现

大模型问题:

  • 幻觉问题,基于概率

  • 数据新鲜度

  • 数据安全

1.2 基础

  • 标量(没有方向的量),向量(一维数组),矩阵(二维数组),张量(多维数组)

  • 知识库就相当于外挂硬盘。

  • RAG 就是对知识库向量化。

2. RAG介绍

  • 来源 2020年 facebook 的 论文

  • 采用向量搜索的好处,是支持语义检索

  • 不足

    • 基于语义相似度

    • 缺乏总结性检索

    • 知识库权限问题

  • GarphRAG

    • 把知识放到图数据库

2.1 RAG 实践

教程:https://www.youtube.com/watch?v=p1AwNrOWTRQ

  • 知识库 -> 拆块 -> 向量化 -> 向量数据库
  • 提问 -> 向量化 -> 向量数据库 -> 匹配TOPK -> 大模型(归纳总结)

问题:

  • 解决方案1
    • 向量模型 + 重排序模型
  • 解决方案2
    • 使用 MCP 调用数据库
  • 解决方案3
    • 使用大模型的超大上下文

3. 教程

可以加首页作者微信,咨询相关问题!