Levon's Blog

微信: L6241425

1. 基础

1.1 RAG 为什么出现

大模型问题:

  • 幻觉问题,基于概率

  • 数据新鲜度

  • 数据安全

阅读全文 »

最近发现不少程序员转行大模型开发,直接去学pytorch、transformer, 从底层开始学,其实大可不必。你用了那么多年MYSQL也没见你想去重新开发一个数据库,怎么突然就想去开发一个新模型了。

如果你想弄个Deepseek,需要先评估自己的学历背景、学术背景,能不能加入国内这几家大模型开发团队,或者退一步也是做模型微调,但是不用Github开源的微调工具,自己有学术成果,设计新的微调方法,这条路几乎不适合半道转行的应用开发程序员。

阅读全文 »

1. 大模型

1.1 LLM 模型

大语言模型(LLM,Large Language Model),也称大型语言模型,是一种旨在理解和生成人类语言的人工智能模型。

LLM 通常指包含数百亿(或更多)参数的语言模型,它们在海量的文本数据上进行训练,从而获得对语言深层次的理解。LLM 的一个杰出应用就是 ChatGPT ,LLM 通过采用 思维链(CoT, Chain of Thought) 推理策略,利用包含中间推理步骤的提示机制来解决这些任务,从而得出最终答案。

阅读全文 »

1. Timeout 的区别

1.1 http.Client.Timeout

  • 作用: Timeout 定义了整个 HTTP 请求的最长时间,包含以下所有步骤的总和:
    • DNS 解析
    • 建立 TCP 连接(包括 DialTimeout
    • TLS 握手(如果是 HTTPS)
    • 发送请求
    • 读取响应头和响应体
    • 自动重定向(如果启用)的耗时
  • 触发条件: 如果整个过程的累计时间超过 Timeout,请求会被强制取消,并返回 net/http: request canceled (Client.Timeout exceeded) 错误。
阅读全文 »

1. 使用

1.1 破解

1
curl -fsSL https://raw.githubusercontent.com/spicetify/cli/main/install.sh | sh

有了购物车之后,搜索 AD,屏蔽广告

阅读全文 »

1. 数据分析

1.1 均值还是90分位数

看均值的场景:

  1. 数据分布较为正态或对称时
  2. 数据波动不大,没有明显的异常值
  3. 需要了解整体水平或趋势
  4. 样本量较大且分布均匀

看90分位数的场景:

  1. 数据分布倾斜时
  2. 需要排除异常值影响时
  3. 长尾分布(少数爆款视频点击量高,大量普通视频点击量低)
阅读全文 »

1. AWS 基础

1.1 使用场景

安装 awscli

1
2
brew install awscli
aws configure # 配置下aws configure

获取 access_key_id

  1. 登录 AWS 管理控制台
  2. 点击右上角的账户名称,选择 “Security credentials” (安全凭证)
  3. 在安全凭证页面,找到 “Access keys” (访问密钥) 部分
  4. 点击 “Create New Access Key” (创建新的访问密钥)
阅读全文 »
0%