Levon's Blog

微信: L6241425

1. 全文搜索选型

1.1 全文搜索

1.2 向量搜索(语义搜索)

1.3 结论 (meilisearch)

  • 如果需要全面的搜索功能且有运维能力:Elasticsearch
  • 如果需要简单部署的全文搜索:Meilisearch
  • 如果需要最高性能和专注的向量搜索:Qdrant 或 Weaviate
  • 如果已有 PostgreSQL:考虑 pgvector 扩展
  • 如果希望纯 Go 实现且内嵌:Bleve
阅读全文 »

1. 软路由

我用的是 网件的 R6220路由器,可以刷老毛子和openwrt 固件。

1.1 刷机步骤

  • 准备工作:1个 U 盘,1根网线,1个路由器。
  • 先刷 breed
  • 再刷固件
阅读全文 »

MCP 的作用:提供标准化接口,让 Cascade 等代理安全访问外部数据源,将数据转化为可操作的上下文。

image-20250311110249044

阅读全文 »

1. 基础

1.1 RAG 为什么出现

大模型问题:

  • 幻觉问题,基于概率

  • 数据新鲜度

  • 数据安全

阅读全文 »

最近发现不少程序员转行大模型开发,直接去学pytorch、transformer, 从底层开始学,其实大可不必。你用了那么多年MYSQL也没见你想去重新开发一个数据库,怎么突然就想去开发一个新模型了。

如果你想弄个Deepseek,需要先评估自己的学历背景、学术背景,能不能加入国内这几家大模型开发团队,或者退一步也是做模型微调,但是不用Github开源的微调工具,自己有学术成果,设计新的微调方法,这条路几乎不适合半道转行的应用开发程序员。

阅读全文 »

1. 大模型

1.1 LLM 模型

大语言模型(LLM,Large Language Model),也称大型语言模型,是一种旨在理解和生成人类语言的人工智能模型。

LLM 通常指包含数百亿(或更多)参数的语言模型,它们在海量的文本数据上进行训练,从而获得对语言深层次的理解。LLM 的一个杰出应用就是 ChatGPT ,LLM 通过采用 思维链(CoT, Chain of Thought) 推理策略,利用包含中间推理步骤的提示机制来解决这些任务,从而得出最终答案。

阅读全文 »

1. Client 端

在作为客户端发送请求时,超时控制主要分两个层面:高层级的 http.Client 超时 和 低层级的 http.Transport 精细化控制。在大多数情况下,设置 http.Client.Timeout 就足够了,它可以有效地防止整个请求过程的无限期等待。

img

1.1 http.Client.Timeout

最简单,但有时太粗暴。这是最常用的设置,它控制包括连接、重定向(Redirects)以及读取响应体在内的整个请求生命周期的最大时长。

1
2
3
4
5
c := &http.Client{
Timeout: 10 * time.Second,
}
resp, err := c.Get("http://example.com")

  • 涵盖范围:Dial(拨号) -> TLS Handshake(握手) -> Request Headers/Body Send -> Response Headers Read -> Response Body Read。
  • 优点:简单,能防止请求无限挂起。缺点:对于需要处理长流(Streaming)响应的请求(如下载大文件),这个超时如果不小心设置短了,连接会在中途被截断。
  • 如果整个过程的累计时间超过 Timeout,请求会被强制取消,并返回 net/http: request canceled (Client.Timeout exceeded) 错误。
阅读全文 »
0%