0%

1. 图像生成

1.1 生图流程

市面上文字生成图片基本上都基于 Diffusion 扩散模型,Stable Diffusion / Flux 都是,它最基本的原理是:根据文字指示,把一张随机生成的全是噪点的图片,一步步去掉噪点生成跟文字描述匹配的图片。

  1. 从随机噪点图生成一张正常图片(Denoising UNet)。
img

Denoising UNet 模型在训练过程中记录了海量图片的内容,如果你用一万张不同的图片训练这个模型,那使用它生成出来的会是这一万张图片内容随机组合的一张图片。

阅读全文 »

1. 安装

1.1 下载

1
2
3
curl -L -o trojan-go-linux-amd64.zip https://github.com/p4gefau1t/trojan-go/releases/download/v0.10.6/trojan-go-linux-amd64.zip

unzip trojan-go-linux-amd64.zip -d trojan-go
阅读全文 »

1. 全文搜索选型

1.1 全文搜索

1.2 向量搜索(语义搜索)

1.3 结论 (meilisearch)

  • 如果需要全面的搜索功能且有运维能力:Elasticsearch
  • 如果需要简单部署的全文搜索:Meilisearch
  • 如果需要最高性能和专注的向量搜索:Qdrant 或 Weaviate
  • 如果已有 PostgreSQL:考虑 pgvector 扩展
  • 如果希望纯 Go 实现且内嵌:Bleve
阅读全文 »

1. 软路由

我用的是 网件的 R6220路由器,可以刷老毛子和openwrt 固件。

1.1 刷机步骤

  • 准备工作:1个 U 盘,1根网线,1个路由器。
  • 先刷 breed
  • 再刷固件
阅读全文 »

MCP 的作用:提供标准化接口,让 Cascade 等代理安全访问外部数据源,将数据转化为可操作的上下文。

image-20250311110249044

阅读全文 »

1. 基础

1.1 RAG 为什么出现

大模型问题:

  • 幻觉问题,基于概率

  • 数据新鲜度

  • 数据安全

阅读全文 »

最近发现不少程序员转行大模型开发,直接去学pytorch、transformer, 从底层开始学,其实大可不必。你用了那么多年MYSQL也没见你想去重新开发一个数据库,怎么突然就想去开发一个新模型了。

如果你想弄个Deepseek,需要先评估自己的学历背景、学术背景,能不能加入国内这几家大模型开发团队,或者退一步也是做模型微调,但是不用Github开源的微调工具,自己有学术成果,设计新的微调方法,这条路几乎不适合半道转行的应用开发程序员。

阅读全文 »

1. 大模型

1.1 LLM 模型

大语言模型(LLM,Large Language Model),也称大型语言模型,是一种旨在理解和生成人类语言的人工智能模型。

LLM 通常指包含数百亿(或更多)参数的语言模型,它们在海量的文本数据上进行训练,从而获得对语言深层次的理解。LLM 的一个杰出应用就是 ChatGPT ,LLM 通过采用 思维链(CoT, Chain of Thought) 推理策略,利用包含中间推理步骤的提示机制来解决这些任务,从而得出最终答案。

阅读全文 »