1_AI 发展路径:从语言模型到通用人工智能
1. AI 发展路径概览
%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#4F46E5', 'primaryTextColor': '#000', 'primaryBorderColor': '#3730A3', 'lineColor': '#6366F1', 'secondaryColor': '#10B981', 'tertiaryColor': '#F59E0B'}}}%%
flowchart TD
subgraph L1["基础层"]
A["语言模型<br/>Language Models"]
B["理解能力<br/>Understanding"]
C["上下文处理<br/>Context"]
end
subgraph L2["中级层"]
D["条件数据生成<br/>Conditional Generation"]
E["推理与问题解决<br/>Reasoning"]
F["创造力<br/>Creativity"]
end
subgraph L3["高级层"]
G["AI Agents<br/>代理工作流"]
H["类人交互<br/>Human-Like Interaction"]
end
subgraph L4["终极目标"]
I["AGI<br/>通用人工智能"]
end
A --> D
B --> E
C --> F
D --> G
E --> G
F --> H
G --> I
H --> I
classDef foundation fill:#4F46E5,stroke:#3730A3,color:#fff
classDef intermediate fill:#10B981,stroke:#059669,color:#fff
classDef advanced fill:#F59E0B,stroke:#D97706,color:#000
classDef ultimate fill:#EF4444,stroke:#DC2626,color:#fff
class A,B,C foundation
class D,E,F intermediate
class G,H advanced
class I ultimate1.1 基础层:语言模型
语言模型是 AI 发展的基石,具备以下核心能力:
| 能力 | 说明 |
|---|---|
| 语言理解与生成 | 支撑文本生成、机器翻译、问答系统等应用 |
| 理解能力 | 对语言、文本、指令的深度理解 |
| 上下文处理 | 在处理信息时综合考虑上下文,实现复杂交互 |
1.2 中级层:生成式 AI 应用
| 能力 | 说明 |
|---|---|
| 条件数据生成 | 根据提示生成特定类型数据(如文生图、主题写作) |
| 推理与问题解决 | 逻辑推理、复杂问题求解 |
| 创造力与新颖性 | 产生原创内容,而非简单模仿 |
1.3 高级层:AI Agents
AI Agent 的核心公式:
Agent = 大模型 + 记忆 + 决策 + 工具调用
%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#4F46E5', 'primaryTextColor': '#000', 'primaryBorderColor': '#3730A3', 'lineColor': '#6366F1', 'secondaryColor': '#10B981', 'tertiaryColor': '#F59E0B'}}}%%
flowchart LR
subgraph Agent["AI Agent"]
LLM["大模型<br/>LLM"]
Memory["记忆<br/>Memory"]
Planning["决策规划<br/>Planning"]
Tools["工具调用<br/>Tools"]
end
User["用户"] --> Agent
Agent --> Action["执行动作"]
Action --> Feedback["反馈"]
Feedback --> Memory
classDef core fill:#4F46E5,stroke:#3730A3,color:#fff
classDef io fill:#10B981,stroke:#059669,color:#fff
class LLM,Memory,Planning,Tools core
class User,Action,Feedback io典型应用:Cursor、GitHub Copilot 等 AI 编程助手均属于 Agent 范畴。
1.4 Agentic AI:自主型 AI
AI Agent 与 Agentic AI 的本质区别:
| 维度 | AI Agent | Agentic AI |
|---|---|---|
| 自主性 | 依赖外部输入和详细任务描述 | 高度自治,可自主规划 |
| 任务范围 | 处理简单任务(问答、日历、邮件) | 处理复杂目标(自动驾驶、自主编程) |
| 学习能力 | 依赖 Prompt Engineering 调整规则 | 遇到问题主动学习和解决 |
典型案例:
- 自动驾驶:用户只需设定目的地,AI 自主规划路线、驾驶、避障
- Devin:首个 AI 程序员,可 7×24 小时不间断执行开发任务
Gartner 预测:到 2028 年,至少 15% 的日常工作决策将由 Agentic AI 自主完成(2024 年为 0%)。
2. AGI:通用人工智能
2.1 定义
通用人工智能(Artificial General Intelligence) 是 AI 研究的终极目标:
- 当前 AI 系统需要针对特定领域训练(如医疗数据集微调后才能作为医疗聊天机器人)
- AGI 可像人类一样跨领域解决问题,无需人工干预
- 具备自学能力,能处理从未训练过的任务
%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#4F46E5'}}}%%
stateDiagram-v2
[*] --> 窄AI: "当前阶段"
窄AI --> AGI: "技术突破"
AGI --> ASI: "超越人类"
窄AI: 窄领域AI
note right of 窄AI: 需要特定训练<br/>单一领域应用
AGI: 通用人工智能
note right of AGI: 跨领域能力<br/>自主学习
ASI: 超级人工智能
note right of ASI: 超越人类认知<br/>理论阶段2.2 实现预测
| 观点 | 时间预测 | 代表人物/机构 |
|---|---|---|
| 乐观派 | 20-50 年内突破 | Ray Kurzweil(预测 2049 年) |
| 保守派 | 数百年甚至更久 | 多数学术界学者 |
| 怀疑派 | 可能永远无法实现 | 部分认知科学家 |
3. 扩展阅读
3.1 Humanity’s Last Exam
人类最后的测试(Humanity’s Last Exam, HLE) 是针对大语言模型的前沿基准测试,由人工智能安全研究所与 Scale AI 联合创建。
测试构成:
- 题目数量:2500 道前沿学术难题
- 学科分布:数学(41%)、物理(9%)、生物/医学(11%)、人文/社科(9%)、计算机/AI(10%)、工程学(4%)、化学(7%)、其他(9%)
- 题型:多选题(24%)、简答题、精确匹配题
- 多模态:约 14% 的题目需要图文联合理解能力
该测试维护了一个不公开的测试集,以防止模型过拟合。