1_AI 发展路径:从语言模型到通用人工智能

1. AI 发展路径概览

%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#4F46E5', 'primaryTextColor': '#000', 'primaryBorderColor': '#3730A3', 'lineColor': '#6366F1', 'secondaryColor': '#10B981', 'tertiaryColor': '#F59E0B'}}}%%
flowchart TD
    subgraph L1["基础层"]
        A["语言模型<br/>Language Models"]
        B["理解能力<br/>Understanding"]
        C["上下文处理<br/>Context"]
    end

    subgraph L2["中级层"]
        D["条件数据生成<br/>Conditional Generation"]
        E["推理与问题解决<br/>Reasoning"]
        F["创造力<br/>Creativity"]
    end

    subgraph L3["高级层"]
        G["AI Agents<br/>代理工作流"]
        H["类人交互<br/>Human-Like Interaction"]
    end

    subgraph L4["终极目标"]
        I["AGI<br/>通用人工智能"]
    end

    A --> D
    B --> E
    C --> F
    D --> G
    E --> G
    F --> H
    G --> I
    H --> I

    classDef foundation fill:#4F46E5,stroke:#3730A3,color:#fff
    classDef intermediate fill:#10B981,stroke:#059669,color:#fff
    classDef advanced fill:#F59E0B,stroke:#D97706,color:#000
    classDef ultimate fill:#EF4444,stroke:#DC2626,color:#fff

    class A,B,C foundation
    class D,E,F intermediate
    class G,H advanced
    class I ultimate

1.1 基础层:语言模型

语言模型是 AI 发展的基石,具备以下核心能力:

能力说明
语言理解与生成支撑文本生成、机器翻译、问答系统等应用
理解能力对语言、文本、指令的深度理解
上下文处理在处理信息时综合考虑上下文,实现复杂交互

1.2 中级层:生成式 AI 应用

能力说明
条件数据生成根据提示生成特定类型数据(如文生图、主题写作)
推理与问题解决逻辑推理、复杂问题求解
创造力与新颖性产生原创内容,而非简单模仿

1.3 高级层:AI Agents

AI Agent 的核心公式:

Agent = 大模型 + 记忆 + 决策 + 工具调用

%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#4F46E5', 'primaryTextColor': '#000', 'primaryBorderColor': '#3730A3', 'lineColor': '#6366F1', 'secondaryColor': '#10B981', 'tertiaryColor': '#F59E0B'}}}%%
flowchart LR
    subgraph Agent["AI Agent"]
        LLM["大模型<br/>LLM"]
        Memory["记忆<br/>Memory"]
        Planning["决策规划<br/>Planning"]
        Tools["工具调用<br/>Tools"]
    end

    User["用户"] --> Agent
    Agent --> Action["执行动作"]
    Action --> Feedback["反馈"]
    Feedback --> Memory

    classDef core fill:#4F46E5,stroke:#3730A3,color:#fff
    classDef io fill:#10B981,stroke:#059669,color:#fff

    class LLM,Memory,Planning,Tools core
    class User,Action,Feedback io

典型应用:Cursor、GitHub Copilot 等 AI 编程助手均属于 Agent 范畴。

1.4 Agentic AI:自主型 AI

AI Agent 与 Agentic AI 的本质区别:

维度AI AgentAgentic AI
自主性依赖外部输入和详细任务描述高度自治,可自主规划
任务范围处理简单任务(问答、日历、邮件)处理复杂目标(自动驾驶、自主编程)
学习能力依赖 Prompt Engineering 调整规则遇到问题主动学习和解决

典型案例:

  • 自动驾驶:用户只需设定目的地,AI 自主规划路线、驾驶、避障
  • Devin:首个 AI 程序员,可 7×24 小时不间断执行开发任务

Gartner 预测:到 2028 年,至少 15% 的日常工作决策将由 Agentic AI 自主完成(2024 年为 0%)。

2. AGI:通用人工智能

2.1 定义

通用人工智能(Artificial General Intelligence) 是 AI 研究的终极目标:

  • 当前 AI 系统需要针对特定领域训练(如医疗数据集微调后才能作为医疗聊天机器人)
  • AGI 可像人类一样跨领域解决问题,无需人工干预
  • 具备自学能力,能处理从未训练过的任务
%%{init: {'theme': 'base', 'themeVariables': { 'primaryColor': '#4F46E5'}}}%%
stateDiagram-v2
    [*] --> 窄AI: "当前阶段"
    窄AI --> AGI: "技术突破"
    AGI --> ASI: "超越人类"

    窄AI: 窄领域AI
    note right of 窄AI: 需要特定训练<br/>单一领域应用

    AGI: 通用人工智能
    note right of AGI: 跨领域能力<br/>自主学习

    ASI: 超级人工智能
    note right of ASI: 超越人类认知<br/>理论阶段

2.2 实现预测

观点时间预测代表人物/机构
乐观派20-50 年内突破Ray Kurzweil(预测 2049 年)
保守派数百年甚至更久多数学术界学者
怀疑派可能永远无法实现部分认知科学家

3. 扩展阅读

3.1 Humanity’s Last Exam

🔗 https://lastexam.ai/

人类最后的测试(Humanity’s Last Exam, HLE) 是针对大语言模型的前沿基准测试,由人工智能安全研究所与 Scale AI 联合创建。

测试构成:

  • 题目数量:2500 道前沿学术难题
  • 学科分布:数学(41%)、物理(9%)、生物/医学(11%)、人文/社科(9%)、计算机/AI(10%)、工程学(4%)、化学(7%)、其他(9%)
  • 题型:多选题(24%)、简答题、精确匹配题
  • 多模态:约 14% 的题目需要图文联合理解能力

该测试维护了一个不公开的测试集,以防止模型过拟合。