1. AI 发展路径

1.1 基础: 语言模型 (Language Models) - 一切的基石

Language Models (语言模型): 这是 AI 发展的基石。
语言模型能够理解和生成人类语言，是许多 AI 应用的基础，例如文本生成、机器翻译、问答系统等。大型语言模型 (LLMs) 属于这一类。
Understanding (理解): 指 AI 对语言、文本、指令等的理解能力。
Context (情境/上下文): 指模型在处理信息时考虑上下文的能力，上下文理解是进行复杂交互的基础。

1.2 中级: 生成式AI应用 (GenAI Applications)、推理与创造力

Conditional Data Generation (条件数据生成): 指 AI 能够根据给定的条件或提示生成特定类型的数据，例如根据文本描述生成图像、根据主题生成文本等。
Creativity and Novelty (创造力和新颖性): 指 AI 能够产生原创性的、新颖的内容，而不仅仅是重复或模仿已有的数据。
GenAI Applications (生成式 AI 应用): 这是指基于生成式 AI 技术的各种应用，例如图像生成器、文本生成器、音乐生成器等。
Reasoning & Problem-Solving (推理和问题解决): 指 AI 能够进行逻辑推理、解决复杂问题的能力。这是更高级 AI 的重要特征。

1.3 高级: AI 代理 (AI Agents) - 最终目标：类人交互

Data Synthesis (Agentic Workflows) (数据合成 - 代理工作流)：这个阶段是指，人工智能系统可以自主生成和处理各种不同类型的数据，用于各种不同的应用场景。
AI Agents (Human-Like Interactions) (AI 代理 - 类人交互): 这是 AI 发展的最高阶段，目标是创建能够像人类一样进行自然、流畅交互的 AI 代理。这些 AI 代理不仅能够理解和生成语言，还能够理解人类的情感、意图，并做出相应的反应。

agent = 大模型 + 记忆 + 决策工具 + 工具使用

cursor 就是 agent

1.4 Agentic AI（代理型 AI)

Agentic AI 最大的特点就是自治，它可以自主规划并采取行动来实现用户定义的目标。

AI Agent 可以自动处理一些简单的任务，例如回答问题、组织日历、发送邮件等等，它依赖外部输入和详细的任务描述，我们在做 Prompt Engineering 的时候，本质就是去调整 AI Agent 处理任务规则的过程。

而 Agentic AI 可以自主规划并采取行动来实现用户定义的目标，它高度自治，可以不依赖人的参与，遇到不懂的问题会主动学习和解决。例如，自动驾驶，用户只需要告诉 AI 想去哪里，AI 就会自动规划路线、驾驶汽车、避开障碍物；再例如，Devin，号称人类第一位 AI 程序员，尽管当前还只有实习生水平，但它可以 7x24 小时不间断地、高效地执行任务，很大程度释放了基础生产力。

Gartner 预测，到 2028 年，至少 15% 的日常工作决策将由 Agentic AI 自主做出，而 2024 年这一比例为 0%，这意味着，Agentic AI 将会在未来几年内迅速发展，同时也意味着，很多人类的工作将被 AI 取代，这并不遥远。

2. AGI (Artificial general intelligence) 通用人工智能

我们今天使用的 AI 系统需要大量的训练才能处理同一领域的相关任务。例如，您必须使用医疗数据集对预训练的大型语言模型（LLM）进行微调，然后它才能作为医疗聊天机器人持续运行。

通用人工智能（AGI）是一个人工智能理论研究领域，研究如何开发具有类人智能和自学能力的软件。其目标是让软件能够执行训练或开发目的之外的任务。

AGI 系统可以像人类一样解决各个领域的问题，而无需人工干预。AGI 不局限于特定范围，而是可以自学并解决从未接受过训练的问题。因此，AGI 是完整的人工智能的理论表现，它以广义的人类认知能力解决复杂的任务。

简单来说，AGI 的目标是创造出能够像人类一样思考、学习和行动的机器。它被视为人工智能发展的最终目标和里程碑。对于研究人员来说，AGI 仍然是一个遥远的目标。

2.1 预测实现

乐观估计：部分研究者认为，若技术加速发展，可能在20-50年内取得突破。，一些知名的 AI 科学家，如 Ray Kurzweil，就曾预测 AGI 将在 2049 年左右实现。
保守观点：更多学者认为，基础理论未成熟，实现AGI可能需要数百年甚至更久。
怀疑态度：也有观点认为，人类智能的复杂性难以被完全模拟，AGI或许永远无法实现。

Levon's Blog

AI发展路径介绍