1. AI 发展路径

1.1 基础: 语言模型 (Language Models) - 一切的基石
Language Models (语言模型): 这是 AI 发展的基石。
语言模型能够理解和生成人类语言,是许多 AI 应用的基础,例如文本生成、机器翻译、问答系统等。大型语言模型 (LLMs) 属于这一类。
Understanding (理解): 指 AI 对语言、文本、指令等的理解能力。
Context (情境/上下文): 指模型在处理信息时考虑上下文的能力,上下文理解是进行复杂交互的基础。
1.2 中级: 生成式AI应用 (GenAI Applications)、推理与创造力
- Conditional Data Generation (条件数据生成): 指 AI 能够根据给定的条件或提示生成特定类型的数据,例如根据文本描述生成图像、根据主题生成文本等。
- Creativity and Novelty (创造力和新颖性): 指 AI 能够产生原创性的、新颖的内容,而不仅仅是重复或模仿已有的数据。
- GenAI Applications (生成式 AI 应用): 这是指基于生成式 AI 技术的各种应用,例如图像生成器、文本生成器、音乐生成器等。
- Reasoning & Problem-Solving (推理和问题解决): 指 AI 能够进行逻辑推理、解决复杂问题的能力。这是更高级 AI 的重要特征。
1.3 高级: AI 代理 (AI Agents) - 最终目标:类人交互
- Data Synthesis (Agentic Workflows) (数据合成 - 代理工作流):这个阶段是指,人工智能系统可以自主生成和处理各种不同类型的数据,用于各种不同的应用场景。
- AI Agents (Human-Like Interactions) (AI 代理 - 类人交互): 这是 AI 发展的最高阶段,目标是创建能够像人类一样进行自然、流畅交互的 AI 代理。这些 AI 代理不仅能够理解和生成语言,还能够理解人类的情感、意图,并做出相应的反应。
agent = 大模型 + 记忆 + 决策工具 + 工具使用
cursor 就是 agent
1.4 Agentic AI(代理型 AI)
Agentic AI 最大的特点就是自治,它可以自主规划并采取行动来实现用户定义的目标。
AI Agent 可以自动处理一些简单的任务,例如回答问题、组织日历、发送邮件等等,它依赖外部输入和详细的任务描述,我们在做 Prompt Engineering 的时候,本质就是去调整 AI Agent 处理任务规则的过程。
而 Agentic AI 可以自主规划并采取行动来实现用户定义的目标,它高度自治,可以不依赖人的参与,遇到不懂的问题会主动学习和解决。例如,自动驾驶,用户只需要告诉 AI 想去哪里,AI 就会自动规划路线、驾驶汽车、避开障碍物;再例如,Devin,号称人类第一位 AI 程序员,尽管当前还只有实习生水平,但它可以 7x24 小时不间断地、高效地执行任务,很大程度释放了基础生产力。
Gartner 预测,到 2028 年,至少 15% 的日常工作决策将由 Agentic AI 自主做出,而 2024 年这一比例为 0%,这意味着,Agentic AI 将会在未来几年内迅速发展,同时也意味着,很多人类的工作将被 AI 取代,这并不遥远。
2. AGI (Artificial general intelligence) 通用人工智能
我们今天使用的 AI 系统需要大量的训练才能处理同一领域的相关任务。例如,您必须使用医疗数据集对预训练的大型语言模型(LLM)进行微调,然后它才能作为医疗聊天机器人持续运行。
通用人工智能(AGI)是一个人工智能理论研究领域,研究如何开发具有类人智能和自学能力的软件。其目标是让软件能够执行训练或开发目的之外的任务。
AGI 系统可以像人类一样解决各个领域的问题,而无需人工干预。AGI 不局限于特定范围,而是可以自学并解决从未接受过训练的问题。因此,AGI 是完整的人工智能的理论表现,它以广义的人类认知能力解决复杂的任务。
简单来说,AGI 的目标是创造出能够像人类一样思考、学习和行动的机器。 它被视为人工智能发展的最终目标和里程碑。 对于研究人员来说,AGI 仍然是一个遥远的目标。
2.1 预测实现
乐观估计:部分研究者认为,若技术加速发展,可能在20-50年内取得突破。,一些知名的 AI 科学家,如 Ray Kurzweil,就曾预测 AGI 将在 2049 年左右实现。
保守观点:更多学者认为,基础理论未成熟,实现AGI可能需要数百年甚至更久。
怀疑态度:也有观点认为,人类智能的复杂性难以被完全模拟,AGI或许永远无法实现。