• MCP:把「接什么工具」从各家自研接口,收敛成可复用的开放协议,Agent 才有稳定的「手脚」。
  • Vibe Coding:用自然语言指挥生成与迭代代码,把门槛从「写每一行」挪到「说清楚要什么」。
  • Agent:在 MCP + 强模型之上,做多步规划、调用工具、执行工作流;和单次问答不是同一类游戏。
  • OpenClaw / Skills:本地或自托管的 Agent 运行时 + 可分发、可组合的 Skill 包,把能力做成「装插件」。

若你更关心「Skill 目录长什么样、和 GitHub 上同名课程有啥区别」,可先看站内这篇:Agent Skills:AI 时代的可复用能力封装

2024 到 2026 年,大家聊 AI 时,「技能」越来越常指一件具体的事:模型不只生成文字,还能按步骤调用工具、读写环境、把事办完。下面按时间先后,把 MCP、Vibe Coding、Agent、OpenClaw 与 Skills 串成一条线;例子侧重能想象的用法,方便你对照自己的场景。


MCP(Model Context Protocol):先把「接线」标准说清楚

Anthropic 在 2024 年 11 月前后开源并推广了 Model Context Protocol(MCP)[1]:目标很直接,少做「每个产品各造一套 AI 接数据库、接 SaaS、接本地文件」的碎片活。你可以把它理解为:在应用与数据源、工具之间,约定一种双向、可发现、可安全管控的连接方式(常被比作「AI 侧的通用接口」)。

MCP Server 一旦把 Git、日历、知识库等封装好,Agent 就不必为每个集成从零写 schema;同一套能力也能在多款客户端里复用。2025 年起,越来越多工具开始支持 MCP 或同类互操作方案,生态也从「一家主推」走向多方参与。

如果你想从“协议层”继续看到“交付层”,可以接着读 Harness Engineering 演进全景(2022-2026)

能怎么用(想象场景):企业里给分析助手接上只读库与 BI,用户一句「按大区看 Q4 走势并出图」,Agent 经 MCP 查数、算指标、回传图表——过去常要数据同事写 SQL、再配脚本,现在可以压进对话里的几轮确认。另一类常见组合是:设计稿 / 浏览器 / 部署串成流水线,由 Agent 按步骤拉设计、改代码、跑构建,少在各环节手动拷贝。


Vibe Coding:从「抠语法」到「说清楚意图」

Karpathy 把这种做法称为 “Vibe Coding”:开发者更多通过自然语言(甚至语音)描述意图,让模型反复生成、修改、调试代码;在很多场景里,重心从「手写每一行」转向「持续给出反馈并迭代」[2]

2025 年 2 月,Andrej Karpathy 在 X 上把一种做法叫 Vibe Coding[2]:更靠「感觉」和意图描述,用自然语言(甚至语音)让模型生成、修改、调试代码,实践上往往少抠每一行手写、多靠迭代指令。这能成立,前提是编辑器加上强模型,已经能扛住大量实现细节。

如果你正在做 IDE 内的实战迁移,和 Prompt 到 Harness 的实战拆解 里讲的“角色分离 + 状态外置”一起看,会更容易把“快”变成“稳”。

后来「Vibe Coding」进了开发者日常用语,也有媒体讨论会不会被词典收录——真正值得盯的其实不是名字,而是边界:原型可以极快,上线后的监控、安全、可维护性仍要人兜底。Karpathy 分享的 MenuGen(菜单拍照 → 配图与菜名解释)常被拿来举例:需求来自真实场景,路径高度依赖 AI 迭代,同时也让人看见生产环境里「继续改、继续补」的成本。


AI Agent:会聊与会干之间,差一个「闭环」

Agent 并不是 2025 年才有的词,但这几年更容易谈「落地」:一边有 MCP 这类工具协议,一边有 Vibe Coding 这类降低编排成本的做法,模型侧在长程任务与工具调用上也普遍变强,几件事叠在一起,多步规划 → 调用工具 → 根据结果再规划才更像常规能力,而不只是 Demo。

和「问一句答一句」相比,Agent 更强调:状态、计划、失败重试、与外部系统对齐。可以把它理解成:MCP(以及同类方案)提供可接的「手脚」,强模型负责理解与决策;产品侧还得你自己卡权限、留审计——能力越强,越要先谈安全。

场景示例:个人或小团队在 Cursor 一类环境里描述需求:「抓某平台公开趋势 → 写入 Notion → 定时发邮件摘要」。Agent 在许可范围内拉 API、写表、部署定时任务;耗时从「手写脚本好几天」缩到「多轮对话 + 调通环境」,但密钥、频率限制、合规仍要单独设计,这里不会替你省略。


OpenClaw(曾用名 Clawdbot / Moltbot):本地与聊天入口里的 Agent

2025 年下半年起,社区里由 Peter Steinberger 等推动的开源项目关注度很高:早期叫过 Clawdbot,后因品牌与商标等原因改名,路线逐渐收束到 OpenClaw——强调可本地或自托管,并可通过 Telegram、WhatsApp、Discord 等驱动,支持命令行、文件、记忆与多 Agent 协作[3]。仓库曾在短时间内冲到很高的 star(具体数以当时页面为准)。

对使用者来说,吸引力通常在三件事:数据与模型路径更可控、按订阅计费的压力可减轻、行为可通过插件与脚本深度定制。也要心里有数:接邮箱、日历、支付等真实系统时,权限与备份要比「玩具 Demo」严得多。

场景示例:在自有机器上跑通后,用 IM 发一条「整理收件箱草稿、拉下周日程、提醒值机」——Agent 在已授权范围内读邮件、写日历、设提醒。另一类流传较广的故事是在配额或路由受限时,用本地代理或备用 API 顶一段流程——这涉及服务条款与合规,只适合在合法前提下理解其工程上的可能性,不宜当成「绕过限制」教程照抄。


Skills 与 ClawHub:把能力做成可安装的包

维度 OpenClaw Skills
本质 本地开源 AI Agent 框架(完整平台/运行环境) 模块化能力扩展包(单个技能/插件)
角色 提供运行环境、聊天接口(Telegram/WhatsApp/Discord 等)、长期记忆、多 Agent 协作、本地文件/CLI 执行、模型接入(Claude/GPT/Ollama 等) 教 Agent “具体怎么做某件事”的指令包
结构形式 一个完整的软件项目(Node.js 守护进程、Web UI、消息通道集成、Workspace 系统) 一个文件夹,通常包含 SKILL.md(YAML 前置 + Markdown 指令)+ 可选脚本/模板/参考文件
主要功能 作为“主机”运行 Agent;连接聊天 App 接收指令;管理内存、会话、心跳(主动唤醒);支持子 Agent / 多 Agent 协作;集成 MCP 或内置工具 封装特定工作流(如 GitHub PR 审查、邮件处理、日历同步);提供自然语言指令、触发条件、最佳实践;支持动态加载、沙箱执行、自进化
安装/使用方式 通过 GitHub 下载运行,配置模型密钥、消息通道,一次性部署后长期运行 通过 ClawHub CLI 安装(如 openclaw skills install github),或手动放入 workspace/skills 目录
范围 整个系统(框架层) 单个能力单元(可复用、可社区分享)
优势 本地隐私安全、无持续 API 费用、支持聊天直接指挥、传播速度快 即插即用、轻量高效、社区生态庞大、易于编写(非代码,类似写文档)
局限性 需本地部署和管理,早期安全依赖 Skill 质量 本身不运行,必须依赖 OpenClaw(或类似框架)才能生效;社区技能质量参差
典型例子 你在电脑上运行 OpenClaw,通过 WhatsApp 发消息“帮我清空邮箱并安排下周会议” “github” Skill:教 Agent 如何创建 PR、审查代码、同步 issue “linear” Skill:把 Slack 讨论转为任务并更新看板
互补关系 OpenClaw 是“容器”和“执行引擎”,提供基础设施和接口 Skills 是“内容”和“能力”,让 OpenClaw 从通用聊天工具变成专业助手

在 OpenClaw 这条线上,Skills 常被说成杀手级特性:每个 Skill 是一个约定好的目录(例如含 SKILL.md、元数据与指令),可被动态加载、在受控环境里执行,并分享到社区注册表。ClawHub 站点负责「发现与版本」[4]。这和我在 Agent Skills 能力封装指南 里写的「把经验打包给智能体读」是同一思想在不同产品里的体现:一边是通用 Agent Skills 规范与 IDE 生态,一边是 OpenClaw 系里的 Skill 市场。

组合多个 Skill 时,典型画像是:Git 类 Skill 管 PR 与 issue 同步,项目管理类 Skill 管看板与任务,再配邮件或浏览器自动化 Skill,把「讨论 → 任务 → 代码 → 发布」串起来。社区也会聊「跑过若干次任务后,把成功模式沉淀成新 Skill」——这类自进化叙事很吸引人,实际效果仍取决于任务能不能复盘、日志干不干净,以及人的审核。


时间线一览(2024–2026)

时段 事件要点
2024.11 前后 Anthropic 推动 MCP,工具连接开始协议化[1]
2025.02 前后 Karpathy 提出 Vibe Coding,自然语言驱动开发成热词[2]
2025 全年 Agent、MCP、IDE 深度集成并行升温
2025 下半年 OpenClaw 路线走红,本地与 IM 入口受关注
2026 初 Skills 注册表与社区包增多,「可组合能力」成为话题

差异对比

一句话速览

名词 一句话
Vibe Coding 自然语言 /「感觉」驱动的开发范式(弱手写、强迭代,常被人说成「忘掉代码存在」)。
Agent 能做多步任务、调用工具的 AI 系统(有规划、有状态,不只是聊天)。
MCP 连接数据源与工具的开放协议,常被比作 AI 侧的「通用接口」。
OpenClaw 可本地/自托管的 Agent 运行时,常用 IM 当入口。
Skills 可安装、可分享的能力包(指令 + 知识,常含 SKILL.md)。

核心定义

  • Vibe Coding:自然语言 /「感觉」驱动的开发范式(忘掉代码存在)。
  • Agent:自主执行多步任务的 AI 系统(有脑有手)。
  • MCP(Model Context Protocol):标准化工具 / 数据连接协议(AI 的「USB-C 接口」)。
  • OpenClaw:本地开源 Agent 框架(聊天指挥的超级助手)。
  • Skills:模块化、可复用能力包(教 Agent 具体怎么做)。

本质类型

  • Vibe Coding开发方式(如何快速创建)。
  • Agent执行主体(谁来做事)。
  • MCP基础设施标准(怎么安全连接外部)。
  • OpenClaw具体实现框架(一个完整的本地 Agent 产品)。
  • Skills能力扩展模块(指令 + 知识包)。

提出 / 流行时间(量级)

  • Vibe Coding:2025 年 2 月(Andrej Karpathy 提出)。
  • Agent:2024–2025 年全面爆发(概念更早,落地在这几年变热)。
  • MCP:2024 年 11 月(Anthropic 开源)。
  • OpenClaw:2025 年 11 月前后(原 Clawdbot,后曾用 Moltbot 等名,再收束到 OpenClaw)。
  • Skills:2025–2026 年随 OpenClaw / ClawHub 普及。

主要功能

  • Vibe Coding:用 vibe(意图、感觉)描述需求,让 AI 自动生成 / 迭代代码。
  • Agent:感知 → 规划 → 多步执行 → 反思(自主完成复杂任务)。
  • MCP:安全、双向、可发现地连接数据源、工具、API。
  • OpenClaw:本地运行 + 聊天界面(Telegram / WhatsApp 等)指挥,支持文件、CLI、长期记忆。
  • Skills:以 SKILL.md + YAML 等形式封装工作流、指令、最佳实践。

关键优势

  • Vibe Coding:门槛极低,非程序员也能快速原型和 ideation。
  • Agent:真正「动手」而非只聊天,能处理长期、多步任务。
  • MCP:统一标准,避免碎片化集成;一次实现,多处复用。
  • OpenClaw:隐私与数据路径更可控、可深度自定义;社区传播快。
  • Skills:即插即用、社区共享(如 ClawHub)、轻量,可沉淀成功模式。

主要局限

  • Vibe Coding:输出概率性强,适合原型 / 周末项目,严谨生产要另做工程化。
  • Agent:需底层工具支持,否则「有脑无手」。
  • MCP:可能增加 token 消耗(schema 注入),且要维护 MCP Server。
  • OpenClaw:早期安全与依赖管理需注意,Skill 质量参差。
  • Skills:本身不执行操作,必须搭配框架或 MCP。

与传统做法对比

  • Vibe Coding:从「精确写代码」→「描述 vibe」。
  • Agent:从「聊天工具」→「能干活的 AI 个体」。
  • MCP:从各家自定义函数调用 → 统一开放协议。
  • OpenClaw:从强依赖云端 Agent → 本地全控、自托管 Agent。
  • Skills:从硬编码工具逻辑 → Markdown + YAML 可分享知识包。

典型使用场景

  • Vibe Coding:快速搭 App、菜单可视化(如 Karpathy 的 MenuGen)、原型验证。
  • Agent:自动化工作流、复杂项目管理、个人 / 企业任务执行。
  • MCP:连接数据库、GitHub、Notion、日历等外部系统。
  • OpenClaw:个人日常自动化(清邮件、排会、管代码仓库等)。
  • Skills:复用最佳实践(如 GitHub PR 审查、Linear 任务同步)。

彼此怎么配合

  • Vibe Coding:适合快速「vibe」出 Agent 或 Skills 的原型。
  • Agent:需要 MCP、Skills 等提供「手脚」与用法。
  • MCP:提供连接能力;Skills 常补充「怎么用这些连接」。
  • OpenClaw:可作为集成 MCP + Skills 的落地平台之一。
  • Skills:常与 MCP 搭配——MCP 给工具,Skills 教用法与流程。

结语

一年半到两年里,行业叙事从「模型有多会写」转向「能不能在真实系统里稳定做完」。MCP 解决接线,Vibe Coding 降低表达成本,Agent 承担闭环,OpenClaw 与 Skills 则把「个人或小团队能握在手里的运行时 + 模块」推到台前。与此同时,隐私、越权、供应链与「影子自动化」也会一起放大——工具越顺手,权限与审计越要和「顺手」同样认真。

若你刚入门,不妨选一个最小场景:只接一个 MCP 工具,或只写一个最小 Skill,跑通「输入 → 调用 → 可复查的输出」,再谈规模化;比一次性凑齐全家桶更稳。

相关阅读:

引用来源

〔注1〕MCP 官方站点与协议说明:Model Context Protocol

〔注2〕Karpathy 提出 Vibe Coding 的原始帖子:Andrej Karpathy on X

〔注3〕OpenClaw 项目仓库(含项目定位与功能说明):openclaw/openclaw

〔注4〕ClawHub 站点(Skills 发现与分发入口):ClawHub