什么是 vibe coding?
我的理解:
你只需用自然语言输入你的意图(Vibe),AI 会帮你输出相应的代码,剩下的工作就交给它来完成。
Andrej Karpathy(安德烈·卡帕斯):AI 领域著名专家,被业界昵称为 "KP",曾任 Tesla AI 总监,OpenAI 创始成员。

https://x.com/karpathy/status/1886192184808149383?lang=en
维基百科解释
https://zh.wikipedia.org/wiki/Vibe_coding
看看下面这张图

Linus Torvalds:Linux 之父,Git 的作者

Tobi:Shopify 联合创始人兼 CEO

https://x.com/tobi/status/2026148524140695973, https://github.com/tobi
DHH:Ruby on Rails 之父

https://x.com/dhh/status/2028463162513871329
Ryan Dahl:Node.js 和 Deno 的作者

https://x.com/rough__sea/status/2013280952370573666
20 岁大学生花 10 天 VibeCoding 一个开源项目,获盛大资本 3000 万投资
感兴趣的朋友可以去读下作者 BaiFu 的分享:https://mp.weixin.qq.com/s?__biz=MzY4NjA0NjIwMQ==&mid=2247483661&idx=1&sn=243099d64445cb678df265c93226cb78&scene=21&poc_token=HP_It2mjYUFCqSUM2Enc1XrrvBtUR-AFzsiMdMUL
无疑是 2025 年到现在 GitHub 上最火的项目之一
OpenClaw 是奥地利开发者 Peter Steinberger 起初当作「playground project」做出来的个人 AI 助手项目,跑在你自己的设备上,并通过 WhatsApp、Telegram、Discord 等聊天软件来收发指令——非常符合 vibe-coding 的典型场景:先把「我要一个能在各种聊天软件里帮我干活的本地 Agent」这个 vibe 丢给代码,再不断迭代。
Peter 已于 2026 年 2 月正式加入 OpenAI,专注于「让普通人也能用上的 Agent」,同时继续以开源的方式推进 OpenClaw 生态,如今已由基金会托管,保持开源开放。
Cursor 设计负责人 Ryo Lu 用 Cursor 全流程 vibe 出来的「操作系统」—— 在浏览器里跑的怀旧风 OS(复刻 Mac OS X Aqua、System 7、Windows XP/98 等)
内置 17 个应用(Finder、终端、iPod 模拟器、时光机浏览器等)、AI 助手 Ryo、虚拟文件系统与多主题,技术栈为 React 19 + TypeScript + three.js
再看看 GitHub 热门榜单:https://github.com/trending?since=monthly
都有一个 claude 的头像
IDE Extensions, AI-Native IDEs, Terminals, Online SaaS, Others


gh 等工具也能辅助开发流程。SDD: Spec-Driven Development, 规格驱动开发
一套面向 AI Agent 编程的技能框架与软件开发方法论 (工作流),强调用技能驱动需求澄清、方案设计、实现计划和代码审查。
GitHub 开源的 Spec-Driven Development 工具包(Specify CLI + /speckit 工作流),强调先规格、后实现、分阶段与 AI 协作。
核心思想可以概括成一条闭环:
无论是 Superpowers 还是 Spec Kit,
前一段时间在 AI 辅助编程圈里很火的一种做法,名字来自《辛普森一家》里的 Ralph Wiggum(拉尔夫·韦根)。创造者 Geoffrey Huntley 用一句话概括:「Ralph 就是一个 Bash 循环。」 最简形式就是反复把同一份提示交给 Agent,让它在仓库里推进任务,直到满足退出条件(例如测试全绿、验收清单完成或达到最大轮次):
while :; do cat PROMPT.md | claude-code ; done
和「一条对话聊到底」的差别: 每一轮往往是新开会话、干净上下文,避免长对话里工具调用、旧错误堆叠造成的 context rot(上下文劣化)。进度不靠模型「记住聊过什么」,而靠 仓库里的真实状态:代码、测试、git 历史、进度文件、spec——这和上一节「spec → plan → 实现 → review」的外化思路是同一类工程化:状态在文件里,退出条件明确,可重复跑。

参考阅读:
prd.json、progress.txt 与 git 做轮次间记忆;仓库附带 交互式流程图 是一个“让 LLM/Agent 自己做研究”的实验框架:它把你要做的事缩成一个反复跑实验、用指标说话、好就保留坏就丢弃的循环。
具体来说,每一轮它会在仓库里(主要是允许修改 train.py)做一次代码改动 -> 用单 GPU 跑一个固定时间预算(约 5 分钟) -> 用 prepare.py 里的评估器算出 val_bpb(越低越好) -> 然后根据结果决定“保留改动并前进分支”还是“放弃并回滚到原点”,循环继续直到人为中断。
autoresearch 和 ralph loop 可谓是“异曲同工”:同样是把推进交给可重复、可验证的循环(好就前进,差就回滚),只是它把循环具体化成了 ML 实验的选择器
这两个是 AI Agent 的标配,一个是标准化的接口,一个是标准化的技能库
为智能体提供新能力与专业知识的一种简单、开放的格式。
SKILL 的文件夹结构
本质上是包含 SKILL.md 文件的文件夹,下面是一个示例:
my-skill/
├── SKILL.md # Required: instructions + metadata
├── scripts/ # Optional: executable code
├── references/ # Optional: documentation
└── assets/ # Optional: templates, resources
SKILL.md 的组成
| 部分 | 说明 |
|---|---|
| Metadata | 元数据:name, description 等 |
| Instructions | 指令:自描述、可扩展、可移植 |
| Resources | 资源:scripts, references, assets |
指令的核心特性
SKILL 是如何工作的?
渐进式披露 (Progressive Disclosure)
flowchart LR
A["Discovery 发现"] --> B["Activation 激活"]
B --> C["Execution 执行"]
style A fill:#FF6B6B,color:#fff
style B fill:#4ECDC4,color:#000
style C fill:#45B7D1,color:#fff
三个阶段详解
Discovery 发现 — Agent 启动时,只加载所有 SKILL 的元数据 (name, description)。Agent 只需知道什么任务用哪个 SKILL。
Activation 激活 — 当 Agent 执行任务时,上下文匹配到元数据描述的 SKILL,此时才加载完整的 SKILL.md 到上下文中。
Execution 执行 — Agent 根据 SKILL.md 指令,按需加载引用文件或执行指定代码。
社区更看好 SKILLS
YC CEO 抨击 MCP

perplexity 宣布移除 MCP 支持

现在大部分软件、框架和 SaaS 服务也会提供 MCP,或支持 skills,比如 Cursor、Claude、Gemini 等。
::TODO: ::
使用本地代理抓包来运行 Claude
http_proxy=http://127.0.0.1:8888 https_proxy=http://127.0.0.1:8888 claude
refs: https://askubuntu.com/questions/73287/how-do-i-install-a-root-certificate
sudo openssl x509 -in charles.pem -inform PEM -out charles.crt
或
openssl x509 -inform DER -in charles.cer -out charles.crt
跨平台工具:skills
不同 Agent 需要放到不同目录,规则各异。可使用 skills CLI 工具:
npx skills add vercel-labs/agent-skills --skill web-design-guidelines
npx skills add https://github.com/michalparkola/tapestry-skills-for-claude-code/tree/main/article-extractor
可以去 skills.sh 或者 GitHub 上搜索一些流行的 skills
例如:openclaw 内置的一些 skills
一些有意思的 skills:
skill: ai-commit

skill: crawl-x, system-macro
在日常开发中,如果你会同时用到多种工具、多个 AI Agent,最好避免大家「抢同一组文件」导致冲突。这时候就可以善用 git worktree:为同一个仓库快速创建多个独立工作目录,每个 worktree 绑定一个分支,各干各的。
简单说,git worktree 能让你:
stash/checkout。结合 AI 工具的一个好用法是:把每个 AI Agent 当作一个「数字员工」,给它分配一个专属 worktree 和分支,让它在自己的工作区里改代码、跑测试、提交 commit。我们作为「人类 tech lead」只需要负责分配任务、协调工作、进行人工 review 和合并即可。
我自己的日常用法可以通过编写 shell function 来实现:git-worktree functions gwa, gwd 快速创建和删除 worktree
通过语音输入,打字速度可以从每分钟 45 字提升到 220 字 (根据统计),大幅加快了 vibe-coding 的效率
::TODO: ::
来,咱们先现场演示一个简单的 vibe-coding 例子
vibe-coding-demo-20260326请生成一个单文件的前端页面这个当前文件(index.html,纯原生 JS + CSS,不要任何依赖), 输出到当前目录的 `dist/index.html`
帮我用系统默认浏览器打开这个文件预览下
使用 gh 帮我创建一个仓库
集成到 GitHub PR 用 AI 做 code review 的方案:
首先这个项目就是 Vibe-Coding 出来的,刚刚上面也提到了
传统的 Vibe-coding(如 Cursor、Windsurf): 是主动式的。你必须坐在电脑前,打开 IDE,输入 Prompt,然后盯着它改代码。你依然在"工作流"的中心。
有了 OpenClaw,Vibe-coding 的场景变了。你可以在下班路上,掏出手机在 Telegram 里给你的 OpenClaw 发一条消息:「帮我在本地跑一个 Redis 容器,然后把我刚才想到的那个购物车逻辑用 Python 写出来,测试通过后发个截图给我。」 它会在你的老旧主机或 VPS 上默默执行一切。它让人类彻底脱离了 IDE 的物理束缚。
可以和前面之前提的几个 Cloud Agentic 开发有点类似,但是他是跑再你个人设备上,你可以赋予他更多的权限
Design OpenClaw prompt injection attack