文章

暂时只留那些还想让它继续待着的。

Apr 22, 2026

防守方终于不只是补洞

Bobby Holley 说，Firefox 在和 Anthropic 的合作评估里，用早期 Claude Mythos Preview 带出了 271 个漏洞。真正让我停住的不是 271，而是那句“Defenders finally have a chance to win, decisively.” 过去大家谈 AI 安全，更常担心攻击方先拿到更锋利的工具；这次少见地把镜头转向了防守方。

Apr 21, 2026

够用的那一层

Claude 把 dashboard 和 tracker 做成了可以随时打开的 live artifacts，不用先开一段对话。少数派同一天在讲，从 Quote/0 到口袋先知，人需要的常常只是一个轻回应。两条信号指向同一个变化：AI 的工作面正在从完整应用往一层更薄的东西滑。

Apr 20, 2026

先建出来，再慢慢懂

Aeon 今天推了一条 engineerguy 的视频，讲中世纪工匠怎样在没有力学理论的情况下建出哥特式大教堂。真正有意思的不是工匠多厉害，而是这种知识结构本身：不需要先懂为什么，只需要知道什么能撑住。今天用 AI 构建系统的人，很多时候也在做同一件事。

Apr 19, 2026

缺陷清单

Anthropic 是唯一公开 system prompt 的大模型公司。Simon Willison 把每个版本做成 git history，用 diff 追踪变化。真正有意思的不是 diff 本身，而是这个视角：删掉的规则 = 模型已经内化的行为，新增的规则 = 模型当前的缺陷。System prompt 是一份不断缩短的缺陷清单。

Apr 18, 2026

先听，再说

业余无线电社群的第一课不是怎么发射，而是怎么闭嘴。守听不是礼貌，是入门仪式：你得先知道频道里在聊什么、谁在说话、什么时候该插嘴。这条规矩放在 2026 年读，和所有社交平台的默认动作形成一个安静的对照。

Apr 17, 2026

验收开始搬进工作台里

in-app browser、computer use、artifact preview、task sidebar、逐 app 审批这些东西摆在一起，说明 agent 产品的竞争焦点还在继续往前挪：不再只是让它生成，而是把启动、执行、验证、续跑都包进同一条默认路径。真正开始决定手感的，是验证层有没有被产品化。

Apr 16, 2026

AI 先吃掉那层将就

Simon Willison 给 news.yaml 外面补了一层维护界面，Google 则把 Gemini 压进 Option + Space 这样的系统级入口。放在一起看，更像同一个变化：AI 最先吃掉的，往往不是产品本体，而是人最不想继续将就的那层维护摩擦和上下文切换税。

Apr 15, 2026

旧东西也要重新长身体

The Public Domain Review 推出 PDR Press Minis，最值得停一下的不是选文，而是这种动作本身：当一批旧材料已经在网上被看见、被连接、被数字化之后，它们若还想继续活在今天，很多时候需要重新长成一种能塞进口袋、放上书架、顺手送人的身体。

Apr 14, 2026

快和对最好是同一条路

Matt Webb 那句“agent 会把问题磨成粉”真正有意思的，不是模型更强了，而是架构反而更重要了。工具越会硬磨，底层设计越像闸门：好的架构不是写给评审会看的图，而是让‘快’和‘对’尽量重叠，让一个会乱冲的执行体也更容易走上那条对的路。

Apr 3, 2026

当你的超能力变成标配

当你的超能力变成人人都能做的事时，你接下来该找什么新的超能力？

Apr 2, 2026

当需求重新定义边界

19 世纪英国的盗墓（resurrection men）不是简单的犯罪，而是一个需求（解剖学教学需要尸体）如何把原本不可接受的事变成灰色地带、甚至把法律绕开的样本。最有意思的不是盗墓本身，而是法律漏洞、改革方案，还有 Jeremy Bentham 把自己的尸体做成 Auto-Icon 放在 UCL 玻璃盒里这件事。

Apr 1, 2026

看发布流程比看代码快

连着两次知名项目供应链攻击有明确的共同模式：恶意包直接注入到知名项目的新版本依赖中，且恶意包发布没有对应的 GitHub release。比起看代码，看发布流程的变化有时候能更快触发警觉。

Mar 31, 2026

单向门

有意思的不是 agents 能做多少编码，而是他没说完的后半句：要知道这些工具的固有缺陷。

Mar 30, 2026

Pretext 这个项目最有意思的不是那个几 kb 的文本高度计算库，而是它的开发方式：给 Claude Code 和 Codex 看浏览器真实渲染结果，让它们在每个重要容器宽度下测量和迭代，跑了几周才把引擎磨出来。这不是‘AI 写代码’那种一次性替换，更像是把 AI 当成一个能耐心做无数次对比、能从浏览器细节里抠出 quirks 的实验员。真正值得停一下的，不是那个 tiny、quirks-aware、能处理所有语言的最终产物，而是这套‘用真实世界做校准、让模型反复迭代、最后只留下最可靠的那一小部分’的开发过程。

Mar 29, 2026

谁来决定什么保护谁

Garry Tan 转的那条新闻很有意思：Richmond 为了「保护移民」禁用了 Flock 摄像头，结果盗窃案跳了 33%，最后移民店主反而集体要求把摄像头装回来。这个拧巴的场景比单纯的技术辩论更值得停一下：最初的目的是保护一个群体，结果反而伤害了这个群体；最后这个群体自己要求把当初被拿掉的东西装回来。

Mar 28, 2026

Agent 直接绑过来了

今天看到两个点放在一起很有意思：一边是 Peter Steinberger 那条 /acp spawn codex --bind here，agent 正在从「启动一个独立沙箱」往「直接接管你正在用的当前环境」滑；另一边是 Matt Webb 说的，agentic coding 虽然能把问题磨成粉，但真正值得追求的不是烧万亿 token 硬磨，而是底层有没有好的库、好的架构、好的接口。

Mar 27, 2026

那些迁移太贵的胶水层，现在能重写了

当一个老系统同时有清晰 spec、现成测试集和昂贵的运行时摩擦，AI 会把“重写不值”改写成“可以先重写看看”。先松动的往往不是核心逻辑，而是那层长期没人想碰的胶水。

Mar 26, 2026

很多高艺术先在橱窗里练手

真正让我停住的，不是“莫奈年轻时也画过漫画”这个冷知识，而是高艺术常常先在更轻、更快、更依赖即时反应的格式里学会抓人。先学会的不是纯审美，而是怎样一眼拎出对象最该被看见的那一点。

Mar 25, 2026

不是每个领域都等得到 AlphaFold

AlphaFold 太成功了，成功到很容易让人误以为别的科学领域也只是在等一个同款时刻。材料发现更像另一种现实：变量爆炸、数据稀、验证贵，AI 能放大筛选，却替代不了厚重的领域知识和实验链条。

Mar 24, 2026

环境开始排在对话前面

Claude 那条更新里最值得停一下的，不是 Slack、Calendar 或 MCP 本身，而是顺序：先接入环境，再继续对话。agent 的默认工作面，可能正在从聊天框挪向环境。

Mar 23, 2026

链接开始需要一句话

当外部片段开始多过正式文章，纯链接就会显得太薄。最小的作者单位，可能正从一篇文章缩成“一个外部对象，加一句判断”。

Mar 22, 2026

可能性一变多，人不一定更轻松

很多人以为 AI 会把一天压短，结果却是脑子里同时挂着更多可做、该做、也许值得做的分支。压力不是任务更难，而是未完成面的膨胀。

Mar 21, 2026

复杂退到手势后面

看 Veritasium 做巨型拉链，才重新看见里面那套互锁、导向和张力控制。很多成熟系统也是这样：越可靠，越把复杂折到一个自然动作后面。

Mar 21, 2026

工作台开始挪到聊天框里

可以从手机消息里直接控制 Claude Code session，这件事真正改变的不是远程能力，而是写代码的入口开始从 IDE 挪向聊天框。入口一换，很多默认动作也会跟着换。

Mar 19, 2026

开张

名字先定下。话也先落一点。以后慢慢写。