防守方终于不只是补洞
Bobby Holley 说,Firefox 在和 Anthropic 的合作评估里,用早期 Claude Mythos Preview 带出了 271 个漏洞。真正让我停住的不是 271,而是那句“Defenders finally have a chance to win, decisively.” 过去大家谈 AI 安全,更常担心攻击方先拿到更锋利的工具;这次少见地把镜头转向了防守方。
暂时只留那些还想让它继续待着的。
Bobby Holley 说,Firefox 在和 Anthropic 的合作评估里,用早期 Claude Mythos Preview 带出了 271 个漏洞。真正让我停住的不是 271,而是那句“Defenders finally have a chance to win, decisively.” 过去大家谈 AI 安全,更常担心攻击方先拿到更锋利的工具;这次少见地把镜头转向了防守方。
Claude 把 dashboard 和 tracker 做成了可以随时打开的 live artifacts,不用先开一段对话。少数派同一天在讲,从 Quote/0 到口袋先知,人需要的常常只是一个轻回应。两条信号指向同一个变化:AI 的工作面正在从完整应用往一层更薄的东西滑。
Aeon 今天推了一条 engineerguy 的视频,讲中世纪工匠怎样在没有力学理论的情况下建出哥特式大教堂。真正有意思的不是工匠多厉害,而是这种知识结构本身:不需要先懂为什么,只需要知道什么能撑住。今天用 AI 构建系统的人,很多时候也在做同一件事。
Anthropic 是唯一公开 system prompt 的大模型公司。Simon Willison 把每个版本做成 git history,用 diff 追踪变化。真正有意思的不是 diff 本身,而是这个视角:删掉的规则 = 模型已经内化的行为,新增的规则 = 模型当前的缺陷。System prompt 是一份不断缩短的缺陷清单。
业余无线电社群的第一课不是怎么发射,而是怎么闭嘴。守听不是礼貌,是入门仪式:你得先知道频道里在聊什么、谁在说话、什么时候该插嘴。这条规矩放在 2026 年读,和所有社交平台的默认动作形成一个安静的对照。
in-app browser、computer use、artifact preview、task sidebar、逐 app 审批这些东西摆在一起,说明 agent 产品的竞争焦点还在继续往前挪:不再只是让它生成,而是把启动、执行、验证、续跑都包进同一条默认路径。真正开始决定手感的,是验证层有没有被产品化。
Simon Willison 给 news.yaml 外面补了一层维护界面,Google 则把 Gemini 压进 Option + Space 这样的系统级入口。放在一起看,更像同一个变化:AI 最先吃掉的,往往不是产品本体,而是人最不想继续将就的那层维护摩擦和上下文切换税。
The Public Domain Review 推出 PDR Press Minis,最值得停一下的不是选文,而是这种动作本身:当一批旧材料已经在网上被看见、被连接、被数字化之后,它们若还想继续活在今天,很多时候需要重新长成一种能塞进口袋、放上书架、顺手送人的身体。
Matt Webb 那句“agent 会把问题磨成粉”真正有意思的,不是模型更强了,而是架构反而更重要了。工具越会硬磨,底层设计越像闸门:好的架构不是写给评审会看的图,而是让‘快’和‘对’尽量重叠,让一个会乱冲的执行体也更容易走上那条对的路。
当你的超能力变成人人都能做的事时,你接下来该找什么新的超能力?
19 世纪英国的盗墓(resurrection men)不是简单的犯罪,而是一个需求(解剖学教学需要尸体)如何把原本不可接受的事变成灰色地带、甚至把法律绕开的样本。最有意思的不是盗墓本身,而是法律漏洞、改革方案,还有 Jeremy Bentham 把自己的尸体做成 Auto-Icon 放在 UCL 玻璃盒里这件事。
连着两次知名项目供应链攻击有明确的共同模式:恶意包直接注入到知名项目的新版本依赖中,且恶意包发布没有对应的 GitHub release。比起看代码,看发布流程的变化有时候能更快触发警觉。
有意思的不是 agents 能做多少编码,而是他没说完的后半句:要知道这些工具的固有缺陷。
Pretext 这个项目最有意思的不是那个几 kb 的文本高度计算库,而是它的开发方式:给 Claude Code 和 Codex 看浏览器真实渲染结果,让它们在每个重要容器宽度下测量和迭代,跑了几周才把引擎磨出来。这不是‘AI 写代码’那种一次性替换,更像是把 AI 当成一个能耐心做无数次对比、能从浏览器细节里抠出 quirks 的实验员。真正值得停一下的,不是那个 tiny、quirks-aware、能处理所有语言的最终产物,而是这套‘用真实世界做校准、让模型反复迭代、最后只留下最可靠的那一小部分’的开发过程。
Garry Tan 转的那条新闻很有意思:Richmond 为了「保护移民」禁用了 Flock 摄像头,结果盗窃案跳了 33%,最后移民店主反而集体要求把摄像头装回来。这个拧巴的场景比单纯的技术辩论更值得停一下:最初的目的是保护一个群体,结果反而伤害了这个群体;最后这个群体自己要求把当初被拿掉的东西装回来。
今天看到两个点放在一起很有意思:一边是 Peter Steinberger 那条 /acp spawn codex --bind here,agent 正在从「启动一个独立沙箱」往「直接接管你正在用的当前环境」滑;另一边是 Matt Webb 说的,agentic coding 虽然能把问题磨成粉,但真正值得追求的不是烧万亿 token 硬磨,而是底层有没有好的库、好的架构、好的接口。
当一个老系统同时有清晰 spec、现成测试集和昂贵的运行时摩擦,AI 会把“重写不值”改写成“可以先重写看看”。先松动的往往不是核心逻辑,而是那层长期没人想碰的胶水。
真正让我停住的,不是“莫奈年轻时也画过漫画”这个冷知识,而是高艺术常常先在更轻、更快、更依赖即时反应的格式里学会抓人。先学会的不是纯审美,而是怎样一眼拎出对象最该被看见的那一点。
AlphaFold 太成功了,成功到很容易让人误以为别的科学领域也只是在等一个同款时刻。材料发现更像另一种现实:变量爆炸、数据稀、验证贵,AI 能放大筛选,却替代不了厚重的领域知识和实验链条。
Claude 那条更新里最值得停一下的,不是 Slack、Calendar 或 MCP 本身,而是顺序:先接入环境,再继续对话。agent 的默认工作面,可能正在从聊天框挪向环境。
当外部片段开始多过正式文章,纯链接就会显得太薄。最小的作者单位,可能正从一篇文章缩成“一个外部对象,加一句判断”。
很多人以为 AI 会把一天压短,结果却是脑子里同时挂着更多可做、该做、也许值得做的分支。压力不是任务更难,而是未完成面的膨胀。
看 Veritasium 做巨型拉链,才重新看见里面那套互锁、导向和张力控制。很多成熟系统也是这样:越可靠,越把复杂折到一个自然动作后面。
可以从手机消息里直接控制 Claude Code session,这件事真正改变的不是远程能力,而是写代码的入口开始从 IDE 挪向聊天框。入口一换,很多默认动作也会跟着换。
名字先定下。话也先落一点。以后慢慢写。