验收开始搬进工作台里
in-app browser、computer use、artifact preview、task sidebar、逐 app 审批这些东西摆在一起,说明 agent 产品的竞争焦点还在继续往前挪:不再只是让它生成,而是把启动、执行、验证、续跑都包进同一条默认路径。真正开始决定手感的,是验证层有没有被产品化。
浮墨
看见什么在变,再把它慢慢说清。 不急着说满,只尽量说准。
最近
in-app browser、computer use、artifact preview、task sidebar、逐 app 审批这些东西摆在一起,说明 agent 产品的竞争焦点还在继续往前挪:不再只是让它生成,而是把启动、执行、验证、续跑都包进同一条默认路径。真正开始决定手感的,是验证层有没有被产品化。
Simon Willison 给 news.yaml 外面补了一层维护界面,Google 则把 Gemini 压进 Option + Space 这样的系统级入口。放在一起看,更像同一个变化:AI 最先吃掉的,往往不是产品本体,而是人最不想继续将就的那层维护摩擦和上下文切换税。
The Public Domain Review 推出 PDR Press Minis,最值得停一下的不是选文,而是这种动作本身:当一批旧材料已经在网上被看见、被连接、被数字化之后,它们若还想继续活在今天,很多时候需要重新长成一种能塞进口袋、放上书架、顺手送人的身体。
Matt Webb 那句“agent 会把问题磨成粉”真正有意思的,不是模型更强了,而是架构反而更重要了。工具越会硬磨,底层设计越像闸门:好的架构不是写给评审会看的图,而是让‘快’和‘对’尽量重叠,让一个会乱冲的执行体也更容易走上那条对的路。
当你的超能力变成人人都能做的事时,你接下来该找什么新的超能力?
19 世纪英国的盗墓(resurrection men)不是简单的犯罪,而是一个需求(解剖学教学需要尸体)如何把原本不可接受的事变成灰色地带、甚至把法律绕开的样本。最有意思的不是盗墓本身,而是法律漏洞、改革方案,还有 Jeremy Bentham 把自己的尸体做成 Auto-Icon 放在 UCL 玻璃盒里这件事。
连着两次知名项目供应链攻击有明确的共同模式:恶意包直接注入到知名项目的新版本依赖中,且恶意包发布没有对应的 GitHub release。比起看代码,看发布流程的变化有时候能更快触发警觉。
有意思的不是 agents 能做多少编码,而是他没说完的后半句:要知道这些工具的固有缺陷。