AI | 👨🏼‍🌾

关于AI产品和个人能力的小思考 AI

更新于 2026年7月15日 · 4 分钟

2025.8 最近一两年，用AI的方式变化得太快了。每当我指望它“一次给出完美答案”，十有八九会失望；可当我把任务拆成几步，允许它犯错、允许我随时插话校准，结果反而快。我意识到：我需要的，或许不只是“更强的模型”，而是“更好的协作方式”。 ...

Agentic Engineering III AI 软件

发布于 2026年7月30日 · 5 分钟

上一篇 Agentic Engineering II 记录了一些启发性的用法。本篇来谈点严肃的话题，是关于agent的记忆、安全的一些最新研究。当 Agent 越来越强大时（能跨会话工作、调用工具、协同分工并持续修改环境）时，记忆开始承担类似认知系统的角色，例如保存目标与约束、维护对世界的判断、为行动提供理由……包括超出人类预期的行动。 ...

运行本地AI工具 AI

发布于 2026年7月4日 · 5 分钟

最近花了1万块购置了一台95新的 Macbook Pro M2 Max 32G/1TB (2023)，看中的是32G的统一内存和400GB/s的内存带宽。在当前AI引发存储全面涨价的今天，这样的配置无疑是性价比极高的，有了运行本地AI的条件。看到The Ultimate Local AI Tier List For 2026 中以RTX5090为例测试了本地AI有能力涵盖的日常任务，结合了我自身的需求，做了初步尝试。 ...

Agentic Engineering II AI 软件

发布于 2026年5月23日 · 4 分钟

上一篇 Agentic Engineering I 主要写了一些原则性的理解，这篇继续记录Simon Willison一些启发性的实践和用法。个人最感兴趣的放在最前。让 agent 把原生工具编译到 WASM 还有一个很 inspiring 的用法：让 agent 帮你把 native tools 编译到 WebAssembly，然后做成网页工具。 ...

Agentic Engineering I AI 软件

发布于 2026年5月18日 · 6 分钟

最近读 Simon Willison 的 Agentic Engineering Patterns，颇有收获。这里先写第一部分，主要有：agent 到底是什么，代码变便宜之后人的工作还剩什么，以及我们应该怎样调整自己的开发习惯。 ...

Claude Design AI 设计

发布于 2026年5月17日 · 1 分钟

前一段时间A社推出了Claude Design，标志着 AI 编程工具进一步参与设计。虽然目前专业的工作流还是先在Figma中设计然后导出，或通过mcp导入到Coding Agent中进行编码还原，但Claude Design有这独特的价值。 ...

HTML在AI时代的复兴 AI 软件

发布于 2026年5月14日 · 4 分钟

软件不只是最终产品，也可以是过程产物。AI 让我们重新拥有了为一次性问题制作一次性软件工具的自由。 Simon Willison 最近转发并评论了 Thariq Shihipar 的一篇文章：Using Claude Code: The Unreasonable Effectiveness of HTML。Thariq 的核心判断可以概括成几句话：HTML 的信息密度更高，可读性更好，还能把文档变成交互界面，并且支持多媒体数据嵌入到一个文件中，因此更容易用一个链接分享。 ...

强化学习可能还不是AI的未来 AI 杂谈

发布于 2025年11月29日 · 10 分钟

Andrej Karpathy 和 Ilya Sutskever 几乎在同一时间，把目光从“堆算力、堆数据”的规模化竞赛，转向了更根本的问题：我们真的找到了让机器像人一样学习、反思和泛化的道路吗？当前围绕强化学习打造的 LLM，已经暴露出一系列深层缺陷：泛化能力和学习机制。如果说过去十年是“参数上亿”的工程时代，那么他们描述的，是一个重新回到研究时代的契机。 ...

用AI学AI.4 [注意力] AI

发布于 2025年8月31日 · 6 分钟

上一篇我们了解了多模态模型，它们能够处理文本、图像、音频等多种信息。但无论是处理单一模态还是多模态，现代AI模型的核心驱动力之一，就是“注意力机制”（Attention Mechanism）。本篇我们就来深入探讨这个让模型“抓住重点”的关键技术。本篇由AI起稿，人工精修。系列文章用AI学AI.1 用AI学AI.2 用AI学AI.3 用AI学AI.4 什么是注意力机制想象一下你在阅读一段文字：“在巴黎的那个雨天，我把那把红色的雨伞落在了卢浮宫的入口处。” 当被问到“丢失了什么颜色的东西？”时，你的大脑会瞬间聚焦到“红色”和“雨伞”这两个词上，而暂时忽略“巴黎”、“雨天”等其他信息。 ...

用AI学AI.3 [多模态] AI

发布于 2025年8月30日 · 4 分钟

上一篇发布已过去一年半，这段时间生成式AI进化肉眼可见：上下文长度从万级到百万级；多模态模型（文本、图像、音频、视频）；数学与编程能力大幅提升；联网搜索与检索增强（RAG）；深度思考和推理；指令遵循能力大幅提升； Agent与MCP；除语言模型外，图像、视频、3D模型、动画等生成全面应用；世界模型可生成数分钟的可交互视频；国内大模型方面，24年底横空出世的DeepSeek V3/R1用极低的训练成本跻身最强模型之列，并通过开源在极短时间内集成进各类App。8月20日V3.1发布，更是拉开了国产GPU芯片替代Nvdia GPU训练的大幕。 ...