Agentic Engineering (2)
上一篇 Agentic Engineering (1) 主要写了一些原则性的理解,这篇继续记录Simon Willison一些启发性的实践和用法。个人最感兴趣的放在最前。 让 agent 把原生工具编译到 WASM 还有一个很 inspiring 的用法:让 agent 帮你把 native tools 编译到 WebAssembly,然后做成网页工具。 ...
上一篇 Agentic Engineering (1) 主要写了一些原则性的理解,这篇继续记录Simon Willison一些启发性的实践和用法。个人最感兴趣的放在最前。 让 agent 把原生工具编译到 WASM 还有一个很 inspiring 的用法:让 agent 帮你把 native tools 编译到 WebAssembly,然后做成网页工具。 ...
最近读 Simon Willison 的 Agentic Engineering Patterns,颇有收获。这里先写第一部分,主要有:agent 到底是什么,代码变便宜之后人的工作还剩什么,以及我们应该怎样调整自己的开发习惯。 ...
前一段时间A社推出了Claude Design,标志着 AI 编程工具进一步参与设计。虽然目前专业的工作流还是先在Figma中设计然后导出,或通过mcp导入到Coding Agent中进行编码还原,但Claude Design有这独特的价值。 ...
软件不只是最终产品,也可以是过程产物。AI 让我们重新拥有了为一次性问题制作一次性软件工具的自由。 Simon Willison 最近转发并评论了 Thariq Shihipar 的一篇文章:Using Claude Code: The Unreasonable Effectiveness of HTML。Thariq 的核心判断可以概括成几句话:HTML 的信息密度更高,可读性更好,还能把文档变成交互界面,并且支持多媒体数据嵌入到一个文件中,因此更容易用一个链接分享。 ...
Andrej Karpathy 和 Ilya Sutskever 几乎在同一时间,把目光从“堆算力、堆数据”的规模化竞赛,转向了更根本的问题:我们真的找到了让机器像人一样学习、反思和泛化的道路吗?当前围绕强化学习打造的 LLM,已经暴露出一系列深层缺陷:泛化能力和学习机制。如果说过去十年是“参数上亿”的工程时代,那么他们描述的,是一个重新回到研究时代的契机。 ...
上一篇我们了解了多模态模型,它们能够处理文本、图像、音频等多种信息。但无论是处理单一模态还是多模态,现代AI模型的核心驱动力之一,就是“注意力机制”(Attention Mechanism)。本篇我们就来深入探讨这个让模型“抓住重点”的关键技术。 本篇由AI起稿,人工精修。 系列文章 用AI学AI.1 用AI学AI.2 用AI学AI.3 用AI学AI.4 什么是注意力机制 想象一下你在阅读一段文字:“在巴黎的那个雨天,我把那把红色的雨伞落在了卢浮宫的入口处。” 当被问到“丢失了什么颜色的东西?”时,你的大脑会瞬间聚焦到“红色”和“雨伞”这两个词上,而暂时忽略“巴黎”、“雨天”等其他信息。 ...
上一篇发布已过去一年半,这段时间生成式AI进化肉眼可见: 上下文长度从万级到百万级; 多模态模型(文本、图像、音频、视频); 数学与编程能力大幅提升; 联网搜索与检索增强(RAG); 深度思考和推理; 指令遵循能力大幅提升; Agent与MCP; 除语言模型外,图像、视频、3D模型、动画等生成全面应用; 世界模型可生成数分钟的可交互视频; 国内大模型方面,24年底横空出世的DeepSeek V3/R1用极低的训练成本跻身最强模型之列,并通过开源在极短时间内集成进各类App。8月20日V3.1发布,更是拉开了国产GPU芯片替代Nvdia GPU训练的大幕。 ...
最近一两年,用AI的方式变化得太快了。每当我指望它“一次给出完美答案”,十有八九会失望;可当我把任务拆成几步,允许它犯错、允许我随时插话校准,结果反而稳、而且更快。这件小事让我意识到:我们真正迫切需要的,或许不只是“更强的模型”,而是“更好的协作方式”。 ...
近期看了一些大佬对AI时代软件形态的探讨,记录一些感悟。 编写软件不再只是程序员可以做的酷酷的事。 过去几十年的发展,“机器”的形态发生了巨大变化,现在,LLM本身也变成了“机器”。 ...
上一篇我们聊了AI模型的分类和大致架构,目前最火的两类模型LLM和Diffusion都基于Transformer架构训练而成,ChatGPT则是LLM家族中最出色的产品。本文就来聊聊最近出现的基于ChatGPT的创新架构和应用。由于ChatGPT的训练数据截止到2021年9月,且笔者并没有Plus会员才能使用的ChatGPT Plugin,所以这次请到的是Dr. Phind(The AI search engine for developers),大家欢迎。 系列文章 用AI学AI.1 用AI学AI.2 用AI学AI.3 用AI学AI.4 笔记 Agent如何工作 Autonomous agents (e.g., AutoGPT, BabyAGI) can auto-create tasks towards the GOAL you give them, and auto-find the way to complete task based on GPT models and other data sources (websites, your documents, etc), and even auto-improve themselves from previous mistakes. The basic structure is somehow similar to GOAP in video game’s AI design. ...