PPS’s Garden

播撒几粒想法 | 浇灌几株启发 | 除掉几只BUG | 角落开满鲜花

强化学习可能不是AI的未来

最近,Andrej Karpathy 和 Ilya Sutskever 几乎在同一时间,把目光从“堆算力、堆数据”的规模化竞赛,转向了更根本的问题:我们真的找到了让机器像人一样学习、反思和泛化的道路吗?在他们的讨论里,当前围绕强化学习(RL)打造的 LLM 智能,远没有表面上的那样风光,反而暴露出一系列深层缺陷——尤其是在泛化能力和学习机制上。如果说过去十年是“参数上亿、卡片上万”的工程时代,那么他们描述的,是一个重新回到“研究时代”的拐点。 ...

用AI学AI.4 [注意力]

上一篇我们了解了多模态模型,它们能够处理文本、图像、音频等多种信息。但无论是处理单一模态还是多模态,现代AI模型的核心驱动力之一,就是“注意力机制”(Attention Mechanism)。本篇我们就来深入探讨这个让模型“抓住重点”的关键技术。 本篇由AI起稿,人工精修。 系列文章 用AI学AI.1 用AI学AI.2 用AI学AI.3 用AI学AI.4 什么是注意力机制 想象一下你在阅读一段文字:“在巴黎的那个雨天,我把那把红色的雨伞落在了卢浮宫的入口处。” 当被问到“丢失了什么颜色的东西?”时,你的大脑会瞬间聚焦到“红色”和“雨伞”这两个词上,而暂时忽略“巴黎”、“雨天”等其他信息。 ...

用AI学AI.3 [多模态]

上一篇发布已过去一年半,这段时间生成式AI进化肉眼可见: 上下文长度从万级到百万级; 多模态模型(文本、图像、音频、视频); 数学与编程能力大幅提升; 联网搜索与检索增强(RAG); 深度思考和推理; 指令遵循能力大幅提升; Agent与MCP; 除语言模型外,图像、视频、3D模型、动画等生成全面应用; 世界模型可生成数分钟的可交互视频; 国内大模型方面,24年底横空出世的DeepSeek V3/R1用极低的训练成本跻身最强模型之列,并通过开源在极短时间内集成进各类App。8月20日V3.1发布,更是拉开了国产GPU芯片替代Nvdia GPU训练的大幕。 ...

实现Quaternion.FromToRotation的细节

这篇记录实际项目中对Quaternion.FromToRotation(fromVector, toVector) 的实现思路,重点讨论当 fromVector 与 toVector 夹角为 180°(反向)时的稳健处理。主要参考 Stan Melax 的“最短弧四元数”(Shortest Arc Quaternion)思路。 ...

奇妙的Pairing Function及实际用途

在实际项目里,我们经常需要把二维坐标 (x, y)、或两个整型键合成一个“唯一”的整型键,方便做哈希表/数组索引;又希望能在需要时还原回原来的两个键。这样一个反直觉的需求真的有解决方案吗?“配对函数”(Pairing Function)隆重登场。 ...

关于使用AI的小思考

最近一两年,用AI的方式变化得太快了。每当我指望它“一次给出完美答案”,十有八九会失望;可当我把任务拆成几步,允许它犯错、允许我随时插话校准,结果反而稳、而且更快。这件小事让我意识到:我们真正迫切需要的,或许不只是“更强的模型”,而是“更好的协作方式”。 ...

软件的未来

近期看了一些大佬对AI时代软件形态的探讨,记录一些感悟。 编写软件不再只是程序员可以做的酷酷的事。 过去几十年的发展,“机器”的形态发生了巨大变化,现在,LLM本身也变成了“机器”。 ...

Thinking of Quality Design

🍎本文源自对Apple WWDC 2018 的一次公开分享的记录提炼。什么是优秀的设计,它为什么重要,如何追求品质感……这些话题不仅是设计师需要考虑的专业问题,也是每个人打造自己的生活需要知道的内在规律。Video ...

WebGL平台的性能限制和解决方案(以微信小游戏为例)

前几日参加了Unite上海2024,受益颇多。本篇先就相对感兴趣的小游戏平台WebGL技术方案为引子,引出一些关于WebAssembly, IL2CPP, 以及.NET 8对Web平台支持等话题。 ...

带物理交互的CharacterController设计与实现

本文也是PhysX物理引擎系列的番外篇。介绍了笔者基于CharacterController(CCT)设计的一个新的角色控制器,在修补Unity/PhysX的CCT的缺陷外,还增添了若干和物理交互相关的有趣特性。代码已经过实际项目验证,这里仅保留和具体业务无关的部分。 背景和需求 前文结尾处提到一些PhysX自带的CCT(Unity也是基于此二次封装出CharacterController组件)在实际游戏开发中的缺点,这里再次总结: CCT不参与碰撞系统的检测。仅当CCT自身移动时会判断是否被其他刚体或CCT阻挡。这就造成一个BUG:CCT自身静止时,其他运动物体会穿过CCT且没有事件触发。官方论坛上有苦主持续8年向Unity反馈这个问题但无法解决,目前已知的唯一绕过方式是每帧给CCT附加一个微小的位移(下文中的SlightMove)。 Unity提供的接口CharacterController.isGrounded效果很不稳定。其内部只是判断CCT上次运动后底部是否触碰物体。即collisionFlags & eCOLLISION_DOWN::eCOLLISION_DOWN。但在上下坡或崎岖地形时,很容易出现侧面触碰或短暂浮空。如果用该接口驱动动画表现甚至跑跳逻辑,效果很差。需要自行基于SceneQuery封装出更加稳定的判定着地的函数。 Unity没有暴露CCT.upVector,角色总是竖直向上的。要实现反重力鞋在任意斜面上行走或像马里奥银河那样在曲面上跑跳穿梭,只能放弃使用CCT但也放弃了其在操作手感上的改善。其实拿到Unity的源码后,只用了十分钟将底层字段暴露到C#层就解决了该问题。 新的角色控制器需要增加的物理交互特性有: ...