
笔记本跑 397B 参数大模型?Apple LLM in a Flash 技术实战
397B 参数的大模型,在笔记本上跑起来了——而且是实时推理。 这不是标题党。研究者 Dan Woods 成功在一台 48GB 内存的 MacBook Pro M3 Max 上运行 Qwen3.5-397B-A17B 模型,实测速度达到 …

397B 参数的大模型,在笔记本上跑起来了——而且是实时推理。 这不是标题党。研究者 Dan Woods 成功在一台 48GB 内存的 MacBook Pro M3 Max 上运行 Qwen3.5-397B-A17B 模型,实测速度达到 …

“嘿 Siri,今天天气怎么样?” 你说完这句话,声音数据被上传到云端服务器,经过处理后再返回结果。整个过程不到一秒,但你知道数据去哪了吗?存储了多久?被用来训练模型了吗? Hacker News 上一个 303 点热议的帖子,让越来越多人 …

一个命令,三个 Agent,全自动完成。 这不是科幻,是 ClawTeam 带来的现实。这个来自港大实验室的项目,用"群体智能(Swarm Intelligence)“重新定义了 Agent 协作方式——不再是一个 Agent 单打独斗,而 …

你有没有遇到过这种情况:跑一个简单的网页自动化脚本,Chrome 内存直接飙到 2GB;并发十个任务,服务器直接卡死;调试一个页面加载问题,排查半天发现是浏览器扩展的锅。 传统无头浏览器就像用卡车送快递——能送达,但成本太高。2026 年 …

你的 AI Agent 能"记住"上次对话吗?能"学会"新技能吗? 如果你用过 ChatGPT 或 Claude 的 Agent 功能,一定遇到过这种尴尬:每次对话都从零开始,之前教会它的东西全都忘了。更让人头疼的是,Agent 的能力是碎 …

你有没有遇到过这样的场景:和一个 AI Agent 聊了半小时,它对你的偏好、上下文了如指掌。但第二天再打开,它又变成了"陌生人"——一切从零开始。 这就是 AI Agent 的"健忘症"。 2026年3月,字节跳动开源的 …

当你需要 AI 浏览网页、执行自动化任务时,传统浏览器太重了。 启动一个 Chromium 实例,内存占用动辄几百 MB;跑十几个并发任务,服务器直接爆满。这就是为什么 Lightpanda 的出现让开发者们如此兴奋——它用 Zig 语言从 …

如果你的 AI Agent 能"记住"上次对话中学到的技能,能像人类一样不断"成长",会发生什么? 这不是科幻。2026年3月,一个名为 Superpowers 的项目在 GitHub 上单日获得 3152+ Stars,它正在重新定义 …

三年前,你开发一个AI Agent需要什么? 自己实现上下文管理、自己对接浏览器自动化、自己设计决策流程。每个项目都是"造轮子"的工程。 今天GitHub Trending榜单揭示了新信号:Agent开发工具链正在快速标准化。火山引擎开源的 …

CEO应该是最没时间写代码的人。 管理会议、战略决策、投资人沟通……每个职责都在挤压技术实践的空间。但Shopify CEO Tobias Lütke刚刚做了一件让整个技术社区侧目的事:用AI coding agent给一个维护了20年的开 …

100万token,约75万汉字。现在,这个量级的上下文处理不再需要额外付费。 从4K到32K、128K,再到今天的1M,大模型的"记忆容量"战争打了两年。每个厂商都在卷上下文窗口,但定价策略却走向了两条路:有人把长文本做成高端增值服务,有 …

语音正在成为 AI Agent 的下一个战场。 当 GPT-5.4 可以直接理解语音输入,当 Claude 能够生成更自然的语音回复,当 OpenAI 的语音模式让对话体验逼近真人——语音不再是"锦上添花",而是 AI 交互的核心能力。 在 …