MLX on 赛博工具站

MLX on 赛博工具站 https://haodaohang.top/tags/mlx/ Recent content in MLX on 赛博工具站赛博工具站 https://haodaohang.top/images/cover.png https://haodaohang.top/images/cover.png Hugo -- 0.152.2 zh-cn Thu, 19 Mar 2026 14:00:00 +0800 笔记本跑 397B 参数大模型？Apple LLM in a Flash 技术实战 https://haodaohang.top/posts/2026-03-19-llm-in-a-flash/ Thu, 19 Mar 2026 14:00:00 +0800 https://haodaohang.top/posts/2026-03-19-llm-in-a-flash/ 研究者成功在 48GB MacBook Pro M3 Max 上运行 Qwen3.5-397B-A17B 模型，达到 5.5+ tokens/秒。本文深度解析 Apple 'LLM in a Flash' 技术原理、MoE 架构优势，以及如何在自己的设备上复现这一突破。