本周 AI 大事记(2026-W23 / 06-01 ~ 06-07)
本周 AI 圈 10 条最值得记住的事:GPT-5 SWE-bench 突破 80%、Claude 4 系列发布、Llama 4 重回开源、Mamba-3 长上下文新方案、欧盟 AI Act 半年观察。
DeepLab tag – tech
本周 AI 圈 10 条最值得记住的事:GPT-5 SWE-bench 突破 80%、Claude 4 系列发布、Llama 4 重回开源、Mamba-3 长上下文新方案、欧盟 AI Act 半年观察。
DeepSeek R1 是当前最值得本地部署的开源推理模型之一。本文用 Mac M3 Pro / Linux 4C8G 两套环境实测,给出从 0 到能用的最小路径。
Anthropic Claude 4 Sonnet 公测两周,我们用 12 个真实任务做横向对比。重点关注:100 万 token 检索准确率、代码能力、工具调用稳定性、定价。
Mamba 系列第三篇正式论文,引入动态内存路由与稀疏注意力混合架构,在 100 万 token 检索任务上首次击败同等规模 Transformer。