ai-daily-report/script/blog_markdown.md at 94e18ce22daf8eb6fbd7d02acec7640c94bc9a3b

ephron_ren/ai-daily-report

Fork 0

Files

Elaina 94e18ce22d init: AI日报 pipeline 完整代码 + 技能文档 + 运行记录

2026-06-04 10:38:44 +08:00

12 KiB

Raw Blame History

导览

微软与OpenAI正式分家、Anthropic提交招股书、DeepSeek计划融500亿——AI行业正在从“联盟军”转向“诸侯争霸”。

模型发布/更新

1. Grok Imagine 1.5 预览版发布

Grok Imagine 1.5 预览版即日起在 API 中上线，SpaceXAI 持续发力。X：@cb_doge ↗

2. MiniMax M3 1M token 解码加速 15.6 倍

MiniMax M3 在 1M token 下解码加速 15.6 倍，FireworksAI_HQ 提供推理支持。X：@MiniMax_AI ↗

3. Miso One 开源语音模型：8B 参数、110ms 延迟、一次语音克隆

Miso One 发布 8B 参数开源语音模型，支持一次语音克隆（短样本），推理延迟 110ms，权重已开源，可自托管，API 即将推出，演示已上线。X：@kimmonismus ↗

4. Ideogram v4.0 发布：2K 分辨率和 JSON 提示支持

Ideogram v4.0 发布，原生 2K 分辨率，文字渲染出色，支持 JSON 提示词，可在 Krea 中体验。X：@krea_ai ↗

产品与工具

5. Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线

Meta 为 WhatsApp Business 推出的 AI 智能体面向全球商家开放，按模型 token 使用量收费。TechCrunch ↗

6. NousResearch 发布 Hermes Agent 桌面应用公测版

NousResearch 推出 Hermes Agent 桌面应用公测版。X：@SiliconFlowAI ↗

7. xAI Grok 语音模型上线 Vapi 平台

xAI 的 Grok STT 和 TTS 语音模型登陆企业语音 AI 平台 Vapi，可用于构建自定义语音智能体。X：@xai ↗

8. Grok 模型登陆 Cloudflare AI Gateway

Grok 模型现已可在 Cloudflare AI Gateway 上试用。X：@xai ↗

9. OpenShell v0.0.55 发布：新增 Vertex AI 推理支持

OpenShell v0.0.55 发布，新增 Google Vertex AI 推理支持，改进策略可见性、Podman 检测和 GPU 沙箱行为。X：@NVIDIAAI ↗

10. Replit 上线 SEO Agent 助应用被发现

Replit 推出 SEO Agent，扫描应用并提供修复建议，帮助应用在网页和 AI 搜索中被发现。X：@Replit ↗

11. OpenClaw 2026.6.1 发布：新增 Windows 节点与技能工坊

OpenClaw 2026.6.1 发布，新增原生 Windows 节点主机、技能工坊和工作板编排，支持 MiniMax M3。X：@openclaw ↗

12. Reachy Mini 添加 MCP 工具

Reachy Mini 推出公开 MCP canary Space，支持远程工具调用。Hugging Face：Blog ↗

13. 刚刚，Meta Skill 来了

GitHub 热门仓库 OpenSquilla 发布，代表 Meta Skill 新动向。量子位 ↗

开发与工程

14. Qwen Cloud 全球 AI 黑客马拉松启动

首届 Qwen Cloud 全球 AI 黑客马拉松启动，5 大赛道，总奖金超 7 万美元（赛道冠军 1 万美元），Devpost 报名。X：@alibaba_cloud ↗

15. 洪水韧性新篇章：Google 开源水文建模框架

Google Research 开源基于 PyTorch 的水文建模框架，采用 Flood Hub 相同架构，允许各国气象部门在本地训练 AI 洪水预报模型。Google Research：Blog ↗

16. 文章：导致 Spark 在 Kubernetes 上 OOM 失败的两个错误配置

迁移 Spark 到 AKS 后，两个配置交互导致 OOM：spark.kubernetes.local.dirs.tmpfs 使 shuffle spill 改用 RAM 而非磁盘。InfoQ AI ↗

行业与公司

17. 微软与 OpenAI 分道扬镳——如今双方准备正面交锋

微软与 OpenAI 合作关系破裂，进入直接竞争。微软 AI 主管 Mustafa Suleyman 称微软需独立证明能力。The Verge ↗

18. 欧盟公布全面技术主权计划，推动芯片与 AI 自主发展

欧盟推出技术主权计划，扩大本土半导体、AI 和云计算供应链，减少对美亚依赖。Bloomberg ↗

19. Sensor Tower：OpenAI 旗下 ChatGPT 月活已破 10 亿，史上最快

Sensor Tower 估计 ChatGPT 月活于 2025 年 5 月突破 10 亿，增速史上最快；Claude 月活 5600 万，同比增 640%。IT之家 ↗

20. 消息称 DeepSeek 首轮融资拟筹集 500 亿元，腾讯、宁德时代等参投

DeepSeek 首轮拟融资 500 亿元，投后估值 3500-4000 亿元。创始人梁文峰出资 200 亿，腾讯拟投 100 亿，宁德时代 50 亿。IT之家 ↗

21. Suno 完成 4 亿美元 D 轮融资

Suno 完成 4 亿美元 D 轮融资，估值 54 亿美元，致力于让更多人体验音乐制作。X：@suno ↗

22. 宏利香港与阿里云达成 AI 战略合作

宏利香港与阿里云建立战略合作，共建负责任 AI 创新框架，加速 AI 部署。X：@alibaba_cloud ↗

23. 优步每月 1,500 美元的 AI 使用上限为 AI 工具定价提供参考

优步将 AI 工具月使用上限设为 1500 美元，为行业 AI 定价提供参考信号。Simon Willison ↗

24. 世界模型榜首易主！跨维智能登顶 WorldArena

跨维智能在 WorldArena 上登顶，成为世界模型新榜首。量子位 ↗

25. 刚刚，Anthropic 提交了招股书！

Anthropic 已提交招股书，预计最快 Q4 上市。量子位 ↗

论文与研究

26. 斯坦福大学法学院研究：人工智能的表现优于法学教授

斯坦福大学法学院研究显示，AI 表现优于法学教授，该结果在 Hacker News 获 104 个 Points。law.stanford.edu ↗

27. NVIDIA Research 在 CVPR 2026 发表三篇论文：规模化训练实现抓取、自动驾驶与智能体泛化

NVIDIA Research 在 CVPR 2026 发表三篇论文：零样本抓取模型 GraspGen-X、自动驾驶 LCDrive、具身智能体 NitroGen，均基于大规模训练。blogs.nvidia.com：Blog ↗

28. Anthropic 分析 832 个 AI 恶意账户：中高风险攻击者半年从 33% 跃至 56%

Anthropic 分析 832 个被封恶意账户，67.3% 使用 AI 编写恶意软件，中高风险占比半年内从 33% 升至 56%，传统威胁评估失效。Anthropic ↗

29. 微软研究：装瓶厂 AI 从聊天到决策

微软在中西部装瓶厂试点三个月显示，AI 超越聊天进入决策领域，需应对真实风险和可靠性要求。X：@MSFTResearch ↗

30. 世界模型的功能分类

World Labs 与李飞飞发文梳理“世界模型”概念，基于 POMDP 框架分类，指出当前所谓世界模型本质是同一循环的不同投影（如渲染器）。X：@drfeifei ↗

31. 从看懂世界到做对动作，卧安机器人 OneModel 1.7 用一条「隐式通路」打通了具身智能的关键断层

卧安机器人 OneModel 1.7 通过隐式通路在潜在空间完成信息传导，打通具身智能关键断层。量子位 ↗

人物与花絮

32. 黄仁勋与纳德拉共议智能体 AI 时代

黄仁勋与纳德拉在台北 MSBuild 同台，展示 NVIDIA 与微软从 Windows 到 AI 工厂的协作。X：@nvidia ↗

33. Satya Nadella 谈微软 Build 大会主旨演讲

Satya Nadella 在 Microsoft Build 主旨演讲，强调共同构建前沿智能生态系统。X：@satyanadella ↗

34. Karpathy 的 llm-wiki 项目获超五千星

@karpathy 的 llm-wiki 项目几周内获 5000+ 星，理念是让 LLM 构建并维护可持续进化的维基知识库。X：@SiliconFlowAI ↗

观点与教程

35. 智能体工程实战窍门全录

@mvanhorn 分享智能体工程方法论：人主导方向、智能体执行，核心为 plan.md 约束行为，总结 22 条实战技巧及完整工具栈。X：@shao__meng ↗

36. Anthropic 用 Claude 赋能自助数据分析

Anthropic 用 Claude 自动化 95% 业务分析查询，准确率约 95%，通过智能体分析栈解决概念-实体歧义等三大错误来源。Claude：Blog ↗

37. 超越聊天机器人的直接偏好优化

Dharma-AI 在 Hugging Face 博客发文，探讨直接偏好优化（DPO）在聊天机器人之外的广泛应用。Hugging Face：Blog ↗

38. 演讲：选择你的 AI 副驾驶：最大化开发效率

Sepehr Khosravi 探讨开发效率工具演变，评估 Cursor 和 Claude Code 等优势，为高级工程师提供可行技巧。InfoQ AI ↗

总结

强信号

微软与OpenAl分道扬镳，双方开始正面竞争 合作终结后，微软AI主管Mustafa Suleyman称公司必须独立证明能力，这意味着微软将不再依赖OpenAI的模型，而是全力押注自研，OpenAI也失去最大云盟友。
Anthropic提交招股书，预计最快Q4上市 这标志着安全派AI公司正式进入资本市场，与OpenAI争夺投资者注意，Claude的月活同比增长640%也为其估值提供了底气。
ChatGPT月活突破10亿，成为史上增长最快的应用 Sensor Tower数据显示ChatGPT在2025年5月达到这一里程碑，Claude月活5600万，两家头部消费级AI应用的用户粘性正在拉开差距。

中信号

Miso One发布8B开源语音模型，支持一次语音克隆且延迟仅110ms 权重已开放、可自托管，意味着实时语音克隆的门槛从专有API降到了个人部署，可能加速语音交互在开发者中的普及。
欧盟公布全面技术主权计划，推动芯片与AI自主发展 计划扩大本土半导体、AI和云计算供应链，目标减少对美亚依赖——这将对全球AI公司的合规、市场准入和数据主权产生实质影响。

待验证

DeepSeek首轮融资拟筹500亿元，腾讯、宁德时代参投 投后估值高达3500-4000亿元，但融资消息来源为IT之家，未见官方确认。如此大体量的AI融资在国内市场是否顺利落地，存在不确定性。
跨维智能登顶WorldArena世界模型榜首 WorldArena的评测权威性尚未被广泛验证，且“世界模型”概念本身缺乏统一标准，需要看后续是否有独立第三方复现其能力。

12 KiB Raw Blame History Unescape Escape

导览