12 KiB
导览
微软与OpenAI正式分家、Anthropic提交招股书、DeepSeek计划融500亿——AI行业正在从“联盟军”转向“诸侯争霸”。
模型发布/更新
1. Grok Imagine 1.5 预览版发布
Grok Imagine 1.5 预览版即日起在 API 中上线,SpaceXAI 持续发力。X:@cb_doge ↗
2. MiniMax M3 1M token 解码加速 15.6 倍
MiniMax M3 在 1M token 下解码加速 15.6 倍,FireworksAI_HQ 提供推理支持。X:@MiniMax_AI ↗
3. Miso One 开源语音模型:8B 参数、110ms 延迟、一次语音克隆
Miso One 发布 8B 参数开源语音模型,支持一次语音克隆(短样本),推理延迟 110ms,权重已开源,可自托管,API 即将推出,演示已上线。X:@kimmonismus ↗
4. Ideogram v4.0 发布:2K 分辨率和 JSON 提示支持
Ideogram v4.0 发布,原生 2K 分辨率,文字渲染出色,支持 JSON 提示词,可在 Krea 中体验。X:@krea_ai ↗
产品与工具
5. Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线
Meta 为 WhatsApp Business 推出的 AI 智能体面向全球商家开放,按模型 token 使用量收费。TechCrunch ↗
6. NousResearch 发布 Hermes Agent 桌面应用公测版
NousResearch 推出 Hermes Agent 桌面应用公测版。X:@SiliconFlowAI ↗
7. xAI Grok 语音模型上线 Vapi 平台
xAI 的 Grok STT 和 TTS 语音模型登陆企业语音 AI 平台 Vapi,可用于构建自定义语音智能体。X:@xai ↗
8. Grok 模型登陆 Cloudflare AI Gateway
Grok 模型现已可在 Cloudflare AI Gateway 上试用。X:@xai ↗
9. OpenShell v0.0.55 发布:新增 Vertex AI 推理支持
OpenShell v0.0.55 发布,新增 Google Vertex AI 推理支持,改进策略可见性、Podman 检测和 GPU 沙箱行为。X:@NVIDIAAI ↗
10. Replit 上线 SEO Agent 助应用被发现
Replit 推出 SEO Agent,扫描应用并提供修复建议,帮助应用在网页和 AI 搜索中被发现。X:@Replit ↗
11. OpenClaw 2026.6.1 发布:新增 Windows 节点与技能工坊
OpenClaw 2026.6.1 发布,新增原生 Windows 节点主机、技能工坊和工作板编排,支持 MiniMax M3。X:@openclaw ↗
12. Reachy Mini 添加 MCP 工具
Reachy Mini 推出公开 MCP canary Space,支持远程工具调用。Hugging Face:Blog ↗
13. 刚刚,Meta Skill 来了
GitHub 热门仓库 OpenSquilla 发布,代表 Meta Skill 新动向。量子位 ↗
开发与工程
14. Qwen Cloud 全球 AI 黑客马拉松启动
首届 Qwen Cloud 全球 AI 黑客马拉松启动,5 大赛道,总奖金超 7 万美元(赛道冠军 1 万美元),Devpost 报名。X:@alibaba_cloud ↗
15. 洪水韧性新篇章:Google 开源水文建模框架
Google Research 开源基于 PyTorch 的水文建模框架,采用 Flood Hub 相同架构,允许各国气象部门在本地训练 AI 洪水预报模型。Google Research:Blog ↗
16. 文章:导致 Spark 在 Kubernetes 上 OOM 失败的两个错误配置
迁移 Spark 到 AKS 后,两个配置交互导致 OOM:spark.kubernetes.local.dirs.tmpfs 使 shuffle spill 改用 RAM 而非磁盘。InfoQ AI ↗
行业与公司
17. 微软与 OpenAI 分道扬镳——如今双方准备正面交锋
微软与 OpenAI 合作关系破裂,进入直接竞争。微软 AI 主管 Mustafa Suleyman 称微软需独立证明能力。The Verge ↗
18. 欧盟公布全面技术主权计划,推动芯片与 AI 自主发展
欧盟推出技术主权计划,扩大本土半导体、AI 和云计算供应链,减少对美亚依赖。Bloomberg ↗
19. Sensor Tower:OpenAI 旗下 ChatGPT 月活已破 10 亿,史上最快
Sensor Tower 估计 ChatGPT 月活于 2025 年 5 月突破 10 亿,增速史上最快;Claude 月活 5600 万,同比增 640%。IT之家 ↗
20. 消息称 DeepSeek 首轮融资拟筹集 500 亿元,腾讯、宁德时代等参投
DeepSeek 首轮拟融资 500 亿元,投后估值 3500-4000 亿元。创始人梁文峰出资 200 亿,腾讯拟投 100 亿,宁德时代 50 亿。IT之家 ↗
21. Suno 完成 4 亿美元 D 轮融资
Suno 完成 4 亿美元 D 轮融资,估值 54 亿美元,致力于让更多人体验音乐制作。X:@suno ↗
22. 宏利香港与阿里云达成 AI 战略合作
宏利香港与阿里云建立战略合作,共建负责任 AI 创新框架,加速 AI 部署。X:@alibaba_cloud ↗
23. 优步每月 1,500 美元的 AI 使用上限为 AI 工具定价提供参考
优步将 AI 工具月使用上限设为 1500 美元,为行业 AI 定价提供参考信号。Simon Willison ↗
24. 世界模型榜首易主!跨维智能登顶 WorldArena
跨维智能在 WorldArena 上登顶,成为世界模型新榜首。量子位 ↗
25. 刚刚,Anthropic 提交了招股书!
Anthropic 已提交招股书,预计最快 Q4 上市。量子位 ↗
论文与研究
26. 斯坦福大学法学院研究:人工智能的表现优于法学教授
斯坦福大学法学院研究显示,AI 表现优于法学教授,该结果在 Hacker News 获 104 个 Points。law.stanford.edu ↗
27. NVIDIA Research 在 CVPR 2026 发表三篇论文:规模化训练实现抓取、自动驾驶与智能体泛化
NVIDIA Research 在 CVPR 2026 发表三篇论文:零样本抓取模型 GraspGen-X、自动驾驶 LCDrive、具身智能体 NitroGen,均基于大规模训练。blogs.nvidia.com:Blog ↗
28. Anthropic 分析 832 个 AI 恶意账户:中高风险攻击者半年从 33% 跃至 56%
Anthropic 分析 832 个被封恶意账户,67.3% 使用 AI 编写恶意软件,中高风险占比半年内从 33% 升至 56%,传统威胁评估失效。Anthropic ↗
29. 微软研究:装瓶厂 AI 从聊天到决策
微软在中西部装瓶厂试点三个月显示,AI 超越聊天进入决策领域,需应对真实风险和可靠性要求。X:@MSFTResearch ↗
30. 世界模型的功能分类
World Labs 与李飞飞发文梳理“世界模型”概念,基于 POMDP 框架分类,指出当前所谓世界模型本质是同一循环的不同投影(如渲染器)。X:@drfeifei ↗
31. 从看懂世界到做对动作,卧安机器人 OneModel 1.7 用一条「隐式通路」打通了具身智能的关键断层
卧安机器人 OneModel 1.7 通过隐式通路在潜在空间完成信息传导,打通具身智能关键断层。量子位 ↗
人物与花絮
32. 黄仁勋与纳德拉共议智能体 AI 时代
黄仁勋与纳德拉在台北 MSBuild 同台,展示 NVIDIA 与微软从 Windows 到 AI 工厂的协作。X:@nvidia ↗
33. Satya Nadella 谈微软 Build 大会主旨演讲
Satya Nadella 在 Microsoft Build 主旨演讲,强调共同构建前沿智能生态系统。X:@satyanadella ↗
34. Karpathy 的 llm-wiki 项目获超五千星
@karpathy 的 llm-wiki 项目几周内获 5000+ 星,理念是让 LLM 构建并维护可持续进化的维基知识库。X:@SiliconFlowAI ↗
观点与教程
35. 智能体工程实战窍门全录
@mvanhorn 分享智能体工程方法论:人主导方向、智能体执行,核心为 plan.md 约束行为,总结 22 条实战技巧及完整工具栈。X:@shao__meng ↗
36. Anthropic 用 Claude 赋能自助数据分析
Anthropic 用 Claude 自动化 95% 业务分析查询,准确率约 95%,通过智能体分析栈解决概念-实体歧义等三大错误来源。Claude:Blog ↗
37. 超越聊天机器人的直接偏好优化
Dharma-AI 在 Hugging Face 博客发文,探讨直接偏好优化(DPO)在聊天机器人之外的广泛应用。Hugging Face:Blog ↗
38. 演讲:选择你的 AI 副驾驶:最大化开发效率
Sepehr Khosravi 探讨开发效率工具演变,评估 Cursor 和 Claude Code 等优势,为高级工程师提供可行技巧。InfoQ AI ↗
总结
强信号
-
微软与OpenAl分道扬镳,双方开始正面竞争 合作终结后,微软AI主管Mustafa Suleyman称公司必须独立证明能力,这意味着微软将不再依赖OpenAI的模型,而是全力押注自研,OpenAI也失去最大云盟友。
-
Anthropic提交招股书,预计最快Q4上市 这标志着安全派AI公司正式进入资本市场,与OpenAI争夺投资者注意,Claude的月活同比增长640%也为其估值提供了底气。
-
ChatGPT月活突破10亿,成为史上增长最快的应用 Sensor Tower数据显示ChatGPT在2025年5月达到这一里程碑,Claude月活5600万,两家头部消费级AI应用的用户粘性正在拉开差距。
中信号
-
Miso One发布8B开源语音模型,支持一次语音克隆且延迟仅110ms 权重已开放、可自托管,意味着实时语音克隆的门槛从专有API降到了个人部署,可能加速语音交互在开发者中的普及。
-
欧盟公布全面技术主权计划,推动芯片与AI自主发展 计划扩大本土半导体、AI和云计算供应链,目标减少对美亚依赖——这将对全球AI公司的合规、市场准入和数据主权产生实质影响。
待验证
-
DeepSeek首轮融资拟筹500亿元,腾讯、宁德时代参投 投后估值高达3500-4000亿元,但融资消息来源为IT之家,未见官方确认。如此大体量的AI融资在国内市场是否顺利落地,存在不确定性。
-
跨维智能登顶WorldArena世界模型榜首 WorldArena的评测权威性尚未被广泛验证,且“世界模型”概念本身缺乏统一标准,需要看后续是否有独立第三方复现其能力。