init: AI日报 pipeline 完整代码 + 技能文档 + 运行记录

This commit is contained in:
2026-06-04 10:38:44 +08:00
commit 94e18ce22d
10 changed files with 1728 additions and 0 deletions

File diff suppressed because it is too large Load Diff

198
script/blog_markdown.md Normal file
View File

@@ -0,0 +1,198 @@
## 导览
> > 微软与OpenAI正式分家、Anthropic提交招股书、DeepSeek计划融500亿——AI行业正在从“联盟军”转向“诸侯争霸”。
## 模型发布/更新
**1. Grok Imagine 1.5 预览版发布**
> Grok Imagine 1.5 预览版即日起在 API 中上线SpaceXAI 持续发力。[X@cb_doge ↗](https://x.com/cb_doge/status/2062242490745594085)
**2. MiniMax M3 1M token 解码加速 15.6 倍**
> MiniMax M3 在 1M token 下解码加速 15.6 倍FireworksAI_HQ 提供推理支持。[X@MiniMax_AI ↗](https://x.com/MiniMax_AI/status/2062316914618388758)
**3. Miso One 开源语音模型8B 参数、110ms 延迟、一次语音克隆**
> Miso One 发布 8B 参数开源语音模型,支持一次语音克隆(短样本),推理延迟 110ms权重已开源可自托管API 即将推出,演示已上线。[X@kimmonismus ↗](https://x.com/kimmonismus/status/2062210845308780639)
**4. Ideogram v4.0 发布2K 分辨率和 JSON 提示支持**
> Ideogram v4.0 发布,原生 2K 分辨率,文字渲染出色,支持 JSON 提示词,可在 Krea 中体验。[X@krea_ai ↗](https://x.com/krea_ai/status/2062227837130887567)
## 产品与工具
**5. Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线**
> Meta 为 WhatsApp Business 推出的 AI 智能体面向全球商家开放,按模型 token 使用量收费。[TechCrunch ↗](https://techcrunch.com/2026/06/03/metas-ai-agent-for-whatsapp-business-is-now-available-globally)
**6. NousResearch 发布 Hermes Agent 桌面应用公测版**
> NousResearch 推出 Hermes Agent 桌面应用公测版。[X@SiliconFlowAI ↗](https://x.com/SiliconFlowAI/status/2062042813852995899)
**7. xAI Grok 语音模型上线 Vapi 平台**
> xAI 的 Grok STT 和 TTS 语音模型登陆企业语音 AI 平台 Vapi可用于构建自定义语音智能体。[X@xai ↗](https://x.com/xai/status/2062209374039499178)
**8. Grok 模型登陆 Cloudflare AI Gateway**
> Grok 模型现已可在 Cloudflare AI Gateway 上试用。[X@xai ↗](https://x.com/xai/status/2062294202625696081)
**9. OpenShell v0.0.55 发布:新增 Vertex AI 推理支持**
> OpenShell v0.0.55 发布,新增 Google Vertex AI 推理支持改进策略可见性、Podman 检测和 GPU 沙箱行为。[X@NVIDIAAI ↗](https://x.com/NVIDIAAI/status/2062210034109677665)
**10. Replit 上线 SEO Agent 助应用被发现**
> Replit 推出 SEO Agent扫描应用并提供修复建议帮助应用在网页和 AI 搜索中被发现。[X@Replit ↗](https://x.com/Replit/status/2062211976995188871)
**11. OpenClaw 2026.6.1 发布:新增 Windows 节点与技能工坊**
> OpenClaw 2026.6.1 发布,新增原生 Windows 节点主机、技能工坊和工作板编排,支持 MiniMax M3。[X@openclaw ↗](https://x.com/openclaw/status/2062288421406785710)
**12. Reachy Mini 添加 MCP 工具**
> Reachy Mini 推出公开 MCP canary Space支持远程工具调用。[Hugging FaceBlog ↗](https://huggingface.co/blog/adding-mcp-tools-to-reachy-mini)
**13. 刚刚Meta Skill 来了**
> GitHub 热门仓库 OpenSquilla 发布,代表 Meta Skill 新动向。[量子位 ↗](https://www.qbitai.com/2026/06/428335.html)
## 开发与工程
**14. Qwen Cloud 全球 AI 黑客马拉松启动**
> 首届 Qwen Cloud 全球 AI 黑客马拉松启动5 大赛道,总奖金超 7 万美元(赛道冠军 1 万美元Devpost 报名。[X@alibaba_cloud ↗](https://x.com/alibaba_cloud/status/2062113338994172169)
**15. 洪水韧性新篇章Google 开源水文建模框架**
> Google Research 开源基于 PyTorch 的水文建模框架,采用 Flood Hub 相同架构,允许各国气象部门在本地训练 AI 洪水预报模型。[Google ResearchBlog ↗](https://research.google/blog/the-next-chapter-in-flood-resilience-open-sourcing-googles-hydrology-framework)
**16. 文章:导致 Spark 在 Kubernetes 上 OOM 失败的两个错误配置**
> 迁移 Spark 到 AKS 后,两个配置交互导致 OOMspark.kubernetes.local.dirs.tmpfs 使 shuffle spill 改用 RAM 而非磁盘。[InfoQ AI ↗](https://www.infoq.com/articles/spark-oom-kubernetes-misconfigurations/?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=AI%2C+ML+%26+Data+Engineering)
## 行业与公司
**17. 微软与 OpenAI 分道扬镳——如今双方准备正面交锋**
> 微软与 OpenAI 合作关系破裂,进入直接竞争。微软 AI 主管 Mustafa Suleyman 称微软需独立证明能力。[The Verge ↗](https://www.theverge.com/ai-artificial-intelligence/942242/microsoft-build-ai-agents-openai-competition)
**18. 欧盟公布全面技术主权计划,推动芯片与 AI 自主发展**
> 欧盟推出技术主权计划扩大本土半导体、AI 和云计算供应链,减少对美亚依赖。[Bloomberg ↗](https://www.bloomberg.com/news/articles/2026-06-03/europe-unveils-sweeping-tech-sovereignty-plan-to-boost-chips-ai)
**19. Sensor TowerOpenAI 旗下 ChatGPT 月活已破 10 亿,史上最快**
> Sensor Tower 估计 ChatGPT 月活于 2025 年 5 月突破 10 亿增速史上最快Claude 月活 5600 万,同比增 640%。[IT之家 ↗](https://www.ithome.com/0/959/083.htm)
**20. 消息称 DeepSeek 首轮融资拟筹集 500 亿元,腾讯、宁德时代等参投**
> DeepSeek 首轮拟融资 500 亿元,投后估值 3500-4000 亿元。创始人梁文峰出资 200 亿,腾讯拟投 100 亿,宁德时代 50 亿。[IT之家 ↗](https://www.ithome.com/0/959/249.htm)
**21. Suno 完成 4 亿美元 D 轮融资**
> Suno 完成 4 亿美元 D 轮融资,估值 54 亿美元,致力于让更多人体验音乐制作。[X@suno ↗](https://x.com/suno/status/2062183524887675243)
**22. 宏利香港与阿里云达成 AI 战略合作**
> 宏利香港与阿里云建立战略合作,共建负责任 AI 创新框架,加速 AI 部署。[X@alibaba_cloud ↗](https://x.com/alibaba_cloud/status/2062006591377829922)
**23. 优步每月 1,500 美元的 AI 使用上限为 AI 工具定价提供参考**
> 优步将 AI 工具月使用上限设为 1500 美元,为行业 AI 定价提供参考信号。[Simon Willison ↗](https://simonwillison.net/2026/Jun/3/uber-caps-usage)
**24. 世界模型榜首易主!跨维智能登顶 WorldArena**
> 跨维智能在 WorldArena 上登顶,成为世界模型新榜首。[量子位 ↗](https://www.qbitai.com/2026/06/428435.html)
**25. 刚刚Anthropic 提交了招股书!**
> Anthropic 已提交招股书,预计最快 Q4 上市。[量子位 ↗](https://www.qbitai.com/2026/06/428407.html)
## 论文与研究
**26. 斯坦福大学法学院研究:人工智能的表现优于法学教授**
> 斯坦福大学法学院研究显示AI 表现优于法学教授,该结果在 Hacker News 获 104 个 Points。[law.stanford.edu ↗](https://law.stanford.edu/press/ai-outperforms-law-professors-in-stanford-law-study)
**27. NVIDIA Research 在 CVPR 2026 发表三篇论文:规模化训练实现抓取、自动驾驶与智能体泛化**
> NVIDIA Research 在 CVPR 2026 发表三篇论文:零样本抓取模型 GraspGen-X、自动驾驶 LCDrive、具身智能体 NitroGen均基于大规模训练。[blogs.nvidia.comBlog ↗](https://blogs.nvidia.com/blog/cvpr-research-grasping-driving-agent-training)
**28. Anthropic 分析 832 个 AI 恶意账户:中高风险攻击者半年从 33% 跃至 56%**
> Anthropic 分析 832 个被封恶意账户67.3% 使用 AI 编写恶意软件,中高风险占比半年内从 33% 升至 56%,传统威胁评估失效。[Anthropic ↗](https://www.anthropic.com/news/AI-enabled-cyber-threats-mitre-attack)
**29. 微软研究:装瓶厂 AI 从聊天到决策**
> 微软在中西部装瓶厂试点三个月显示AI 超越聊天进入决策领域,需应对真实风险和可靠性要求。[X@MSFTResearch ↗](https://x.com/MSFTResearch/status/2062204914223169635)
**30. 世界模型的功能分类**
> World Labs 与李飞飞发文梳理“世界模型”概念,基于 POMDP 框架分类,指出当前所谓世界模型本质是同一循环的不同投影(如渲染器)。[X@drfeifei ↗](https://x.com/drfeifei/status/2062247238143996275)
**31. 从看懂世界到做对动作,卧安机器人 OneModel 1.7 用一条「隐式通路」打通了具身智能的关键断层**
> 卧安机器人 OneModel 1.7 通过隐式通路在潜在空间完成信息传导,打通具身智能关键断层。[量子位 ↗](https://www.qbitai.com/2026/06/428703.html)
## 人物与花絮
**32. 黄仁勋与纳德拉共议智能体 AI 时代**
> 黄仁勋与纳德拉在台北 MSBuild 同台,展示 NVIDIA 与微软从 Windows 到 AI 工厂的协作。[X@nvidia ↗](https://x.com/nvidia/status/2062228974273716457)
**33. Satya Nadella 谈微软 Build 大会主旨演讲**
> Satya Nadella 在 Microsoft Build 主旨演讲,强调共同构建前沿智能生态系统。[X@satyanadella ↗](https://x.com/satyanadella/status/2062022060176801826)
**34. Karpathy 的 llm-wiki 项目获超五千星**
> @karpathy 的 llm-wiki 项目几周内获 5000+ 星,理念是让 LLM 构建并维护可持续进化的维基知识库。[X@SiliconFlowAI ↗](https://x.com/SiliconFlowAI/status/2062054848762450324)
## 观点与教程
**35. 智能体工程实战窍门全录**
> @mvanhorn 分享智能体工程方法论:人主导方向、智能体执行,核心为 plan.md 约束行为,总结 22 条实战技巧及完整工具栈。[X@shao__meng ↗](https://x.com/shao__meng/status/2061974983094755575)
**36. Anthropic 用 Claude 赋能自助数据分析**
> Anthropic 用 Claude 自动化 95% 业务分析查询,准确率约 95%,通过智能体分析栈解决概念-实体歧义等三大错误来源。[ClaudeBlog ↗](https://claude.com/blog/how-anthropic-enables-self-service-data-analytics-with-claude)
**37. 超越聊天机器人的直接偏好优化**
> Dharma-AI 在 Hugging Face 博客发文探讨直接偏好优化DPO在聊天机器人之外的广泛应用。[Hugging FaceBlog ↗](https://huggingface.co/blog/Dharma-AI/direct-preference-optimization-beyond-chatbots)
**38. 演讲:选择你的 AI 副驾驶:最大化开发效率**
> Sepehr Khosravi 探讨开发效率工具演变,评估 Cursor 和 Claude Code 等优势,为高级工程师提供可行技巧。[InfoQ AI ↗](https://www.infoq.com/presentations/choosing-ai-copilot/?utm_campaign=infoq_content&utm_source=infoq&utm_medium=feed&utm_term=AI%2C+ML+%26+Data+Engineering)
## 总结
**强信号**
- **微软与OpenAl分道扬镳双方开始正面竞争**
合作终结后微软AI主管Mustafa Suleyman称公司必须独立证明能力这意味着微软将不再依赖OpenAI的模型而是全力押注自研OpenAI也失去最大云盟友。
- **Anthropic提交招股书预计最快Q4上市**
这标志着安全派AI公司正式进入资本市场与OpenAI争夺投资者注意Claude的月活同比增长640%也为其估值提供了底气。
- **ChatGPT月活突破10亿成为史上增长最快的应用**
Sensor Tower数据显示ChatGPT在2025年5月达到这一里程碑Claude月活5600万两家头部消费级AI应用的用户粘性正在拉开差距。
**中信号**
- **Miso One发布8B开源语音模型支持一次语音克隆且延迟仅110ms**
权重已开放、可自托管意味着实时语音克隆的门槛从专有API降到了个人部署可能加速语音交互在开发者中的普及。
- **欧盟公布全面技术主权计划推动芯片与AI自主发展**
计划扩大本土半导体、AI和云计算供应链目标减少对美亚依赖——这将对全球AI公司的合规、市场准入和数据主权产生实质影响。
**待验证**
- **DeepSeek首轮融资拟筹500亿元腾讯、宁德时代参投**
投后估值高达3500-4000亿元但融资消息来源为IT之家未见官方确认。如此大体量的AI融资在国内市场是否顺利落地存在不确定性。
- **跨维智能登顶WorldArena世界模型榜首**
WorldArena的评测权威性尚未被广泛验证且“世界模型”概念本身缺乏统一标准需要看后续是否有独立第三方复现其能力。

35
script/run_meta.json Normal file
View File

@@ -0,0 +1,35 @@
{
"date": "2026-06-04",
"slug": "ai-2026-06-04",
"blog_url": "https://blog.ephron.ren/posts/ai-2026-06-04",
"public_ok": true,
"errors": [
"橘鸦AI早报(重试): TimeoutError"
],
"aihot_sections": [
"模型发布/更新",
"产品发布/更新",
"行业动态",
"论文研究",
"技巧与观点"
],
"raw_item_count": 39,
"stage0_count": 39,
"final_item_count": 38,
"has_juya": false,
"source_counts": {
"AI HOT": 32,
"InfoQ AI": 2,
"MIT科技评论AI": 0,
"量子位": 5,
"橘鸦AI早报": 0
},
"featured_titles": [
"Grok Imagine 1.5 预览版发布",
"MiniMax M3 1M token 解码加速 15.6 倍",
"Miso One 开源语音模型8B 参数、110ms 延迟、一次语音克隆",
"Ideogram v4.0 发布2K 分辨率和 JSON 提示支持",
"Meta 面向 WhatsApp Business 的 AI 智能体现已全球上线",
"NousResearch 发布 Hermes Agent 桌面应用公测版"
]
}