全球 AI 核心动态内参

每日AI综述
每周浏览器综述
每周输入法综述
历史检索
监测周期:加载中...

今日重点

产品动态 OpenAI
OpenAI在ChatGPT推出升级版计划任务功能,面向Go、Plus、Pro、Business、Enterprise用户在网页与移动端推送
OpenAI为ChatGPT推出升级版计划任务功能,运行更快、更可靠,并可在新的Scheduled页面统一管理。该功能正逐步向Go、Plus、Pro、Business、Enterprise各层级用户的网页端与移动端推出,帮助用户更便捷地创建和管理定时任务。
商业动态 OpenAI
Transformer主要作者Noam Shazeer离开谷歌加入OpenAI,谷歌曾于2024年以约27亿美元技术许可协议将其请回
Transformer论文《Attention Is All You Need》主要作者、混合专家模型等架构发明者Noam Shazeer离开谷歌加入OpenAI,OpenAI已于内部通知员工。谷歌曾在2024年8月以约27亿美元技术许可协议收购Character.AI将其请回并任Gemini技术负责人,其个人从中获益约7.5亿至10亿美元。至此Transformer八位作者已全部离开谷歌,其中两位落脚OpenAI;此次xAI等公司也参与争夺。
产品动态 字节跳动
字节跳动火山引擎营销创作平台Kickart 3.0正式上线,升级对话式视频生成并接入Seedance 2.0 mini
字节跳动火山引擎将营销创作平台"创作Agent"升级为Kickart 3.0正式上线,并接入Seedance 2.0 mini模型。平台升级为对话式视频生成,支持多轮对话调整商品图、故事板与场景,新增爆款裂变功能对参考视频多维拆解与原创重构,强化人物一致性与画面连贯性;自由创作支持分镜重生成、字幕擦除,审核分发覆盖抖音、抖音电商、巨量投流并自动生成预审报告,提供SaaS、API与Skill多种交付方式。
技术迭代 阿里巴巴
阿里云发布可实时交互的开放式世界模型HappyOyster快乐生蚝1.0,一句话生成可演绎可探索的数字世界
阿里云推出开放式世界模型HappyOyster(快乐生蚝)1.0,基于原生多模态架构,支持一句话生成可演绎、可探索、可互动的数字世界,并在生成过程中持续接收指令、画面实时响应。产品含实时导演与世界探索两大板块,实时导演最长生成6分钟、提供480P与720P分辨率,世界探索支持wasd自由移动与跳跃攻击等交互;模型推演动作到输出的因果链并保持人物与环境全程一致性,首次登录及每日登录各赠1000积分。
产品动态 Kimi
Kimi Work 迎来重大升级推出目标模式并打通外部应用插件
办公协同产品 Kimi Work 开启重要版本迭代,上线目标模式并实现对外部应用插件的全面连通,提升任务处理智能化水平。

OpenAI

产品动态
OpenAI在ChatGPT推出升级版计划任务功能,面向Go、Plus、Pro、Business、Enterprise用户在网页与移动端推送
OpenAI为ChatGPT推出升级版计划任务功能,运行更快、更可靠,并可在新的Scheduled页面统一管理。该功能正逐步向Go、Plus、Pro、Business、Enterprise各层级用户的网页端与移动端推出,帮助用户更便捷地创建和管理定时任务。
商业动态
Transformer主要作者Noam Shazeer离开谷歌加入OpenAI,谷歌曾于2024年以约27亿美元技术许可协议将其请回
Transformer论文《Attention Is All You Need》主要作者、混合专家模型等架构发明者Noam Shazeer离开谷歌加入OpenAI,OpenAI已于内部通知员工。谷歌曾在2024年8月以约27亿美元技术许可协议收购Character.AI将其请回并任Gemini技术负责人,其个人从中获益约7.5亿至10亿美元。至此Transformer八位作者已全部离开谷歌,其中两位落脚OpenAI;此次xAI等公司也参与争夺。
技术迭代
OpenAI联合Molecule.one用GPT-5.4驱动智能体化学系统Maria近自主改进Chan–Lam偶联反应,平均产率从16.6%提升至25.2%
OpenAI联合Molecule.one将GPT-5.4接入智能体化学系统Maria,在高通量实验室近自主地生成提案、设计运行实验并迭代,改进药物合成常用的Chan–Lam偶联反应。最优提案OAI-M1-03使平均产率从16.6%升至25.2%、产率超30%的反应占比从15.6%增至37.5%,两轮共运行10080次反应;GPT-5.4自主识别出伯磺酰胺底物并建议TEMPO等温和氧化剂,台架验证14对底物中11对产率提升、8对增幅超两倍,全程历时三个月。
技术迭代
OpenAI 近自主化 AI 化学家在药物化学领域成功改进一项极具挑战性的反应
OpenAI 利用近自主化人工智能化学系统攻克药物合成难题,实现高难度化学反应的精确优化与路径规划,拓展科研应用边界。
数据洞察
OpenAI 推出生命科学基准测试集 LifeSciBench,用于评估 AI 模型在生命科学领域的专业能力
OpenAI 发布生命科学领域模型评测基准 LifeSciBench,全面检验人工智能系统处理生物医药及相关科学任务的综合表现。
运营活动
OpenAI Codex团队发放双重速率限制重置,用户除即时重置外另获一次可自行支配的重置额度
OpenAI Codex团队向用户发放"双重重置",除直接获得一次完整的速率限制重置外,还额外存入一次可由用户自行支配使用的重置额度。部分用户在回复中质疑该可存储重置需通过推荐他人注册才能获得,并反映上一次重置在仅50%使用量时被自动应用。

Google

技术迭代
Google基于Apache 2.0开源Agentic Resource Discovery规范,用于跨网络发布、发现与验证AI工具、技能与智能体
Google联合行业伙伴推出并以Apache 2.0开源Agentic Resource Discovery(ARD)规范,用于在网络上发布、发现与验证AI工具、技能与智能体,基于Linux Foundation的AI Catalog数据模型构建。规范以Catalogs与Registries两个原语运作:组织在自有域名well-known路径托管ai-catalog.json,注册表充当智能体网络的搜索引擎并提供加密身份验证;Gemini Enterprise Agent Platform的Agent Registry将在未来数月原生支持ARD。
产品动态
谷歌搭载 Gemini 模型的 AI 家用智能音箱开启预售并定于 6 月 25 日正式发售
谷歌推出集成 Gemini 大模型的智能音箱产品并确定发售日期,通过多模态交互能力升级智能家居硬件终端体验。
数据洞察
谷歌医疗 AI 模型 AMIE 新研究显示其具备协助管理健康状况的潜力,展现临床应用价值
谷歌医疗人工智能模型 AMIE 开展新临床研究,展示其辅助管理健康状况的潜力,提供标准化医疗支持并降低医生认知负担。

Anthropic

产品动态
Anthropic更新Claude Design,支持从GitHub仓库或设计文件导入设计系统并通过design-sync与Claude Code代码同步
Anthropic更新beta阶段的Claude Design,重建设计系统导入,可从GitHub仓库、设计文件或上传导入一个或多个设计系统并自动对照修正,新增管理员角色锁定标准系统。通过/design-sync与/design命令与Claude Code双向同步,从现有代码继续而非从截图重来;支持导出PDF与PowerPoint,可连接Adobe、Canva、Miro、Vercel等工具,与chat、Cowork、Code共享使用额度,首周使用人数超百万。
商业动态
Anthropic 设立首尔办公室并与韩国 AI 生态系统建立多项合作关系,加速本地化发展与技术应用
Anthropic 设立首尔办公室拓展全球版图,通过与当地企业及机构合作推动韩国人工智能生态建设,满足特定区域市场需求并提升行业影响力。

字节跳动

产品动态
字节跳动火山引擎营销创作平台Kickart 3.0正式上线,升级对话式视频生成并接入Seedance 2.0 mini
字节跳动火山引擎将营销创作平台"创作Agent"升级为Kickart 3.0正式上线,并接入Seedance 2.0 mini模型。平台升级为对话式视频生成,支持多轮对话调整商品图、故事板与场景,新增爆款裂变功能对参考视频多维拆解与原创重构,强化人物一致性与画面连贯性;自由创作支持分镜重生成、字幕擦除,审核分发覆盖抖音、抖音电商、巨量投流并自动生成预审报告,提供SaaS、API与Skill多种交付方式。
商业动态
字节考虑向百度采购昆仑芯 AI 芯片优化底层算力布局
市场消息称字节跳动正评估向百度采购昆仑芯人工智能芯片,旨在多元化供应链并满足自身大模型训练与推理的算力需求。

阿里巴巴

技术迭代
阿里云发布可实时交互的开放式世界模型HappyOyster快乐生蚝1.0,一句话生成可演绎可探索的数字世界
阿里云推出开放式世界模型HappyOyster(快乐生蚝)1.0,基于原生多模态架构,支持一句话生成可演绎、可探索、可互动的数字世界,并在生成过程中持续接收指令、画面实时响应。产品含实时导演与世界探索两大板块,实时导演最长生成6分钟、提供480P与720P分辨率,世界探索支持wasd自由移动与跳跃攻击等交互;模型推演动作到输出的因果链并保持人物与环境全程一致性,首次登录及每日登录各赠1000积分。
数据洞察
阿里云在IDC《中国AI软件市场半年度追踪2025H2》中以42.2%份额位列大模型训推公有云市场第一,同比增速116%
国际数据公司报告显示,2025年中国大模型训推公有云市场规模达79.38亿元,阿里云以42.2%份额位居第一,同比增速116%;其PAI平台在Qwen 3.5 MoE训练中加速比提升3倍,支持千卡至万卡集群,Agent场景KV Cache命中率超90%,相比开源框架TTFT下降30%、TPS提升40%,已服务智能驾驶、具身智能、互联网等领域。

百度

数据洞察
百度与中国科学技术大学提出澄清式检索基准Clarify-Then-Search,多轮澄清下ERNIE-4.5-Turbo-128K使答案完整度最高相对提升约45%
百度与中国科学技术大学提出面向Deep Search的澄清式检索基准Clarify-Then-Search,论文入选KDD 2026 Datasets & Benchmarks Track。基准基于518条真实百度搜索查询与闭卷交互协议,评测GPT-5.2、Claude-Sonnet-4.5、Gemini-2.5-Pro、ERNIE-4.5-Turbo-128K等7个模型的提问能力;先问再搜使答案完整度最高相对提升约45%,多轮澄清下ERNIE-4.5-Turbo-128K以+8.90分反超闭源旗舰,数据集与评测脚本已开源。

其余重点关注公司

产品动态 Kimi
Kimi Work 迎来重大升级推出目标模式并打通外部应用插件
办公协同产品 Kimi Work 开启重要版本迭代,上线目标模式并实现对外部应用插件的全面连通,提升任务处理智能化水平。

行业新闻

商业动态 Microsoft
微软通过在华销售 OpenAI 模型业务取得重大进展,在本土市场实现商业化扩张
微软在华通过销售人工智能模型商业化服务取得显著成效,拓展业务规模并深化 OpenAI 技术在本土企业的应用落地。
技术迭代 LOGOS
ATH-Token Foundry联合中国人民大学开源统一科学生成模型LOGOS,LOGOS-1B以1/56参数量在逆合成预测上达74.8%准确率
ATH-Token Foundry与中国人民大学高瓴人工智能学院开源统一科学生成模型LOGOS,开放权重、推理代码与技术报告。LOGOS-1B以约1/56参数量(1B对8×7B)超越NatureLM,预训练涵盖7类模态共44.87B tokens,逆合成预测Top-1准确率74.8%,MOF材料生成新型构建单元比例从10.10%升至17.78%,蛋白质编辑Hard难度Fitness达0.93、抗体CDR设计AAR 79.82%,可复用vLLM等推理基建降低部署成本。
技术迭代 中国电信
中国电信6款星辰语音大模型上线模力方舟,多方言ASR支持中文及60种方言混合识别、普通话字准确率97.25%
中国电信星辰语音大模型旗下6款主力模型一次性上线开源社区平台模力方舟,向公有云开发者开放多方言语音识别与合成服务,含2款ASR与4款TTS。其中离线ASR单次可处理最长2小时音频,实时TTS音色扩充至29个,多方言TTS单模型支持上海话、四川话等五种方言;普通话识别字准确率97.25%、合成字准确率98.71%,单模型支持中文及60种方言混合识别,整体业务月调用量超4亿次。
商业动态 Odyssey
世界模型公司Odyssey完成3.1亿美元B轮融资,由Natural Capital领投,Amazon、GV、AMD等参投,估值达14.5亿美元
世界模型公司Odyssey完成3.1亿美元B轮融资,由Natural Capital领投,Amazon、GV、AMD、IQT等参投,估值达14.5亿美元,资金用于加速能够理解和模拟世界的世界模型研发。公司表示能够理解并模拟世界的AI将成为这个时代最重要的技术之一。

本周动态

技术迭代 美团 2026/6/17
Tabbit 浏览器 v1.1 上线 GLM-5.2 模型,新增桌宠系统与跨对话记忆功能
Tabbit 浏览器发布 v1.1 版本,接入最新发布的 GLM-5.2 模型以提升对话智能性,同步上线可通过特殊口令领取桌宠的桌宠系统,并升级记忆功能支持跨对话延续用户偏好与历史信息;本次更新还优化了任务模式结果展示样式、PDF Skill 处理能力、垂直标签栏与全屏模式拖拽体验,新增关闭窗口提示,修复标签管理、全屏模式与卸载流程中的已知问题以提升稳定性。

本周动态

产品动态 阿里巴巴 2026/6/18
阿里千问将推出独立"千问输入法"APP,投入约5至6人成国内第三家入局AI输入法的头部大厂
阿里千问团队继今年5月在PC端推出千问语音输入法组件后,将推出名为"千问输入法"的独立APP,产品已开发完成、择日上线各大应用商店,AI功能与键盘更贴合手机端操作,由约5至6人团队投入并有核心高管参与;该产品填补千问在移动端AI输入法赛道空白,使阿里成为继微信输入法、豆包输入法后国内第三家入局独立AI输入法赛道的头部互联网大厂,是其落地全域AI入口战略的重要落子。
技术迭代 腾讯 2026/6/18
微信输入法 for iOS 3.5.0 语音输入接入大模型,支持说完直接发送
微信输入法 for iOS 更新至 3.5.0 版本,将语音输入功能升级接入大模型,实现说完即可直接发送,自动去除"嗯、啊、那个"等口水词、智能加标点分段、长内容归纳分点并理顺不通顺语序,正式进入 AI 输入法行列;此前 3.4.0 与 3.4.1 版本已上线悬浮窗免跳转模式,本次升级内容与微信输入法 for Mac 2.2.0 版本相同。
技术迭代 Typeless 2026/6/16
Typeless 发布 Windows 应用更新:为日常沟通而优化的翻译
Windows app V1.8.0版本发布,翻译现在可以将话语输入转化为即时发送的消息、电子邮件或帖子,在目标语言中更贴合用户语气和风格,并适应沟通目的。