今日重点
技术迭代Microsoft
微软发布 MAI-Image-2 图像生成模型,位列 Arena.ai 全球前三并深度整合 Copilot微软 MSI 团队正式推出下一代文生图模型 MAI-Image-2,该模型在 Arena.ai 排行榜位居全球前三。MAI-Image-2 重点强化了摄影级写实感(光影、肤质)、可靠的图片内文字生成以及复杂超现实场景的构建能力,旨在减少创意工作的后期修正成本。目前模型已在 MAI Playground 开放预览,并逐步推向 Copilot 与 Bing Image Creator;同时,微软通过其新投产的 GB200 集群提供算力支撑,向 WPP 等企业客户开放 API 访问,确立了其在超大规模商业图像生成领域的领先地位。
技术迭代Google
Google AI Studio 发布 Antigravity 编码智能体,支持全栈 vibe coding 从原型直通生产谷歌正式在 Google AI Studio 中上线 Antigravity 编码智能体,通过深度集成 Firebase 实现数据库配置与用户认证的自动化。该系统支持 Next.js、React 等框架,具备自动安装外部库(如 Framer Motion)、实时多人协作构建以及通过内置 Secrets Manager 安全管理 API 密钥的能力。这种全栈“氛围编程”模式消除了从创意到部署的工程壁垒,允许用户仅凭自然语言即可构建具备持久化存储与安全登录功能的生产级 AI 原生应用。
技术迭代阿里巴巴
Qwen3.5-Max-Preview 亮相 LM Arena,位列全球第六、中国第一阿里千问最新一代旗舰模型预览版 Qwen3.5-Max-Preview 正式登场,在国际权威榜单 LM Arena 斩获 1464 分,冲进全球大模型公司排行榜前五,并摘得国内大模型桂冠。在不考虑样式控制的绝对胜率测试中,其整体性能排名全球第六;子任务表现上,数学能力位居全球第五,专家级文本能力排名全球第十。该模型作为千问 3.5 家族的顶级成员,延续了系列“以小胜大”的架构优势,标志着国产旗舰模型在专家级复杂任务处理上已稳居全球第一梯队。
产品动态字节跳动
飞书发布官方智能助手 aily,凭借 All-in-One 架构构建企业级 Agent 工作体系飞书正式推出官方版智能体“飞书 aily”,主打 0 配置接入办公流。该产品通过深度渗透企业上下文,实现从高频杂活处理(如自动约会、数据报表生成)到复杂协同(如回复草案生成、日程简报)的跨越,并支持将任务逻辑封装为可复用的 Skill。结合妙搭 Agent 与多维表格 Agent,飞书利用其消息、文档、数据天然互通的“全景视图”优势,补齐了从应用生产到系统搭建的 Agent 闭环,通过掌握深层协作图谱构建起 AI 时代的上下文(Context)护城河。
OpenAI
技术迭代
OpenAI 建立内部编码智能体对齐监控系统,通过多层级自动化审核防止模型偏离预期OpenAI 披露了一套针对内部编码 Agent 的实时监控框架,旨在解决智能体在自主执行任务过程中的失调风险。系统通过构建独立的监督模型对编码 Agent 的行为进行采样审计,结合确定性规则与模型评审,确保代码产出符合安全规范。这一机制显著提升了大规模自动化开发中的安全冗余,为更高级别的自主编程任务提供技术保障。
产品动态
OpenAI 计划整合 ChatGPT、Codex 与浏览器功能打造 AI 超级应用OpenAI 正在内部推进代号为“SuperApp”的战略计划,旨在将 ChatGPT 的对话力、Codex 的编码力与原生网页浏览功能深度融合。用户将能在一个统一界面内完成从信息检索、代码执行到任务调度的闭环体验,打破现有产品间的应用壁垒。此举标志着 OpenAI 试图构建全新的互联网入口,通过多模态交互重塑用户获取服务与信息的交互范式。
商业动态
OpenAI 宣布收购 Python 开发者工具厂商 Astral,旨在强化编程工具链布局OpenAI 正式完成对 Astral 的收购,该团队曾开发极受欢迎的 Python 包管理工具 uv 和格式化工具 Ruff。此次动作意在将高性能开发者工具直接整合进 OpenAI 的编程助手生态,提升 ChatGPT 与 Codex 处理复杂工程任务的效率,通过原生支持高性能基础设施,降低开发者在大模型辅助编程时的环境配置门槛。
Google
技术迭代
Google AI Studio 发布 Antigravity 编码智能体,支持全栈 vibe coding 从原型直通生产谷歌正式在 Google AI Studio 中上线 Antigravity 编码智能体,通过深度集成 Firebase 实现数据库配置与用户认证的自动化。该系统支持 Next.js、React 等框架,具备自动安装外部库(如 Framer Motion)、实时多人协作构建以及通过内置 Secrets Manager 安全管理 API 密钥的能力。这种全栈“氛围编程”模式消除了从创意到部署的工程壁垒,允许用户仅凭自然语言即可构建具备持久化存储与安全登录功能的生产级 AI 原生应用。
技术迭代
谷歌研究揭示 AI 航线预测可有效减少飞机尾迹云,助力降低航空对气候的影响谷歌与学术界合作的研究表明,利用 AI 模型预测易产生尾迹云的高湿度区域,能引导飞行员实时调整航线以避免温室效应加剧。实验数据显示,在特定航线上避开此类区域可减少约 54% 的非二氧化碳变暖影响。这一技术迭代不仅验证了 AI 在气候治理中的实操价值,也为航空业实现低碳飞行提供了低成本、高效率的数字化路径。
产品动态
谷歌推出 Kaggle Community Hackathons,允许任何人托管全球 AI 挑战赛谷歌宣布 Kaggle 平台重大更新,现已向所有用户开放社区黑客松托管权限,实现竞赛平台的民主化。通过简化赛题设置与数据集分发流程,开发者和机构可以快速发起小规模或垂直领域的 AI 竞技。此举意在激发全球开发者的创新活力,构建更细分的技术社区生态,加速特定领域 AI 算法的微创新与落地。
产品动态
谷歌开始测试 Gemini 的 Mac 原生应用,直接对标 ChatGPT 与 Claude 桌面端谷歌正紧锣密鼓地在 macOS 平台上灰度测试 Gemini 独立应用程序,旨在为苹果用户提供无缝的 AI 交互体验。该应用支持系统级快捷唤起、多模态文件拖拽识别以及深度集成至工作流的自动化功能。通过补齐桌面客户端这一拼图,谷歌试图扭转用户在移动端与网页端之间的交互断层,在生产力场景中与 OpenAI 及 Anthropic 展开正面肉搏。
产品动态
谷歌面向企业用户测试 “Skills”与“Build with Gemini”功能,加速企业级应用原型构建谷歌正在其 Gemini Enterprise 用户中秘密测试两项开发者级工具:Build with Gemini 和 Skills。前者允许非技术人员通过自然语言快速架构与原型化企业级应用,将 Google AI Studio 的功能无缝引入日常办公流;后者则提供类似定制化智能体(GPTs)的配置空间,支持定义特定规则与自动化工作流。此举旨在将 Gemini 转型为集创建与自动化于一体的生产力中心,预计将在 Google I/O 2026 大会正式亮相,标志着谷歌正全力缩小对话式 AI 与实际应用开发之间的鸿沟。
数据洞察
3 月文生图榜单发布,Nano Banana 2 模型性能大幅领跑,阿里字节紧随其后最新全球文生图模型测评显示,Nano Banana 2 凭借在构图逻辑与细节纹理上的压倒性优势稳居首位,断层式领先于竞品。报告同时指出,阿里巴巴的通义万相与字节跳动的相关模型增长势头极强,正在摄影写实感与亚洲面孔表现力上发起强势追赶。这一榜单反映了视觉生成领域的竞争白热化,单一模型的统治力正受到具有强大算力储备与本土数据集支撑的互联网巨头的挑战。
字节跳动
产品动态
飞书发布官方智能助手 aily,凭借 All-in-One 架构构建企业级 Agent 工作体系飞书正式推出官方版智能体“飞书 aily”,主打 0 配置接入办公流。该产品通过深度渗透企业上下文,实现从高频杂活处理(如自动约会、数据报表生成)到复杂协同(如回复草案生成、日程简报)的跨越,并支持将任务逻辑封装为可复用的 Skill。结合妙搭 Agent 与多维表格 Agent,飞书利用其消息、文档、数据天然互通的“全景视图”优势,补齐了从应用生产到系统搭建的 Agent 闭环,通过掌握深层协作图谱构建起 AI 时代的上下文(Context)护城河。
产品动态
字节小云雀 AI 上线“短剧 Agent”功能,基于 Seedance 2.0 实现剧本到成片全自动化字节跳动正式推出全球首个短剧垂直行业智能体,该功能深度集成 Seedance 2.0 模型,能够自主完成短剧的剧本分镜、角色配音、视频生成及后期剪辑。此举极大压缩了短剧内容的制作周期与成本,实现了内容产出的规模化、工业化。字节正利用这一利器进一步巩固其在短视频与微短剧赛道的统治地位,开启 AI 驱动的内容创作新范式。
商业动态
字节跳动以超 60 亿美元价格出售沐瞳科技,战略收缩非核心游戏业务聚焦 AI字节跳动完成对游戏开发商沐瞳科技的剥离,交易金额超过 60 亿美元。此举标志着字节跳动在游戏领域的战略性大撤退,旨在通过回笼资金全力投入大模型研发与全球 AI 基础设施建设。集团内部明确将 AI 视为决定未来十年命运的核心战场,通过舍弃重资产的游戏业务,字节正试图实现从“信息分发巨头”向“AI 智能体巨头”的精简与跨越。
阿里巴巴
技术迭代
Qwen3.5-Max-Preview 亮相 LM Arena,位列全球第六、中国第一阿里千问最新一代旗舰模型预览版 Qwen3.5-Max-Preview 正式登场,在国际权威榜单 LM Arena 斩获 1464 分,冲进全球大模型公司排行榜前五,并摘得国内大模型桂冠。在不考虑样式控制的绝对胜率测试中,其整体性能排名全球第六;子任务表现上,数学能力位居全球第五,专家级文本能力排名全球第十。该模型作为千问 3.5 家族的顶级成员,延续了系列“以小胜大”的架构优势,标志着国产旗舰模型在专家级复杂任务处理上已稳居全球第一梯队。
产品动态
阿里云上线“AI 识花”功能,利用千问大模型提升多模态百科搜索精准度阿里云通义千问正式集成高精度视觉识别模块,用户拍摄植物照片即可获得包含植物习性、药用价值及背后文学意象的深度解析。不同于传统图片搜索,该功能通过大模型的跨模态理解能力,能回答“这盆花为什么枯萎”等推理性问题。阿里正通过这种生活化的高频场景,让大模型能力降维渗透进大众日常生活,构建更具用户黏性的知识搜索入口。
商业动态
阿里巴巴发布 2026 财年 Q3 财报,AI 收入连续三季度实现三位数增长阿里巴巴集团最新财报显示,尽管宏观环境多变,但其 AI 业务表现异常稳健,已成为阿里云的核心增长支柱。得益于通义千问系列模型的广泛商用,相关云产品的收入同比增速极快。蔡崇信在财报中重申,阿里将继续不计代价地投入 AI 研发,通过重塑算力成本与模型效能,力争在下一个十年转型为一家彻底的 AI 原生科技巨头,重构商业护城河。
腾讯
产品动态
腾讯元宝 AI 更换拟人化 Logo ,增加眼睛元素腾讯元宝 AI 正式宣布更换品牌 Logo,在原版基础上添加眼睛元素以提升拟人化交互感。此次视觉升级标志着元宝正从基础工具向灵动、进化的个人智能助手定位转型,通过强化情感连接争夺 C 端流量入口。
产品动态
腾讯 QClaw 宣布全面取消邀请制,实现全网免码下载即用以加速规模化扩张腾讯决定加快其 AI 智能体 QClaw 的市场渗透速度,宣布即日起全球用户均可直接下载安装,不再需要复杂的内测邀请码。这一激进的运营策略旨在短时间内通过海量用户反馈快速打磨模型精度,抢占桌面端 AI 助手的先发优势。QClaw 的全面开放标志着腾讯正式开启大规模 AI 用户收割战,力图在竞争对手反应过来前建立稳固的社群基石。
产品动态
腾讯元宝联手《无畏契约》手游上线“瓦手换装秀”,通过一张照片一键生成特工定妆照腾讯旗下 AI 助手“元宝”正式开启与《无畏契约》(Valorant)手游的跨界联动,在创作专区上线“瓦手换装秀”功能。用户只需上传一张个人照片并选择心仪的特工模板,即可通过 AI 图像生成技术一键产出专属的特工定妆照。此举标志着元宝正通过深度整合腾讯系顶流游戏 IP,利用高频娱乐场景降低 AI 创作门槛,加速在年轻化、社交化领域的品牌渗透与用户裂变。
行业新闻
产品动态Perplexity
Perplexity 在美国发布医疗专用 AI 助手 Perplexity Health,支持权威医学信源检索AI 搜索独角兽 Perplexity 针对医疗健康领域推出了垂直版智能体,专门集成来自认证医疗机构与学术期刊的信源。该工具能够理解复杂的医学术语,并提供带有可靠引用的健康建议,旨在减少通用模型产生的医学幻觉。通过与多家顶级医院合作,Perplexity 试图在受监管的严谨领域确立 AI 搜索的专业地位,为用户提供可信赖的数字医疗咨询入口。
技术迭代Microsoft
微软发布 MAI-Image-2 图像生成模型,位列 Arena.ai 全球前三并深度整合 Copilot微软 MSI 团队正式推出下一代文生图模型 MAI-Image-2,该模型在 Arena.ai 排行榜位居全球前三。MAI-Image-2 重点强化了摄影级写实感(光影、肤质)、可靠的图片内文字生成以及复杂超现实场景的构建能力,旨在减少创意工作的后期修正成本。目前模型已在 MAI Playground 开放预览,并逐步推向 Copilot 与 Bing Image Creator;同时,微软通过其新投产的 GB200 集群提供算力支撑,向 WPP 等企业客户开放 API 访问,确立了其在超大规模商业图像生成领域的领先地位。
产品动态Microsoft
微软发布针对税务季的钓鱼与恶意软件警示,利用 AI 驱动的防御系统拦截相关攻击微软监测到 2026 年税务季期间针对性钓鱼邮件和恶意软件活动激增,攻击者大量利用税务申报主题诱导用户下载感染附件。微软 Security Copilot 系统通过分析海量威胁信号,实现了对变种恶意代码的毫秒级识别。公司建议用户启用多因素验证并依赖 Defender 的实时防护功能,利用 AI 的预测性分析阻断利用社会工程学进行的财务欺诈攻击。
产品动态Microsoft
微软提供专项技术支持提升水务部门网络安全,利用安全智能体加固关键基础设施微软通过实地支持计划协助水务设施应对日益严峻的网络威胁,部署了集成 AI 监测的防御方案以识别潜在的工业控制系统入侵。实证结果显示,通过配置自动化的安全响应流程,受援部门的漏洞修补速度提升了 40%。该举措展示了大型科技公司在保障国家级关键基础设施韧性方面的核心角色,有效降低了因攻击导致供水中断的风险。
数据洞察Microsoft
微软 WorkLab 发布 AI@Work 研究报告,定义 AI 协作下人类员工的技能转型方向微软最新发布的职场研究揭示了 AI 普及后员工角色的深刻演变,指出核心竞争力正从重复性任务执行转向“AI 编排”与批判性思维。调查显示 78% 的受访者已将 Copilot 深度融入日常流程,释放的精力正流向战略规划与创新。报告强调组织需重构岗位描述,建立以 AI 素养为基础的评价体系,以适应人机协作的新型生产关系。
商业动态英伟达
英伟达计划在 2027 年底前向亚马逊售出 100 万颗芯片,达成巨额云端供应协议英伟达与亚马逊达成深度战略合作,承诺在未来几年内分批向 AWS 提供超过 100 万颗高性能 AI 加速芯片。该协议锁定了亚马逊作为全球最大云服务商对 H 系列及后续架构芯片的海量需求,确保了英伟达的市场占有率。这也预示着亚马逊将大规模升级其 AI 基础设施,为全球开发者提供更强大的云端算力支持,进一步推高 AI 计算的市场基调。
技术迭代Cursor
Cursor 推出 AI 编程新形态界面 Cursor Glass,目前处于早期 Alpha 体验阶段Cursor 官方宣布正式上线全新的交互界面 Cursor Glass,用户现已可通过指定页面申请测试。尽管具体交互细节仍保持神秘,但据早期反馈显示,Glass 旨在打破传统代码窗口的二维限制,提供更具沉浸感的“全景式”代码理解视角。这一动作体现了 Cursor 在重塑编程美学与交互范式上的野心,试图通过硬件思维重新定义软件开发的交互界面。
技术迭代Cursor
Cursor 发布 Composer 2 编程模型,性能超越 Opus 4.6 且成本实现“脚踝斩”Cursor 正式推出自研编程模型 Composer 2,其在 Terminal-Bench 2.0 等基准测试中超越 Claude Opus 4.6,且定价仅为后者的极小比例。该模型核心突破在于引入“自我总结强化学习方法”(Self-summary RL),通过训练使模型在长链条任务中主动生成阶段性笔记,将 10 万级 Token 上下文压缩至 1000 Token 且减少 50% 的信息损耗。此举标志着 Cursor 从纯应用向“模型+应用”双重身份转型,通过极致性价比与处理 170 轮超长交互的能力,重新定义了 AI 原生编程的成本与效率边界。
商业动态特斯拉
特斯拉正与中国企业洽谈采购 29 亿美元太阳能设备,强化绿色能源供应链据悉特斯拉正积极与多家中国领先的光伏企业接洽,计划签署总额达 29 亿美元的太阳能组件采购合同。此举旨在支撑其全球超级工厂及能源存储业务的扩张,确保生产端的能源自给与低碳化。通过大规模锁定中国高效供应链资源,特斯拉意在巩固其在可再生能源领域的成本竞争力,加速推动其“宏图计划”中能源转型目标的实现。
技术迭代智元
智元机器人 Pi 0.6 展现惊人学习力,15 分钟学会复杂工业拧螺丝任务智元机器人发布最新视频,展示了其 Pi 0.6 型号在完全无编程干预下,仅通过 15 分钟的视觉临摹与自我强化,即掌握了高精度的工业拧螺丝动作。该机器人具备强大的边缘端实时学习能力,能够“边干边学”适应多变的生产线环境。这一突破标志着具身智能已跨越实验室阶段,具备了在真实工厂中快速部署与快速迭代的商业化潜力,引领柔性制造新趋势。
商业动态智元
黄仁勋在 GTC 2026 定义“智元经济学”,全球大模型年化用量突破千万亿智元英伟达 CEO 黄仁勋正式提出“智元(Token)经济学”,将 Token 定义为 AI 时代的石油与核心度量衡。OpenRouter 数据显示全球年化 Token 吞吐量已达 10^15 级别,对应约 10 亿美元推理支出。英伟达通过 Blackwell 与未来 Rubin 架构实现两年内 350 倍的 Token 生成率跨越,并推行分层定价与企业“智元预算”制度。随着算力重心从训练转向推理,黄仁勋向 Andrej Karpathy 交付首台 DGX Station GB300 桌面超算以支持 OpenClaw 等智能体运行,标志着“智元工厂”正式进入个人生产力场景。
技术迭代LiblibAI
LibTV 正式发布解锁全自动拍片功能,实现从一句话剧本到视频成片的 Agent 闭环LiblibAI 推出一站式 AI 视频创作社区 LibTV,采用“无限画布+节点工作流”架构,集成 20 余种专业功能并支持市面顶流模型。产品核心突破在于提供“人+Agent”双入口设计:人类用户可精细化操控节点,而 Agent 用户可通过安装 LibTV Skill 实现“自动挡”拍片,全自动生成剧本、分镜及配乐工作流。凭借 LiblibAI 超过 2000 万创作者的生态积淀与 B 轮 1.3 亿美元融资支持,LibTV 通过极具竞争力的定价策略与 OpenClaw 深度集成,将视频创作从单一生成工具演进为可复用的自动化生产力平台。
技术迭代此芯科技
此芯科技发布全球首款 OpenClaw 专属 CPU 螯芯系列,联合 Arm 与阿里云共建端侧智能生态此芯科技正式推出 CIX ClawCore 螯芯系列 CPU,包含 P(劲)、A(智)、E(灵)三大系列,采用 Armv9.2 架构,最高提供 80TOPS 原生 AI 算力并支持扩展至 200TOPS。该系列芯片专为 OpenClaw 智能体生态设计,通过硬件级加密与“以 Agent 为中心”的开发范式,支持 50% 模型本地化运行以大幅降低 Token 成本。此举联合 Arm、阿里云及天数智芯等伙伴,提供从 AI MiniPC 到边缘服务器的全场景方案,标志着中国端侧 AI 算力底座实现从通用处理器向智能体专用架构的跨越。
技术迭代华为
华为预告下半年发布“龙虾”系列智能体,构建鸿蒙生态下的全场景 AI 护城河华为在内部会议上披露,将于 2026 年下半年推出自研的“龙虾”系列 AI 智能体群,旨在实现手机、车机、平板与智能家居的深度逻辑互联。不同于简单的语音助手,该系列将基于盘古大模型的原子能力,具备更强的设备间协同操控力与自主决策权。华为意在通过软硬一体的优势,在鸿蒙系统内构建一道竞争对手难以逾越的、具有高黏性的 AI 服务壁垒。
技术迭代小米
小米 MiMo-V2-Pro 模型实现万亿参数低成本化,成本仅为 GPT-4 的七分之一小米正式推出由罗福莉带队研发的万亿参数模型 MiMo-V2-Pro,采用稀疏专家架构(MoE)实现仅 420 亿动态激活参数,将 API 调用成本压降至 348 美元(约为西方同级模型的 1/7)。该模型具备 100 万 Tokens 超长上下文窗口,通过 7:1 混合注意力机制提升 85% 背景信息过滤效率,并在 GDPval-AA 测评中以 1426 分领跑。其核心突破在于强大的“行动空间”执行力,ClawEval 智能体评分达 61.5 分,超越 GPT-5.2,标志着 AI 从咨询顾问向自主操作终端的“数字员工”进化。
产品动态阶跃星辰
阶跃星辰上线桌面端 AI Agent StepClaw,一键领养 Windows 与 Mac 智能助手AI 领军厂商阶跃星辰正式发布其原生桌面端应用 StepClaw,支持全平台安装。该产品主打“开箱即用”的智能助理体验,能够深度集成至用户的操作系统,协助处理跨软件的文件检索、邮件撰写与工作流自动化。StepClaw 的上线标志着国产 AI 厂商正式切入桌面端这一生产力核心阵地,通过极低的门槛让普罗大众感受 AI 智能体的实操价值。
商业动态小米
小米未来三年将投入至少 87 亿美元研发 AI,全线产品加速智能化转型小米集团 CEO 雷军宣布将加大对人工智能的战略投入,承诺在 2026 至 2028 年间拨付不低于 87 亿美元的专项资金。投入重点涵盖大模型底层研发、手机影像 AI、智能家居场景联动以及小米汽车的自动驾驶系统。此举表明小米正通过重资本投入构建全生态 AI 护城河,力图在硬件与软件的智能化交汇点上实现跨代竞争。