一周AI大事:黄仁勋亲自给马斯克送货,OpenAI被曝将对成人内容“开绿灯”
一、重磅工具:Claude获“技能”加持,“瑞士军刀”已上膛
新闻:Anthropic公司为其AI模型Claude推出了名为“技能”(Skills)的新功能。这是一种可按需加载的自定义指令与工作流打包机制。Claude可以在相关场景中动态调用“技能”,无需冗长的上下文即可处理专业化任务。“技能”新功能支持将代码规范、报告格式或分析等团队特定工作流程进行编码并存储,并通过设置界面和SDK统一管理。“技能”具备可组合性与可移植性,开发者可将多个“技能”整合成定制化工作流,通过Claude应用、Claude Code及其API无缝调用。
Anthropic同步发布了实施指南与资源库,其中包含创建自定义“技能”的说明,并在相关资源库中提供可处理Excel和PPT等任务的预置“技能”。这种新功能与MCP(组件化模块协议)相辅相成,有效扩展了AI模型的智能体能力。由于“技能”的资源库是开源的,有望像MCP一样获得广泛采用。
“技能”功能现已作为功能预览版向Pro、Max、Team及Enterprise等订阅计划的用户开放。
锐评:等于给Claude配了把可随时换技能的瑞士军刀。
二、AI技术与产品发布:从会拍片的Sora到会打工的Haiku,软硬件多点爆发
1. 新闻:Anthropic正式发布Claude Haiku 4.5。这是一款面向大规模智能体系统与复杂思维链的高速低成本模型。在编码与智能体任务基准测试中,Haiku 4.5表现突出,其在SWE-bench的通过率为73.3%,Terminal-bench得分41%,综合表现直逼Claude Sonnet 4。其卓越的性能、高速率与合理的成本定位,使其成为智能体AI应用的理想选择。Anthropic强调:“Sonnet 4.5擅长将复杂问题解构为多阶段计划,并能协调多个Haiku 4.5实例并行执行子任务。”
锐评:Haiku 4.5貌似“物美价廉”的实习生,专门给“项目经理”Sonnet 4.5打下手。
2. 新闻:谷歌发布Veo 3.1及Veo 3.1 Fast,新增原生音频增强、精准叙事控制、参考图像引导及长视频场景扩展功能。Veo 3.1引入的首尾帧转场与“素材融合”特性支持将多张参考图像合成动态视频。业界评测认为,Veo 3.1在音频质量、图像转视频的契合度以及画面一致性方面均有所提升。目前用户可通过Gemini API体验付费预览版,该模型兼容AI Studio、Vertex AI、Gemini应用及Flow平台。
锐评:谷歌这是铁了心要当AI界的“全能导演”。
3. 新闻:OpenAI发布Sora 2更新,默认视频时长延长至15秒,最长可生成25秒视频。Pro订阅用户新增“故事板”功能,支持逐秒规划视频,实现更精细的生成过程控制。不过,Sora 2近期因生成涉及公众人物的视频引发版权与伦理争议。OpenAI强调公众人物及其家属应有权控制AI生成内容中的自身形象。
锐评:AI造戏越来越溜,但千万不能随便把名人当角色。
4. 新闻:百度MuseStreamer现可生成20秒以上视频。该模型支持实时交互式长视频生成,用户可动态改写剧情或延长过渡。
锐评:时间加长还能随时改戏,国内视频AI也是卷起来了。
5. 新闻:World Labs发布实时生成型世界模型RTFM,可交互式渲染3D一致性场景。官方技术博客阐明该模型聚焦效率、可扩展性与时间一致性三大目标,并演示了如何用单张H100显卡部署密集型世界模型。公开演示版支持用户实时探索生成的世界。虽然RTFM现阶段仍属概念验证,但已趋近实用化。
锐评:RTFM是想用一块H100“装下全世界”。
6. 新闻:OpenAI优化ChatGPT记忆管理机制,通过自动内存管理解决"存储已满"问题,旨在提升系统可靠性并降低用户侧的存储限制。
锐评:系统不再老是因为记忆满格而卡壳,用户体验要轻快不少。
7. 新闻:微软以“让每台Win11电脑变身AI PC”为目标,推出操作系统级Copilot语音智能体。这项集成至系统底层的安全沙箱技术,支持后台语音驱动的任务执行,专为多任务并行场景下的智能工作流设计。该公司表示“Copilot语音与视觉功能的突破性价值在于交互的便捷性。用户通过唤醒词‘Hey Copilot’即可用自然语言下达指令,视觉模块则可在获得授权后实时分析屏幕内容,提供应用教学、项目建议或操作指导。”
锐评:微软是铁了心推Copilot语音助手。
8. 新闻:Cognition推出SWE-grep和SWE-grep-mini两款经强化学习训练的多轮上下文检索智能体,专精AI代码搜索。这些模型能快速呈现关联代码段,为Windsurf Fast Context子智能体提供核心动力,并通过高并行架构显著降低搜索延迟。
锐评:这次是给AI配了个“代码搜索引擎”,程序员的“工具箱”快被“一锅端”了。
9. 新闻:Facebook推出AI自动选片功能,帮助用户从相册中挑选最佳照片或视频以生成动态或帖子,有效简化了内容创作流程。
锐评:专治“选择困难症”,以后发圈终于不用纠结。
10. 新闻:针对AI内容泛滥的舆论反馈,Pinterest新增内容管控工具,允许用户在美容、艺术等特定板块限制生成式AI内容的显示,并强化了内容标签功能。这种用户主导的AI接触管理机制,值得其他社交媒体平台学习借鉴。
锐评:主打眼不见为净。
11. 新闻:谷歌为Gemini API引入“谷歌地图数据关联”(Grounding with Google Maps)功能,使模型可依托最新地理数据生成更准确的本地化回答。这一功能可与搜索引擎关联组合使用,进一步保障信息真实性,相关演示案例已在AI Studio开放测试。
锐评:Gemini接上“谷歌地图”,精准回答“附近有啥好吃的”。
12. 新闻:谷歌升级AI Studio,优化了开发者与用户体验。新版本推出集成Gemini、生成式媒体模型、语音合成与实时模型的统一工作台Playground,简化了模型切换流程并优化了聊天界面的一致性。
锐评:开发者少了来回切换的烦恼。
13. 新闻:针对通过API构建Claude智能体的开发者,AWS已经在Amazon Bedrock上集成了最新的Claude模型Opus 4.1、Sonnet 4.5、Haiku 4.5。其中Haiku 4.5的API定价为每百万输入/输出token 1/5美元。
锐评:云巨头的AI资源库主打一个“我全都要”。
14. 新闻:英伟达开始出货DGX Spark。这款桌面级AI超级工作站专为本地推理与原型开发设计,上市即售罄。LMSYS的独立评测列出了其规格与性能亮点:GPU(GB10)峰值性能达1 PFLOP(FP4张量),整体算力介于RTX 5070与5070 Ti之间;其革命性突破在于采用了128GB的统一内存架构,实现CPU与GPU内存池的无缝共享。这种统一架构使DGX Spark能直接加载运行大模型,彻底规避了系统内存与显存间的数据传输开销,让DGX Spark可运行的AI模型规模远超传统台式机。据悉,英伟达首席执行官黄仁勋在星舰第11次试飞前后,亲自向马斯克交付了DGX Spark。
锐评:算得上AI PC中的爱马仕。
15. 新闻:OpenAI CEO萨姆·奥特曼(Sam Altman)称将于今年12月份起放宽ChatGPT内容限制,向通过认证的成人用户开放成人向内容。此举旨在打造类似GPT-4o风格的可定制个性化体系,在保障安全的前提下实现不同年龄段用户的差异化服务。
锐评:兜兜转转还是没绕开人类本能。
三、AI研究资讯:从“解码癌症”到“掌控核聚变”,谷歌“炼丹”不止
1. 新闻:谷歌推出开源癌症变异分类模型DeepSomatic。它能精准区分遗传变异与体细胞变异,在复杂样本测试中表现超越现有方案。
锐评:AI在医学界又当起了显微镜和第二只眼。
2. 新闻:谷歌与耶鲁大学合作发布基于Gemma架构的癌症研究模型Cell2Sentence-Scale 27B。该模型基于超10亿token的转录组与生物数据训练,能将RNA序列信息表示为文本式“细胞句子”。研究人员运用C2S-Scale进行单细胞分析,成功识别出经湿实验验证的潜在癌症治疗路径。该研究的论文预印本与模型已经同步公开。
锐评:科研人员的解码器又升级了。
3. 新闻:谷歌DeepMind与Commonwealth Fusion Systems达成合作,通过深度学习实现等离子体控制以加速聚变能源研发。这一AI系统结合深度强化学习与TORAX模拟器,优化了等离子体控制与托卡马克装置的性能,推动清洁且无限的聚变能源迈向现实。
锐评:AI不只能看天象,还想造星。
四、AI商业与政策:大厂芯片狂飙,高盛高喊“继续投”
1. 新闻:OpenAI宣布与博通合作开发定制AI芯片。OpenAI负责加速器与系统架构设计,博通将于2026年下半年启动量产部署。该项目目标是实现10GW算力规模,为下一代前沿模型与大规模推理提供基础支撑。此次合作标志着OpenAI向开放基础设施战略转型,通过博通以太网技术多元化其计算架构,也凸显出AI专用芯片在推理阶段的重要性。
锐评:算力界又要有新玩家和新规则。
2. 新闻:英伟达透露Meta与Oracle将在AI数据中心网络标准化中采用Spectrum-X以太网架构,训练效率与扩展性是选择这一开放加速方案的主因。
锐评:老黄不仅卖“算力”,还要插手“网线”生意。
3. 新闻:苹果发布M5芯片,宣称峰值AI性能较M4提升4倍,专为下一代设备端AI负载打造。M5将率先用在新款MacBook Pro、iPad及Vision Pro上,预计数周内上市。
锐评:如果Siri还是那个智障,这4倍性能大概也只能用来P图。
4. 新闻:英特尔公布一款搭载160GB内存、具备高能效的数据中心GPU,并将其加入该公司的AI加速器组合,旨在推动英特尔以开放系统与软件架构为核心的新AI战略。这款GPU代号为“Crescent Island(新月岛)”,根据英特尔介绍,它专为运行推理工作负载的风冷企业级服务器而设计,强调“功耗与成本优化”。Crescent Island采用Xe3P微架构,配备160GB LPDDR5X内存,并支持多种数据类型,为大语言模型提供充足运行空间。
锐评:英特尔想用“性价比推理”从英伟达“虎口夺食”。
5. 新闻:Spotify与主流唱片公司达成协议,共同开发“负责任”的AI产品体系,确保持续尊重版权、保障艺术家收益,并为音乐人保留自主选择是否授权AI工具使用自己作品的权利。该公司还同步设立AI研究实验室,集中精力研发以艺术家权益为核心的技术方案。
锐评:Spotify先下手为强,拉着唱片公司“拜山头”。
6. 新闻:谷歌母公司Alphabet计划在印度南部投资超100亿美元,两年内于安得拉邦港口城市维沙卡帕特南建设一座1吉瓦级数据中心。这标志着谷歌在全球扩张战略中押注印度市场。
锐评:“三哥”的电网扛得住吗?
7. 新闻:中国工程院院刊《Engineering》评选的“2025全球十大工程成就”在“2025年世界工程组织联合会全体大会暨全球工程大会”上正式发布。其中英伟达Blackwell GPU架构和DeepSeek开源大语言模型上榜。
锐评:大厂技术上榜,当之无愧。
8. 新闻:苹果公司正进行重大战略调整:暂停开发更轻便、低价的Vision头显(内部代号或为“Vision Air”),将资源集中于智能眼镜的研发。据长期跟踪苹果动态的资深分析师马克·古尔曼(Mark Gurman)透露,在亲身体验了竞争对手Meta新推出的内置显示屏智能眼镜后,他确信苹果的这一转向是明智之举。
锐评:库克明白过来,没人想顶着个“滑雪镜”出门。
9. 新闻:近期AI领域的巨额资本开支引发了市场对其可持续性的担忧。高盛最新研报明确揭示,当前AI投资规模远未过热,这一投资水平具备可持续性,这意味着AI基础设施建设的宏观叙事依然稳健。该研究表示,AI相关投资占美国GDP的比例目前远低于历史上其他技术周期。
锐评:哪有泡沫?高盛说不存在的。
10. 新闻:中国互联网络信息中心(CNNIC)正式发布《生成式人工智能应用发展报告(2025)》。《报告》显示,截至2025年6月,我国生成式人工智能用户规模达5.15亿人,较2024年12月增长2.66亿人,用户规模半年翻番;普及率为36.5%。主要应用场景包括回答问题、日常办公、休闲娱乐、创作内容等。其中,利用生成式人工智能产品回答问题的用户最为广泛,达80.9%。
锐评:我国人工智能正在从“可用”走向“好用”、从“试用”走向“常用”。
11. 新闻:加州颁布AI在线安全法规,强制要求聊天机器人在与未成年人互动时明确披露AI身份。加州州长纽森签署了SB243法案,该法案规定,在用户可能误以为与人类对话的场景中,AI必须主动说明身份。此外,加州的《AI透明度法案》也将生效,主要规定了企业层面的合规义务。
锐评:加州要求“AI陪聊”也得“持证上岗”。
五、AI观点与文章:微软定义“人机协作”,你的同事可能不是人
新闻:微软AI业务首席营销官贾里德·斯帕塔罗(Jared Spataro)在《AI正在重塑商业》一文中,阐释了领先企业正迈向“人主导、AI驱动”的新组织形态。
他总结了三大趋势:
获取专业知识的成本骤降:“企业可快速部署基于产品、市场或专有知识的智能体,直接嵌入组织数据、系统与安全防护体系。”
人机协作带来的工作重构:“当数字员工融入各业务环节,组织从‘为人设计信息流程’转向‘为智能体优化执行效率’。”
知识复利效应:“智能体以人类系统无法企及的速度创造新型知识循环。”
斯帕塔罗早前发表的文章《CEO前沿企业建设指南》进一步阐释了AI为先的含义。这些论述共同勾勒出企业级AI应用引发的根本性组织变革图景,其预见性值得肯定。
锐评:说白了就是你的同事可能不是人,但老板一定还是人。(辰辰)