2026年4月24日,DeepSeek正式发布V4系列模型,包含V4-Pro(1.6万亿参数)和V4-Flash(2840亿参数)两个版本。核心突破在于将100万Token上下文设为默认标配,无需额外付费,这一能力在行业内尚属首次。超长上下文意味着可一次性处理完整代码仓库或长篇技术文档,为代码库理解、合同分析、论文梳理等场景提供质的飞跃。
同时,V4全面适配华为昇腾芯片,从芯片到框架、模型、应用,彻底摆脱对英伟达CUDA的依赖,标志着国产算力生态闭环正式成型。DeepSeek-V4-Pro以1.6万亿参数成为当前开源模型之冠,旗舰级API提供2.5折优惠至2026年5月31日。
来源:解放日报、东方财富网 | 2026年4月24日
OpenAI于4月下旬正式发布GPT-5.5模型,在编程、复杂任务规划和多工具协同方面实现突破性进展,已向付费用户开放。该模型采用全新稀疏混合架构,有效激活参数达2.3万亿,比GPT-5提升120%,但训练能耗降低40%,兼顾性能与效率。
关于下一代模型GPT-6,OpenAI总裁Greg Brockman在播客访谈中确认已进入发布倒计时,预计5月正式推送,核心升级是从"工具型AI"向"自主智能体"跨越,上下文窗口扩容至200万Token,将实现图文、视频、语音的一体化理解与交互。
来源:OpenAI官方、CSDN | 2026年4月下旬
4月20日,月之暗面正式发布Kimi K2.6并同步开源。在全球权威代码测试SWE-Bench Pro中,K2.6以58.6分的成绩登顶全球榜首,首次让国产开源模型站上软件工程领域世界之巅,碾压GPT-5.4的57.7分和Claude Opus 4.6的53.4分。
该模型支持300个智能体并行作业,可不间断编码13小时。国产开源模型首次在软件工程领域登顶全球,开发者可直接部署使用,有望成为编程辅助的首选国产模型。阿里Qwen3.6-Max-Preview同时在Artificial Analysis榜单中登顶最佳国产大模型。
来源:CSDN AI前沿资讯 | 2026年4月20日
2026年4月,中国AI大模型赛道迎来前所未有的"密集发布潮"。短短一个月内,月之暗面、阿里、腾讯、DeepSeek、字节跳动、小米、智谱AI等九家头部企业先后发布或升级各自的旗舰模型,形成"一周内数款旗舰接连亮相"的奇观。
阿里Qwen3.6-Max、Kimi K2.6、小米MiMo-V2.5-Pro、腾讯混元Hy3 preview、DeepSeek-V4等模型陆续发布。腾讯混元Hy3 preview成为姚顺雨加盟腾讯后的首款模型作品;智谱开源GLM-5.1在10万颗华为昇腾910B芯片上完成训练。国金证券指出,国产大模型能力持续进化,将深度带动AI及云产业链发展。
来源:东方财富网、国金证券 | 2026年4月
4月29日,英伟达发布新一代开源全模态模型Nemotron 3 Nano Omni,专为Agentic AI设计,让AI能够像人类一样"看听说做",被定位为企业级AI智能体的感官大脑。该模型将文本、图像、音频与视频统一到一个推理体系之中,在效率上实现跨越式提升,推理吞吐量可提高9倍。
硬件兼容方面,新模型深度优化了基于Hopper和Blackwell架构的FP8推理,同时兼容RTX 5090等消费级显卡。AI产业竞争正从"卷参数量"转向"卷Agent能力",科技巨头们推出更强模型的同时,更关键的是要让模型真正干活。
来源:东方财富网、英伟达官方 | 2026年4月29日
4月28日,工业和信息化部、国家数据局联合印发通知,正式启动2026年"模数共振"行动。该行动面向制造业领域20个重点行业,确定一批重点城市,探索场景、模型、智能体、数据集、案例等关键技术成果的产出路径,推动人工智能高水平赋能新型工业化。
同日,中国科学院发布"磐石100"模型体系,该体系将推动人工智能赋能科学研究从分散、封闭的单点探索,迈向协同高效的平台化创新,为各领域的前沿研究提供智能支撑。数据显示,我国AI企业数量已超过6200家,2025年人工智能核心产业规模超过1.2万亿元。
来源:工信部、中科院 | 2026年4月28日
本日报由AI自动整理生成,信息来源均为公开报道,仅供参考。