DeepSeek最新大模型V4下周上线?

2026-03-01 22:53 管理员
二维码
6545

DeepSeek最新大模型V4下周上线?

         知情人士:一款具备图片、视频和文本生成功能的多模态模型,为原生多模态架构,技术报告同步开放

济南日报

2026-03-01 19:16

济南日报报业集团

当地时间2月28日,据金融时报报道,DeepSeek将于下周发布其最新的大模型V4。

据两位知情人士透露,这是一款具备图片、视频和文本生成功能的多模态模型。在硬件适配方面,DeepSeek为国产算力提供深度支持,DeepSeek致力于优化V4模型以适配中国制造的芯片,此举有望提振中国市场对其半导体产品的需求,并加速AI模型“推理”环节靠拢本土芯片。

据一位直接了解相关计划的人士透露,DeepSeek预计在发布V4版本的同时,发布一份篇幅较短的技术说明,并在大约一个月后发布一份更全面的报告。

V4会有哪些亮点?

截至发稿,DeepSeek官方尚未对V4的任何信息进行正式回应或确认,所有信息均来媒体爆料,详细信息多集中在正在进行秘密测试的简化版本V4 Lite(精简版)上。

据《科创板日报》综合的消息,关于V4 Lite:

其代号为“sealion-lite”,拥有100万(1M)个tokens的上下文窗口,相比V3系列的128K有近8倍提升,理论上可一次处理如《三体》全集体量的长文本;为原生多模态架构,意味着模型从预训练阶段就将文本与视觉理解融合,而非后期拼接;V4 Lite参数规模估算为2000亿,有猜测完整版V4参数量可能突破1万亿;效果显著优于网页端/APP端模型;泄露的测试示例显示,V4 Lite能用极简代码(如54行)生成高质量的SVG图像(如Xbox手柄),在代码优化和视觉还原度上被认为超越DeepSeek V3.2、Claude Opus 4.6等,这暗示其空间推理和结构化输出能力的提升。宋子乔,公众号:财联社AI daily下周,DeepSeek V4或将上线

来源:科创板日报

编辑:狄海洲

责任编辑:吉颐

返回首页:回家
QQ咨询:548975566
微信客服
扫码咨询
投稿邮箱:投稿邮箱