
4月24日,市集期待已久的DeepSeek-V4模子预览版追究发布。新模子撑握百万token(词元)超长凹凸文,DeepSeek称其在智能体智商、寰宇常识和推感性能上均兑现国内与开源领域的率先。
按参数规模不同,DeepSeek-V4系列分为DeepSeek-V4-Pro和DeepSeek-V4-Flash两个版块。前者的总参数目达1.6万亿、激活参数为490亿;后者的总参数目为2840亿,激活参数为130亿。
开元棋牌官方网站入口尽管轻量版DeepSeek-V4-Flash的参数目更小,但推明智商接近DeepSeek-V4-Pro,在驱动智能体通俗任务上与DeepSeek-V4-Pro旗饱读十分,但在高难度任务中仍有差距。官方称DeepSeek-V4-Flash主打性价比,约略提供愈加速捷和经济的API劳动。
手艺线路指出,DeepSeek-V4系列在长凹凸文场景中具有极高的恶果。和上一代DeepSeek-V3.2模子比较,DeepSeek-V4-Pro大幅裁减了对磋商和显存的需求。在100万凹凸文培育下,DeepSeek-V4-Pro的单token推理磋研究仅为DeepSeek-V3.2的27%,KV缓存(一种加速模子推理生成的机制)仅为其10%。DeepSeek称这收获于一种全新的安宁力机制磋商。
“这使咱们约略在本色诈欺中褂讪撑握百万级凹凸文,从而使永劫序任务愈加可行。”手艺线路写说念。
具体性能发达上,手艺线路领悟,DeepSeek-V4-Pro-Max(即DeepSeek-V4-Pro的最大推理强度时势)的智能体智商与月之暗面Kimi-K2.6和智谱GLM-5.1等率先的开源模子发达十分,九游体育世界杯中国官网首页但略逊于顶级闭源模子。在里面评估中,DeepSeek-V4-Pro-Max非常Anthropic的Claude Sonnet 4.5,并接近其2025年11月推出的Opus 4.5的水平。
常识智商方面,DeepSeek-V4-Pro-Max在多个测试基准上显赫优于率先的开源模子,仍逾期于谷歌旗下的顶尖闭源模子Gemini-3.1-Pro,不外差距已显赫平缓。
推感性能上,DeepSeek-V4-Pro-Max展现出优于GPT-5.2和Gemini-3.0-Pro的发达,但仍略低于GPT-5.4和Gemini-3.1-Pro。手艺线路称这标明其发展水平梗概逾期刻下起头进前沿模子约3至6个月。
DeepSeek未在手艺线路中指出新模子预教练所使用的具体芯片型号和规模。而在DeepSeek-V3的手艺线路中,曾裸露该模子教练仅使用了2048块英伟达H800 GPU。
不外,华为方面在DeepSeek-V4模子发布后默示,华为昇腾芯片一直同步撑握DeepSeek系列模子,本次通过两边芯模手艺深沉协同,兑现昇腾超节点全系列产物撑握DeepSeek-V4系列模子。华为称,昇腾950超节点能兑现高蒙眬、低时延的DeepSeek-V4模子推理部署。
DeepSeek-V4模子的发布,恰恰DeepSeek公司被曝初次对外融资之际。据科技媒体The Information报说念,腾讯和阿里巴巴正在洽谈投资DeepSeek,估值跳动200亿好意思元。腾讯和阿里对此未公开讲演。
采写:南齐N视频记者 杨柳九游·体育世界杯(中国)官方网站

备案号: