DeepSeek全新系列模型的预览版本已正式上线并同步开源,包含deepseek-v4-pro和deepseek-v4-flash两个版本,二者均支持1M超长上下文。其中,V4-Pro在Agent编码、世界知识与推理性能方面可与顶级闭源模型相媲美;V4-Flash则以更低成本提供接近的推理能力。该系列模型采用全新注意力机制与DSA稀疏注意力技术,显著降低了长上下文场景下的计算与显存开销。
DeepSeek全新系列模型的预览版本已正式上线并同步开源,包含deepseek-v4-pro和deepseek-v4-flash两个版本,二者均支持1M超长上下文。其中,V4-Pro在Agent编码、世界知识与推理性能方面可与顶级闭源模型相媲美;V4-Flash则以更低成本提供接近的推理能力。该系列模型采用全新注意力机制与DSA稀疏注意力技术,显著降低了长上下文场景下的计算与显存开销。