DeepSeek发布V2模型：以GPT-4性能挑战市场，价格亲民引领开源AI新潮流

AI每日新闻2年前 (2024)发布 shen

2,274 0 0

近日，AI领域的开源先锋DeepSeek公司发布了其第二代MoE（Mixture of Experts）模型——DeepSeek-V2。这款新模型在性能上媲美GPT-4等顶尖闭源模型，同时以白菜般的价格提供了极具竞争力的成本效益，有望引领开源AI领域的新潮流。

DeepSeek-V2模型在发布后迅速崭露头角，其在主流模型评测榜单上的表现令人瞩目。无论是在中文综合能力（AlignBench）还是英文综合能力（MT-Bench）方面，DeepSeek-V2均取得了与顶尖闭源模型相媲美的成绩。此外，在知识、数学、推理、编程等专业榜单上，DeepSeek-V2也展现出了强大的竞争力，取得了领先位置。

这一卓越性能的取得，得益于DeepSeek-V2模型在架构和技术方面的创新。据了解，DeepSeek-V2采用了MLA（Multi-head Latent Attention）架构，这一架构在减少计算量和推理显存方面具有显著优势。同时，DeepSeek-V2还结合了自研的Sparse结构DeepSeekMoE，使得模型在保持高性能的同时，将计算量降至最低。这种创新性的设计使得DeepSeek-V2在实际部署中展现出极高的性价比。

DeepSeek-V2模型的性能优势不仅体现在评测结果上，更在实际应用中得到了充分体现。据悉，DeepSeek-V2以较低的显存消耗实现了高性能。在8卡H800机器上的测试中，DeepSeek-V2的输入吞吐量超过每秒10万tokens，输出超过每秒5万tokens。这意味着DeepSeek-V2在处理大规模数据和复杂任务时具有极高的效率和响应速度。 DeepSeek发布V2模型：以GPT-4性能挑战市场，价格亲民引领开源AI新潮流

更令人惊喜的是，DeepSeek-V2的API定价也极具竞争力。每百万tokens输入的定价仅为1元，输出为2元。这样的价格策略使得DeepSeek-V2在成本效益上远超过同类闭源模型，为用户提供了更加实惠和高效的选择。

DeepSeek公司秉持着开源精神，将DeepSeek-V2模型和相关论文完全开源，并允许免费商用。用户无需申请即可获取模型权重和技术报告。这一举措不仅降低了用户的使用门槛和成本，也促进了AI技术的普及和发展。

此外，DeepSeek还提供了对话官网和开放平台，方便用户与DeepSeek-V2模型进行互动和交流。用户可以在chat.deepseek.com上免费开启对话体验DeepSeek-V2的智能交互能力。同时，DeepSeek API开放平台也为用户提供了丰富的API接口和优惠政策，支持优质项目的发展。

AI旋风认为，DeepSeek-V2模型的发布不仅展示了DeepSeek公司在AI领域的技术实力和创新能力，也为整个开源AI领域带来了新的机遇和挑战。随着DeepSeek-V2模型的广泛应用和普及，我们有理由相信开源AI将在未来发挥更加重要的作用，推动AI技术的不断发展和进步。