DeepSeek-R1 模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with DeepSeek, 大语言模型, 强化学习, MoE架构, 推理能力

DeepSeek-R1采用MoE架构,总参数671B,通过强化学习实现强大推理能力,在数学、编程等任务上媲美闭源模型。详解其技术架构、性能表现及应用场景。


Continue reading