HeyaoHua's Blog – Tag 强化学习

DeepSeek-R1 模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with DeepSeek, 大语言模型, 强化学习, MoE架构, 推理能力

DeepSeek-R1采用MoE架构，总参数671B，通过强化学习实现强大推理能力，在数学、编程等任务上媲美闭源模型。详解其技术架构、性能表现及应用场景。

Continue reading