Phi-3 系列模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with Phi-3, Microsoft, 轻量化模型, 长上下文, 边缘计算

核心结论: Phi-3 系列以轻量化高效推理为核心,通过 3B(Mini)与 14B(Medium)两个规模覆盖边缘到中型部署场景,在数学与逻辑推理长上下文理解代码辅助任务上表现优异;其多阶段训练(合成+公开语料+DPO 微调)确保指令遵循与安全性,但在多语言专业领域知识覆盖方面尚需检索增强与微调补强。

一、模型概览

Phi-3 系列包括:

  • Phi-3 Mini(3.8B 参数,4k/128K 上下文,2.2 GB,MIT 许可)
  • Phi-3 Medium(14B 参数,4k/128K 上下文,量化后约 …

Continue reading

Llama 3.2 系列模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with Llama, Meta, 轻量化模型, 多模态, 边缘计算

核心结论: Llama 3.2 通过 1B/3B 的轻量级文本模型及 11B/90B 的视觉多模态模型组合,实现了在边缘设备视觉理解场景的出色性能;同时保持 128K 超长上下文,适用于对话、摘要、检索图文分析任务。主要不足在于图像分辨率与输出长度限制,以及需要额外整合系统级安全与治理机制。

一、模型概览

Llama 3.2 系列包含:

  • 文本模型:1B 与 3B 参数,优化用于多语言对话、指令跟随、摘要与工具调用;
  • 视觉模型:11B …

Continue reading