HeyaoHua's Blog

Llama 3.2 系列模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with Llama, Meta, 轻量化模型, 多模态, 边缘计算

核心结论： Llama 3.2 通过 1B/3B 的轻量级文本模型及 11B/90B 的视觉多模态模型组合，实现了在边缘设备与视觉理解场景的出色性能；同时保持 128K 超长上下文，适用于对话、摘要、检索与图文分析任务。主要不足在于图像分辨率与输出长度限制，以及需要额外整合系统级安全与治理机制。

一、模型概览

Llama 3.2 系列包含：

文本模型：1B 与 3B 参数，优化用于多语言对话、指令跟随、摘要与工具调用；
视觉模型：11B …

Llama 3.1 系列模型详解

Posted on Mon 08 September 2025 in 人工智能 • Tagged with Llama, Meta, 开源模型, 长上下文, 多语言支持

核心结论： Llama 3.1 以超长上下文（128K）、开源多规模覆盖（8B/70B/405B）与多语言能力为主要特征，在通用知识、长文档理解、编码与多语言对话等场景中表现出色；但高端规模推理成本高、专业领域深度略逊，以及安全防护需自行完善。

一、模型概览

Llama 3.1 包括三种指令调优规模：

8B：4.9 GB，128K 文本上下文；
70B：43 GB，128K 文本上下文；
405B：243 GB，128K 文本上下文。

均使用 Grouped-Query Attention (GQA) 优化，支持多语言输入（8 种主要语言），可本地 …