IBM 推出Granite 3.2：全新企业级多模态及推理的AI模型

2025-03-05 10:30:18 IBM

• Granite 3.2是小型的 AI 模型，通过对开发人员友好的授权条款，提供推理、视觉和护栏功能
• 更新后的 Granite 时间序列模型可提供长期预测，参数少于10M；适用于金融与经济趋势分析、供应链需求预测，以及零售业的季节性库存规划等用例

IBM于2月底推出其 Granite 大型语言模型家族的最新一代产品 Granite 3.2，持续推动小型、高效、企业专用的 AI，为实际应用创造效益。

IBM 推出 Granite 3.2 大语言模型，体现 IBM 发展企业专用、小型、高效与实用 AI 的策略。

所有 Granite 3.2 模型均采用宽松的 Apache 2.0 开源授权条款，可在 Hugging Face 下载。部分模型现已在 IBM watsonx.ai、Ollama、Replicate 和 LM Studio 上提供，预计不久将支援 RHEL AI 1.5，为企业与开源社区注入更强大的 AI 能力。

主要亮点

• 全新视觉语言模型：专为理解文件任务而设计，在关键企业基准测试 DocVQA、ChartQA、AI2D 和 OCRBench[1] 中，表现可媲美甚至超越更大规模的模型（如 Llama 3.2 11B 和 Pixtral 12B）。除了强大的训练数据外，IBM 也利用其开源 Docling 工具包处理8千5百万份 PDF 文件，并生成2千6百万个合成问答配对，提升视觉语言模型在处理大量文件工作流时的能力。

• 增强推理功能：Granite 3.2的2B与8B模型加入了「思维链」（Chain of Thought，CoT）推理机制，且使用者可以开启或关闭推理功能以优化效率。通过这项能力，8B 模型在 ArenaHard 和 Alpaca Eval 等指令遵循基准测试中的表现[2]，比前一代优异比例达到两位数，且不影响其他领域的安全性或性能。此外，通过创新的推理扩展方法，Granite 3.2 8B 模型可以调整至接近 Claude 3.5 Sonnet 或 GPT-4o 在数学推理基准（如 AIME2024 和 MATH500[3]）上的表现。

• Granite Guardian 安全模型更轻巧：在保持 Granite 3.1 Guardian 模型性能的同时，模型尺寸减少三成。此外，Granite 3.2 系列还引入了语言化信心评估（Verbalized Confidence）新功能，可提供更精细的风险评估，帮助安全监测系统识别不确定性。

IBM 持续推动企业专用的小型 AI 模型策略，并已在测试中展现高效能。例如，Granite 3.1 8B 模型在 Salesforce 大型语言模型CRM基准测试中获得高分，显示其在实际应用中的准确度和可靠性。

IBM Granite 模型家族拥有广大的合作伙伴生态体系，许多领先的软件公司已将Granite模型嵌入其技术。Granite 3.2 是 IBM 在推动企业专用小型 AI 方面的重要进展，体现了 IBM 致力于提供小型、高效、实用 AI 的产品策略。

CrushBank 首席技术官 David Tan 表示："在 CrushBank，我们亲眼目睹了 IBM 开放、高效的人工智能模型如何为企业人工智能带来真正的价值--在性能、成本效益和可扩展性之间实现适当的平衡。Granite 3.2 通过新的推理功能更进一步，我们很高兴能在构建新的代理（智能体）解决方案时探索这些功能。"

Granite 3.2 是 IBM 产品组合和战略发展的重要一步，旨在为企业提供小型实用的 AI。虽然思维链在推理任务中表现强大，但它需要大量计算资源，并非所有任务都必须启用。因此，IBM 在 Granite 3.2 模型中加入了程式化开关功能，使用者可以根据需求开启或关闭推理模式；模型可在不启用推理的情况下运行较简单的任务，以降低不必要的计算成本。

此外，其他推理技术（例如推理扩展 Inference Scaling）已显示 Granite 3.2 8B 模型能够在标准数学推理基准测试中，媲美甚至超越更大模型的性能。持续发展这项推理技术也是 IBM 研究团队的重点方向[4]，以进一步提升 AI 的效能与应用范围。

除了 Granite 3.2 的指令、视觉和防护模型之外，IBM 也推出了新一代 TinyTimeMixers（TTM）时间序列模型，这些模型的参数少于1千万，具备长期预测能力，可进行长达两年的长期预测。这些模型为长期趋势分析提供强大工具，适用于金融与经济趋势分析、供应链需求预测，以及零售业的季节性库存规划。

IBM AI 研究副总裁 Sriram Raghavan 表示："AI 的下一个时代将聚焦效率、整合与实际应用的影响力 — 企业应该能够在不过度消耗计算资源的情境下，取得强大的 AI 效益。IBM 最新的 Granite 模型发展专注于开放式解决方案，逐步推动 AI 的普及，使其更具成本效益，为现代企业创造更大价值。"

欲了解Granite 3.2 的技术细节，请参阅相关技术文章。

关于IBM

IBM 是全球领先的混合云、人工智能及企业服务提供商，帮助超过 175 个国家和地区的客户，从其拥有的数据中获取商业洞察，简化业务流程，降低成本，并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000 家政府和企业实体依靠 IBM 混合云平台和 Red Hat OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。了解更多信息，请访问：https://www.ibm.com/cn-zh

[1] 视觉模型（Vision Model）的基准测试结果可在 IBM技术文章《IBM Granite 3.2：推理、视觉、预测与更多应用》（2025 年 2 月 26 日发布）中查阅。
[2] 指令模型（Instruct Model）的基准测试结果可在 IBM 技术文章《IBM Granite 3.2：推理、视觉、预测与更多应用》（2025 年 2 月 26 日发布）中查阅。
[3] 推理扩展（Inference Scaling）的基准测试结果可在 IBM技术研究部落格《Granite 3.2 中的推理：利用推理扩展技术》（2025 年 2 月 26 日发布）中查阅。
[4] 推理扩展技术在 Granite 3.2 中的应用，IBM 技术研究部落格，2025 年 2 月 26 日发布