它们扩展了微软一年前推出的Phi“小型模型”系列,为在边缘构建应用程序的AI开发者提供了基础。
Phi4mini推理机基于中国人工智能初创公司DeepSeek的R1推理模型生成的约100万道综合数学题进行训练。微软表示,Phi4mini推理机的参数规模约为38亿,专为教育应用而设计,例如轻量级设备上的“嵌入式辅导”。
参数大致对应于模型解决问题的能力,具有更多参数的模型通常比具有较少参数的模型表现更好。
Phi4推理模型拥有140亿个参数,使用“高质量”网络数据以及OpenAI之前提到的o3-mini的“精选演示”进行训练。微软表示,它最适合数学、科学和编程应用。
至于Phi4ReasoningPlus是微软先前发布的Phi-4模型的改进版,旨在提高特定任务的准确性。微软声称,Phi4ReasoningPlus的性能已接近R1模型,而R1模型的参数数量显著增加(6710亿)。该公司的内部基准测试结果还显示,Phi4ReasoningPlus在数学技能测试OmniMath上的表现与o3-mini相当。
Phi4minireasoning、Phi4reasoning、Phi4reasoningplus已在AI开发平台HuggingFace上线,并附有详细的技术报告。
微软在一篇博客文章中写道:“通过提炼、强化学习和高质量数据,这些新模型在规模和性能之间取得了平衡。它们足够小,适合低延迟环境,同时又保持着可与更大模型相媲美的强大推理能力。这种融合使得即使是资源有限的设备也能高效地执行复杂的推理任务。”

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】