| | | |
| 轻量级基础模型(如 GPT-4.1 nano, LLaMA-3.2 1B) | | | 参数量小,适用于边缘计算与简单文本分类,展现极高的生态效率。 |
| 主流大语言模型(如 GPT-4o, Claude-3.7 Sonnet) | | 消耗电力相当于约3.5万个美国家庭的年用电量,蒸发淡水满足120万人饮水需求 | 采用高度优化的混合注意力机制与动态硬件调度。Claude-3.7具有当前最高的生态效率评分(0.886)。 |
| 高级推理与Agentic模型(如 o3, DeepSeek-R1) | | | 采用多步逻辑验证、思维链(Chain-of-Thought)技术,计算时间成倍拉长,能源密度极高。 |
| | | 涉及复杂的时空扩散模型(Diffusion)或三维张量的高频迭代运算,能源密集度居首位。 |