专注机械器材研发制造

打造机械器材行业领军品牌

AI计算方案优化GPU使用|模型切换效率提升全攻略
当前位置: 主页 > 技术

AI计算方案优化GPU使用|模型切换效率提升全攻略

  • 发表时间:2026-04-21 05:20:40
  • 来源:
  • 人气:
摘要通过组件复用、显存精细化管理和KV缓存同步优化等全栈技术,Aegaeon将模型切换开销降低了97%,确保了token级调度的实时性,可支持亚秒级的模型切换响应。
  【机床商务网栏目 科技动态】10月21日消息,在近日于韩国首尔举办的顶级学术会议SOSP 2025(操作系统原理研讨会)上,阿里云发布了其“Aegaeon”计算池化解决方案。
 
  Aegaeon方案的核心在于解决AI模型服务中普遍存在的GPU资源浪费问题,尤其针对那些需求突发或不可预测的大型语言模型。
 
  它打破了传统的“一个模型绑定一个GPU”的低效模式,而是在Token级别虚拟化GPU访问,这意味着单个GPU可以被多个不同模型共享服务,实现精细化的资源调度。
 
  阿里云Aegaeon系统作为一种推理时间调度器,它能在每次生成下一个token后,动态决定是否切换模型,从而将微小的工作片段安排到共享池中。
 
  通过组件复用、显存精细化管理和KV缓存同步优化等全栈技术,Aegaeon将模型切换开销降低了97%,确保了token级调度的实时性,可支持亚秒级的模型切换响应。
 
  在阿里云模型市场为期超三个月的Beta测试中,Aegaeon系统在服务数十个参数量高达720亿的大模型时,所需的NVIDIA H20 GPU数量从1192个锐减至213个,削减比例高达82%。
 
  GPU用量的大幅削减,对于硬件采购成本高昂的大型模型服务商而言,意味着成本将显著降低。
 
  目前,这项核心技术已成功应用在阿里云百炼平台。

AI计算方案优化GPU使用|模型切换效率提升全攻略

推荐产品

  • AI计算方案优化GPU使用|模型切换效率提升全攻略 徐工 XC956 装载机
    重要参数 详细参数>> 额定载重量:5300 kg 额定功率:170 kw/rpm 整机操作重量:17100±300 kg 最大-卸载高度:3420 mm 1. 高效节能:徐工XC956装载机采用了燃
  • AI计算方案优化GPU使用|模型切换效率提升全攻略 徐工 XC965 装载机
    重要参数 详细参数>> 额定载重量:6000 kg 额定功率:178 kw/rpm 整机操作重量:18570±300 kg 最大-卸载高度:3400 mm 1. 引领行业技术水平:徐工XC965装载机
  • AI计算方案优化GPU使用|模型切换效率提升全攻略 徐工 LW300FM 装载机
    重要参数 详细参数>> 额定载重量:3000 kg 额定功率:92 kw/rpm 整机操作重量:8900 kg 最大-卸载高度:3200 mm 1. 高效性能:徐工LW300FM装载机搭载优化后的动力
  • AI计算方案优化GPU使用|模型切换效率提升全攻略 徐工 LW500FV-GIV 装载机
    重要参数 详细参数>> 额定载重量:5000 kg 额定功率:170 kw/rpm 整机操作重量:17000±300 kg 最大-卸载高度:3460 mm 1. 高效节能:搭载国Ⅳ发动机,具有高功率和

技术