前戴尔EMC中国研究院院长创业:推出AI加速虚拟化平台

雷刚 发自 凹非寺
量子位 报道 | 公众号 qbitai
ai加速的尴尬现状,不知你是否有感受?
独占式方案,非虚拟化使用,成本高昂。缺少异构加速管理和调度,方案难度大,供应商还容易被锁定。
对于ai开发者而言,虚拟化使用加速器计算资源,现有调度和管理软件,并不亲民。
所以现在,几位虚拟化计算领域的专家,初步打造完成了一套解决方案并正式在github推出,面向开发者,免费下载和使用。
这就是刚上线的orionai计算平台。
ai加速器虚拟化整个orionai计算平台,包括ai加速器虚拟化软件,和异构加速器管理和调度软件等两大组件。
其中orionai加速器虚拟化软件,不仅支持用户使用和共享本地加速器资源,而且支持应用透明地使用远程加速器资源——无需修改代码。
从而打破资源调度的物理边界,构建更高效资源池。
异构加速器管理和调度软件,同样支持用户的应用无需修改代码,即可透明地运行在多种不同加速器之上。
最终,帮助用户更好利用多种不同加速器的优势,构建更高效的异构资源池。
刚上线的orionai计算平台社区版v1.0,支持英伟达gpu的虚拟化,供ai、互联网和公有云头部客户试用,开发者用户可免费下载和使用。
ai加速痛点orionai计算平台因何出发?
方案打造者称,随着ai技术的快速发展和普及,越来越多客户开始使用高性能的ai加速器,包括gpu, fpga和ai asic芯片等。
同时,越来越多的客户需要高效的ai加速器虚拟化软件,来提高加速器资源的利用率,以及高效的异构加速器管理和调度软件,来更好地利用多种不同的加速器,提高性能,降低成本,避免供应商锁定。
但相应地面临开头提及的两大痛点。
首先,ai加速器价格偏高。
以知名的英伟达v100 gpu为例,价格在8万元人民币左右,高性能fpga卡,价位也在5万元人民币。
其次,由于缺乏高效经济的ai加速器虚拟化解决方案,目前绝大部分企业,不得不独占式使用上述昂贵的加速器资源,导致资源利用率低,成本高。
根据aws在re:invent 2018披露数据,aws上gpu利用率只有10%~30%。
当物理机上只有一块gpu时,如果没有gpu虚拟化解决方案,用户就只能让一个虚拟机独占式地使用该gpu,导致该gpu无法被多个虚拟机共享。
于是几位加速虚拟化领域的老兵,决定试水,并最终推出了自己的方案:orionai计算平台v1.0。
方案详解该平台支持用户通过多个虚拟机或者容器,来共享本地以及远程gpu资源。
使用orionai平台的典型场景有:
第一,多个虚拟机或容器共享本地的gpu。
用户只需要将虚拟机或者容器中的cuda运行环境(cuda runtime),替换成orion运行环境(orion runtime)即可。
而用户的ai应用和所使用的深度学习框架(tensorflow,、pytorch等)不需要任何改变,即可像在原生的cuda运行环境下一样运行。
同时,用户需要在物理服务器上运行orion服务(orion server),该服务会接管物理gpu,并且将物理gpu虚拟化成多个orion vgpu。
用户在不同虚拟机上运行的ai应用会被分配到不同的orion vgpu上。这样物理gpu的利用率就会得到显著提升。
第二,多个虚拟机或容器共享远程的gpu。
用户可以将虚拟机/容器,运行在没有gpu的服务器上,ai应用无需修改,就可以通过orion runtime来使用另外一台服务器上的orion vgpu。
如此一来,用户的ai应用就可以被部署在数据中心中的任何一台服务器之上,用户的资源调配和管理,得到极大灵活性提升。
第三,单个虚拟机或容器,使用跨越多台物理服务器上的gpu。
用户的虚拟机/容器通过orion runtime,无需修改ai应用和框架,就可以使用跨越多台物理机上的gpu资源。
目前现状是,ai应用可能需要64个gpu——甚至更多gpu来训练模型,但是今天还没有一台物理服务器能够完全满足。
通过orion runtime,应用无需修改就可以直接使用多台物理服务器上的gpu,如16台服务器,每台4块gpu。
如此一来,用户gpu资源,就能变成一个真正的数据中心级的资源池。
用户的ai应用可以透明地使用任何一台服务器上的gpu资源,资源利用率和管理调度灵活度,可以得到极大提升。
用户通过orion ai platform分配的gpu资源,无论是本地gpu资源,还是远程gpu资源,均软件定义、按需分配。
这些资源不同于通过硬件虚拟化技术得到的资源,它们的分配和释放都能在瞬间完成,不需要重启虚拟机或者容器。
例如,当用户启动了一个虚拟机时,如果用户不需要运行ai应用,那么orion ai platform不会给这个虚拟机分配gpu资源。
当用户需要运行一个大型训练任务,例如需要16个orion vgpu,那么orion ai platform会瞬间给该虚拟机分配16个orion vgpu。
当用户完成训练后,又只需要1个orion vgpu来做推理,那么orion ai platform又能瞬间释放15个orion vgpu。
值得一提的是,所有上述的资源分配和释放都不需要虚拟机重启。
技术细节和benchmark上述方案背后,究竟是怎样的技术细节?
实际上,orion runtime提供了和cuda runtime完全兼容的api接口,保证用户的应用无需修改即能运行。
orion runtime在得到用户所有对cuda runtime的调用之后,将这些调用发送给orion server。
orion server会将这些调用加载到物理gpu上去运行,然后再将结果返回给orion runtime。
orionai计算平台v1.0也公布了性能对比结果。
先看配置:
gpu服务器配置:双路intel xeon gold 6132,128gb内存,单块nvidia tesla p40。
性能测试集:tensorflow v1.12, 官方benchmark,无代码修改,测试使用synthetic数据。
“native gpu”为将性能测试运行在物理gpu之上,不使用虚拟机或者容器;
“orion local container”为将性能测试运行在安装了orion runtime的容器之中,orion server运行在同一台物理机之上;
“orion local kvm”为将性能测试运行在安装了orion runtime的kvm虚拟机之中,orion server运行在同一台物理机之上;
“orion remote – 25g rdma”为性能测试运行在一台没有gpu的物理机之上,orion server运行在有gpu的物理机之上,两台物理机通过25g rdma网卡连接。
最终对比结果如下:
通过数据可以看出,和跑在物理gpu上相比,orion runtime和orion server引入的性能损失非常小。
尤其是在通过网络连接来使用远程的gpu的情况下,orionai计算平台通过大量的优化,使其性能与使用本机gpu相比差距非常小。
orionai计算平台打造方最后,介绍下orionai计算平台背后的打造方:
趋动科技 virtai tech。
2019年1月刚创立,主打ai加速器虚拟化软件,以及异构ai加速器管理和调度软件。
主要创始人有三位,皆为该领域的资深老兵。
王鲲,趋动科技ceo。博士毕业于中国科学技术大学计算机系。
在创办趋动科技之前,王鲲博士供职于dell emc中国研究院,任研究院院长,负责管理和领导dell emc在大中华区的所有研究团队。
他长期从事计算机体系结构,gpu和fpga虚拟化,分布式系统等领域的研究工作,在业界最早开始推动fpga虚拟化相关研究,在该领域拥有十多年的工作经验和积累。
陈飞,趋动科技cto。博士毕业于中国科学院计算技术研究所。
在创立趋动科技之前,陈飞博士供职于dell emc,担任dell emc中国研究院首席科学家,长期从事高性能计算,计算机体系结构,gpu和fpga虚拟化等领域的研究工作。
邹懋,趋动科技首席架构师。博士毕业于中国科学技术大学。
在创立趋动科技之前,邹懋博士供职于dell emc,担任dell emc中国研究院高级研究员,长期从事计算机体系结构,gpu虚拟化等领域的研究工作。
传送门orionai计算平台社区正式版v1.0:
官网:/virtaitech/orion
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(qbitai)对话界面,回复“招聘”两个字。
量子位 qbitai · 头条号签约作者
追踪ai技术和产品新动态


绍兴哪些公司可以做同声传译?同声传译租赁价格多少钱?
永裕竹地板
天下仓(图) 泡打粉生产厂家 泡打粉
济南木工布袋除尘器厂家浅谈布袋除尘器各部件维护方法与特点
日本AND单点式称重传感器LCB03-K003M
前戴尔EMC中国研究院院长创业:推出AI加速虚拟化平台
供应 新世界牌燃气双盘布拉肠粉炉 传统粤式两盘肠粉蒸炉/厨具
广东工厂专用炒菜机哪家技术领先?服务周到?
对软文写作和发布的一些基本的软文要求
菜户营暑假吉他班-红橘子音乐培训中心
开个五十平左右的小百货店要多少钱
嘉善工厂饭堂承包协议|嘉善食堂承包服务
珠宝店面装修设计
小精灵有人用过吗,都包含了哪些功能
个股期权系统搭建价格 个股期权系统平台
3日汽车精选:约150马力,续航超200km,纯电本田Honda E来啦,比小蚂蚁强多少
在雨季潮湿环境使用板框式压滤机注意事项
意大利ELTAR意尔创增量旋转编码器经销
厂家供应 洗果机毛刷辊 小滚刷 圆盘式毛刷
电玩城垃圾桶批发青蓝畅销产业园果皮箱户外优质钢木垃圾桶