随着人工智能的不断发展,深度学习的训练模型越来越庞大和复杂,训练模型对算力的需求也在快速增长。
云上ai训练已经被越来越多的开发者接受。为了让开发者第一时间享受到最新款的算力,近日,阿里云异构计算宣布推出gn7 gpu系列云服务器。这也是国内首款应用nvidia a100 gpu的商业化云服务器。
gn7系列实例是阿里云新一代gpu计算实例,主要面向ai训练和高性能计算应用。该产品基于nvidia a100 tensor core gpu打造,云服务器中的8块a100 gpu以nvidia nvswitch实现了gpu之间的nvlink直接通信。
结合最新支持的tensor core加速能力,阿里云gn7云服务器最高可让ai最佳性能提升20倍,高性能计算速度提升2.5倍,单卡最高支持19.5tflops(fp64)、156tflops (tf32)、312 tflops(fp16 混合精度)的运算。对于大模型训练的场景,阿里云自研的神龙ai加速引擎aiacc可以通过优化多gpu训练通信效率,进一步提升多gpu和多机并行训练的加速比,为ai研发过程节省更多的时间和成本。
第一批上线的产品为效率最高的阿里云神龙裸金属实例ebmgn7, 用户可直接获得一台完整的配置有intel 2代xeon scalable 52核cpu、768g系统内存和由 nvswitch互联的8颗a100 的gpu服务器主机。?
随着人工智能的不断发展,深度学习的训练模型越来越庞大和复杂,训练模型需要的算力也在快速增长。针对ai训练和高性能计算的算力需求,nvidia于今年5月推出了 a100 gpu。nvidia a100 gpu基于最新nvidia 安培(ampere)架构,不仅通过制程优化提升了计算性能,同时优化了计算架构,其第三代tensor core可以对单精度及双精度进行加速,大幅提升了整体计算性能。
阿里云gn7系列云服务器上线,意味着各大企业可以立即开始使用最新一代的gpu的强大算力。该系列实例适合深度学习场景,如图像识别、无人驾驶、语音识别等人工智能算法的训练应用;也适用于诸如计算流体动力学、计算金融学、分子动力学、环境分析等gpu加速的高性能计算场景。
云是获取ai算力最为便捷的方式,相较于自行购买服务器,用户可以按需要随时购买gpu实例资源,训练和推理任务结束时,自动释放/停止gpu实例资源。阿里云拥有亚洲最大的异构计算集群,加上秒级交付的弹性能力,为行业提供强大的ai算力。
针对人工智能场景,阿里云异构计算提供了软硬一体性能优化方案,自研的飞天ai加速器(aiacc)是业界首个支持tensorflow、pytorch、mxnet、caffe等主流开源框架的深度学习加速引擎,它针对训练场景和推理场景,结合阿里云的网络和异构计算架构作了优化,云上训练有2-14倍的性能提升,推理场景下性能提升2-6倍。
阿里云异构计算产品大图
前不久,阿里云异构计算也推出了独有的cgpu容器技术和弹性加速计算实例(eais),与神龙ai加速引擎(aiacc)一起组成阿里云异构计算的三大特色优势,为用户提供灵活高效、性能超群的异构计算基础设施。
云计算在新时代不再是威胁,而是巨大的机会有个域名备案即将被取消,会影响同一主体下的另一个备案网站吗云服务器ecs怎么和域名在一起商标保护期限是多少年便宜印度云服务器自建服务器云主机哪个费用低一点啊阿里云虚拟机搭建网站服务器搭建为什么要注册企业域名 企业域名注册对商务的重要性