350vip浦京(China)集团有限公司·官方网站

行业描述

自动驾驶是一种使用计算机技术和传感器等设备使汽车或其他交通工具能够在没有人类司机干预的情况下自主驾驶的技术。基本原理是通过传感器（如激光雷达、摄像头、雷达等）实时感知识别车辆及周边环境（道路、交通标志、障碍物和其他交通参与者）等情况，再通过智能系统进行规划决策，最后通过控制系统执行驾驶操作。

自动驾驶实现的过程，简单的来说是从感知、决策到执行，整个过程的实现对于人工智能（AI）/机器学习（ML）有着很深的应用和依赖。因此，自动驾驶发展的瓶颈主要在于这些AI算法模型上的突破。为了找到最佳的AI算法模型，算法工程师需要不断地调整超参数，对每天的路测数据进行处理，反复训练优化自动驾驶模型，并进行大量验证测试工作，以迭代出更准确的算法，这些工作的背后需要大量算力资源（GPU资源）。

自动驾驶训练带来的挑战

训练一个自动驾驶方案依赖大量的真实数据，数据采集车配备多个传感器进行数据采集，并将采集到的数据传输到深度学习GPU集群用于训练、学习以构建更智能的驾驶决策算法。数据采集车通常使用6-10个摄像头、4-6个雷达和2-4个激光雷达，它们都有不同的分辨率和距离范围，保守估算，一辆测试车每天产生的数据量可达 10 TB。

更大规模的数据集与更短的训练时间的诉求，仅依靠单张 GPU、甚至单台 GPU 服务器已经无法满足自动驾驶 AI 训练的要求，多机多卡 GPU 计算集群成为必然选择。

另外，AI模型越庞大，模型参数越多，训练过程中的通信消耗也越大。一些大型 AI 模型的训练过程中，通信时间消耗占比已经超过 50%。在优化端到端的性能时，我们既需要考虑服务器内部的通信，也需要优化服务器外部的通信。

解决方案介绍

针对训练过程中对算力以及通信带宽的需求，350vip浦京集团官网推出基于Intel 第三代至强可扩展处理器的8卡Nvlink算力平台组合，提供强大计算能力以及高速互联速度，为自动驾驶AI模型的训练提供强大算力底座。

- 卓越性能提供强劲算力：

• 支持2颗第三代至强可扩展处理器，最高支持80核心，计算性能强劲，3UPI互联，总线带宽高11.2 GT/s

• 支持32个DDR4 3200MHz内存插槽，总共16个内存通道，最大可支持内存容量高达8TB，内存带宽相比较上一代提升45%

- 全面支持PCIe 4.0，传输速率提升100%

• 支持全新NVLink技术连接HGX A800 8-GPU模组，GPU通过NVSWITCH实现高达400GB/s的互联速度，AI算力超群，支持多实例 GPU 特性，极大提升 AI资源利用率，集 AI 训练、AI 推理、数据分析本领于一身

- 优秀的通信互联速度，提升算力利用率

• 内部GPU-GPU通信互联速度高达400GB/s

• 机器支持8个2.5寸 U.2 NVME 硬盘位，可用于存储预训练数据集，通过PCIe Switch将NVMe SSD里的数据直接读取到GPU显存里，提升喂数据的速度

• 8个PCIe Gen4 x16插槽可配备200G网卡设备实现高性能、低时延的互联网络部署，搭建高速AI集群，完成海量的并发在线数据处理

客户收益

350vip浦京集团官网的这套硬件方案，可以帮助客户根据需求灵活部署HOST+GPU BOX 的GPU算力集群，加速模型训练，给汽车自动驾驶研发、训练的过程提供强大算力支撑，帮助深度学习的研发人员更快的训练出成熟的模型；另外，NVIDIA强大的软件生态环境支持，成熟的 CUDA、cuDNN 及 DIGITS 等工具，都可以帮助研发人员更加得心应。