NVIDIA出利器,极大推进超大数据中心人工智能推理
2017年9月26日— NVIDIA公司(纳斯达克代码:NVDA) 今日推出全新NVIDIA TensorRT 3 AI推理软件,该软件能够大幅提升从云端至终端设备(包括无人驾驶汽车和机器人)的推理性能并降低成本。
TensorRT 3与NVIDIA GPU的结合能够基于所有的框架、为诸如图像和语音识别、自然语言处理、视觉搜索和个性化建议等人工智能服务2提供超快速且高效的推理。此外,TensorRT和NVIDIA Tesla GPU加速器的速度可达到CPU的40倍,而相较于基于CPU的解决方案,成本仅为其十分之一。
NVIDIA创始人兼首席执行官黄仁勋先生表示:“互联网公司正在加快脚步将人工智能注入被数十亿用户所采用的服务之中。因此,AI推理工作量也呈指数级增长。NVIDIA TensorRT是全球首款可编程推理加速器。借助CUDA的可编程性,TensorRT将能够加速助推深度神经网络日益多样化、复杂的增长趋势。通过TensorRT的大幅度加速,服务提供商能够以经济实惠的成本部署这些计算密集型人工智能工作负载。“
已经有超过1,200家来自各行各业的公司开始采用NVIDIA推理平台,借助此从数据中获得全新洞察,并为企业和消费者部署智能服务。亚马逊、微软、Facebook和谷歌、以及阿里巴巴、百度、科大讯飞、京东、腾讯等中国领先企业均已开始采用NVIDIA推理平台。
SAP首席信息官Juergen Mueller表示:“NVIDIA公司的人工智能平台在Tesla GPU基础上使用了TensorRT软件,这一前沿的领先技术满足了SAP不断增长的推理需求。TensorRT和NVIDIA GPU可实现实时的服务交付,具有最强大的机器学习性能和多功能性,能够满足客户所需。”
京东人工智能和大数据部门总监Andy Chen表示:“京东采用NVIDIA GPU和软件在数据中心内开展推理工作。通过采用NVIDIA的Tesla GPU和TensorRT,我们能够同时针对1,000个高清视频流进行实时推理,而服务器数量则减少至原来的二十分之一。NVIDIA的深度学习平台为京东带来了卓越的性能与效率。”
TensorRT 3是一款针对人工智能应用生产部署的高性能优化编译器和运行时引擎,用于在生产环境中部署深度学习程序。它能够快速优化、验证并部署经过训练的神经网络,从而在超大型数据中心、嵌入式GPU或车用GPU平台上开展推理工作。
它能够确保高度精确的INT8和FP16网络执行,每年能为数据中心运营商节省数以百万美元计的采购和用电成本。借助它,开发者只需短短一天就能完成神经网络的训练,打造一个比其训练框架快3至5倍的可部署推理解决方案。
为进一步加速人工智能发展,NVIDIA还推出了其他软件,其中包括:
DeepStream SDK:NVIDIA DeepStream SDK能够大规模提供实时、低延迟的视频分析。它能够帮助开发者集成先进的视频推理能力(包括INT8精度和GPU加速转码),为采用人工智能的服务提供支持,例如使用单一Tesla P4 GPU加速器,对多达30个高清流进行实时物体分类和场景解析。
CUDA 9:NVIDIA加速计算软件平台CUDA的最新版本。该版本支持NVIDIA Volta架构,库的速度提高了5倍,为线程管理提供了新的编程模型,并且更新了调试和分析工具,能够为HPC和深度学习应用程序提供加速。CUDA 9专门进行了优化,能够在采用Tesla V100 GPU加速器时提供最大性能。
数据中心推理
数据中心管理者需要持续权衡性能和效率,从而确保服务器群能够处于最高生产力状态。Tesla GPU加速的服务器能够代替超过一百个超大规模CPU服务器来运行深度学习推理应用程序和服务,从而节省宝贵的机架空间、降低能耗和冷却需求,实现高达90%的成本降幅。
NVIDIA Tesla GPU加速器可提供出色的推理解决方案,为深度学习推理工作负载实现最高的吞吐量、最佳的效率和最低的延迟,借助人工智能驱动全新的人工智能体验。
针对无人驾驶汽车和嵌入式应用程序的推理
借助NVIDIA的统一架构,所有深度学习框架中的深度神经网络均可通过数据中心内的NVIDIA DGX?系统进行训练,然后部署至包括机器人和无人驾驶汽车在内的各类设备之中,在终端实现实时推理。
北京图森未来科技有限公司是一家开发无人驾驶卡车技术的初创公司。该公司在实现TensorRT优化后,推理性能提高了30%。今年6月,通过采用NVIDIA GPU和摄像机作为主要传感器,该公司成功完成从圣迭戈到亚利桑那州尤马长达170英里的L4级试车。借助由TensorRT带来的性能提升,图森未来得以分析更多摄像头数据,并在无人驾驶卡车上添加全新的人工智能算法,且这一切不会对响应速度造成任何影响。
- “我来,定未来”戴尔及ALIENWARE创新日 新品发布体验会领航未来PC
- 爱立信携手VMware助力通信服务供应商简化网络虚拟化
- 戴尔易安信全新Isilon和ClarityNow解决方案帮助企业应对非结构化数据的爆炸性增长
- STRATASYS携最新3D打印解决方案和高级新型材料亮相2019年TCT亚洲展
- VMware助力上海海事大学实现软件定义的数据中心转型
- 怒放数能,希捷携手IDC洞悉从边缘到核心的数据价值
- 推进医保信息互联网化,浪潮云海平台助力四川人社实现“异地结算”
- Pure Storage任命Matthew Oostveen为亚太及日本区首席技术官
- 无线网络的坚强后盾:交换机和强大的Wi-Fi部署
加入QQ群:(提醒:凡申请加入以上渠道通QQ群,均需在本站注册,请点击注册)
渠道通-联想群:117205670 | 渠道通-戴尔群:112430771 | 渠道通-宏碁群:6625353 | 渠道通-海尔群:115302265 | 渠道通-惠普群:111381215 | 渠道通-IBM群:1629702 | 渠道通-安全产品群:58140986 | 渠道通-网络产品群:61051835 | 渠道通-软件群:118964322 | 渠道通-外设群:118964424 | 渠道通-服务器&存储群:118964583 | 渠道通-方案商群:41022546 | 渠道通-云计算群:189156280 | 渠道通-苹果群:189159338 | 渠道通-思科群:245502592