欢迎访问电脑商情在线! 请免费注册
分享到





位置:首页 > 服务器 > 业界资讯

NVIDIA出利器,极大推进超大数据中心人工智能推理

作者: CBINEWS编辑   责任编辑:李丽 2017-09-26 13:53:21
来源:电脑商情网关键字:NVIDIA, TensorRT 3 ,AI推理软件,人工智能,无人驾驶

2017年9月26日— NVIDIA公司(纳斯达克代码:NVDA) 今日推出全新NVIDIA TensorRT 3 AI推理软件,该软件能够大幅提升从云端至终端设备(包括无人驾驶汽车和机器人)的推理性能并降低成本。

TensorRT 3与NVIDIA GPU的结合能够基于所有的框架、为诸如图像和语音识别、自然语言处理、视觉搜索和个性化建议等人工智能服务2提供超快速且高效的推理。此外,TensorRT和NVIDIA Tesla GPU加速器的速度可达到CPU的40倍,而相较于基于CPU的解决方案,成本仅为其十分之一。

NVIDIA创始人兼首席执行官黄仁勋先生表示:“互联网公司正在加快脚步将人工智能注入被数十亿用户所采用的服务之中。因此,AI推理工作量也呈指数级增长。NVIDIA TensorRT是全球首款可编程推理加速器。借助CUDA的可编程性,TensorRT将能够加速助推深度神经网络日益多样化、复杂的增长趋势。通过TensorRT的大幅度加速,服务提供商能够以经济实惠的成本部署这些计算密集型人工智能工作负载。“

已经有超过1,200家来自各行各业的公司开始采用NVIDIA推理平台,借助此从数据中获得全新洞察,并为企业和消费者部署智能服务。亚马逊、微软、Facebook和谷歌、以及阿里巴巴、百度、科大讯飞、京东、腾讯等中国领先企业均已开始采用NVIDIA推理平台。

SAP首席信息官Juergen Mueller表示:“NVIDIA公司的人工智能平台在Tesla GPU基础上使用了TensorRT软件,这一前沿的领先技术满足了SAP不断增长的推理需求。TensorRT和NVIDIA GPU可实现实时的服务交付,具有最强大的机器学习性能和多功能性,能够满足客户所需。”

京东人工智能和大数据部门总监Andy Chen表示:“京东采用NVIDIA GPU和软件在数据中心内开展推理工作。通过采用NVIDIA的Tesla GPU和TensorRT,我们能够同时针对1,000个高清视频流进行实时推理,而服务器数量则减少至原来的二十分之一。NVIDIA的深度学习平台为京东带来了卓越的性能与效率。”

TensorRT 3是一款针对人工智能应用生产部署的高性能优化编译器和运行时引擎,用于在生产环境中部署深度学习程序。它能够快速优化、验证并部署经过训练的神经网络,从而在超大型数据中心、嵌入式GPU或车用GPU平台上开展推理工作。

它能够确保高度精确的INT8和FP16网络执行,每年能为数据中心运营商节省数以百万美元计的采购和用电成本。借助它,开发者只需短短一天就能完成神经网络的训练,打造一个比其训练框架快3至5倍的可部署推理解决方案。

为进一步加速人工智能发展,NVIDIA还推出了其他软件,其中包括:

DeepStream SDK:NVIDIA DeepStream SDK能够大规模提供实时、低延迟的视频分析。它能够帮助开发者集成先进的视频推理能力(包括INT8精度和GPU加速转码),为采用人工智能的服务提供支持,例如使用单一Tesla P4 GPU加速器,对多达30个高清流进行实时物体分类和场景解析。

CUDA 9:NVIDIA加速计算软件平台CUDA的最新版本。该版本支持NVIDIA Volta架构,库的速度提高了5倍,为线程管理提供了新的编程模型,并且更新了调试和分析工具,能够为HPC和深度学习应用程序提供加速。CUDA 9专门进行了优化,能够在采用Tesla V100 GPU加速器时提供最大性能。

数据中心推理

数据中心管理者需要持续权衡性能和效率,从而确保服务器群能够处于最高生产力状态。Tesla GPU加速的服务器能够代替超过一百个超大规模CPU服务器来运行深度学习推理应用程序和服务,从而节省宝贵的机架空间、降低能耗和冷却需求,实现高达90%的成本降幅。

NVIDIA Tesla GPU加速器可提供出色的推理解决方案,为深度学习推理工作负载实现最高的吞吐量、最佳的效率和最低的延迟,借助人工智能驱动全新的人工智能体验。

针对无人驾驶汽车和嵌入式应用程序的推理

借助NVIDIA的统一架构,所有深度学习框架中的深度神经网络均可通过数据中心内的NVIDIA DGX?系统进行训练,然后部署至包括机器人和无人驾驶汽车在内的各类设备之中,在终端实现实时推理。

北京图森未来科技有限公司是一家开发无人驾驶卡车技术的初创公司。该公司在实现TensorRT优化后,推理性能提高了30%。今年6月,通过采用NVIDIA GPU和摄像机作为主要传感器,该公司成功完成从圣迭戈到亚利桑那州尤马长达170英里的L4级试车。借助由TensorRT带来的性能提升,图森未来得以分析更多摄像头数据,并在无人驾驶卡车上添加全新的人工智能算法,且这一切不会对响应速度造成任何影响。

网友评论(0) 评论仅代表网友个人观点,不代表CBINews观点。
CBINews网友您好,欢迎发表评论:(注册 后发表评论,可就本文发起辩论,将会获得更多关注)
 CBINews网友  注册邮箱:  

CBI 友情链接:

至顶网 |  腾讯科技 |  凤凰科技 |  商业伙伴 |  移动信息化 |  企业网 |  中国软件网 |  CIO时代网 |  更多>>

CBI集团其它网站:

电脑商情在线 | 存储伙伴 | 服务器伙伴 | 中小企业IT网

CBI 地方分站:

上海 |  广州 |  成都 |  西安 |  沈阳 |  武汉 |  南京 |  重庆 |  长沙 |  济南 |  太原 |  合肥 |  长春  |  杭州 |  昆明 |  南宁 |  哈尔滨 |  兰州 |  乌鲁木齐 |  福州 |  郑州 |  贵州

整合营销 |  CBINews刊例 |  《电脑商情报》刊例 |  联系方式 |  版权声明 |  友情链接

内容版权所有:电脑商情在线 北京三人行广告有限公司

地址:北京海淀区学院南路68号吉安大厦B座308。联系电话:(010)62178877

商务、内容合作QQ:2291221 联系电话:13391790444

ICP证:川B2-20070068-5 川预审H8VZ-RBP6-X228-T60Z号 北京市公安局海淀分局备案编号:1101083710