时间:2017-09-12 来源:互联网 浏览量:
人工智能(Artificial Intelligence)和深度学习(Deep Learning)有望转变人类与世界互动以及企业运作的方式,从而使人们做出更明智的决策,而英特尔技术正在实现这场变革。
全球最大的云服务提供商之一微软利用英特尔人工智能技术来运行复杂的深度学习模型,这些模型实现了从智能手机上的人脸识别和语音识别再到自动驾驶等等的各种应用。
微软选择了英特尔Stratix 10 FPGA作为其新的深度学习加速平台(代号为Project Brainwave)的关键硬件加速器。这种基于FPGA的深度学习加速平台可以提供“实时人工智能”技术,使云基础设施能够以超低延迟来尽可能快速地处理和传输数据。在云中,系统需要处理直播数据流(包括视频,传感器或搜索查询)并快速将数据传送回用户。因此,提供实时人工智能变得越来越重要。
Stratix 10 FPGA 和 SoC FPGA
使用了英特尔14nm制程工艺
通过采用英特尔FPGA的Project Brainwave平台,微软以“前所未有”的高性能灵活处理了极具挑战性的深度学习模型。在2017年高效能芯片大会(Hot Chips 2017)上,微软展示了基于FPGA的深度学习平台,和半导体技术领域中的最新成就。微软是第一家在其公有云基础设施中部署FPGA的大型云服务提供商,而其通过英特尔Stratix 10 FPGA实现的技术进步加速了深度神经网络(DNN),这种网络可以通过概念类似的方式复制人类大脑的“思维”。
人工智能是一个快速发展的领域,需要多种技术来有效管理各种工作负载的需求。英特尔提供广泛的技术以推动市场演进,包括英特尔至强处理器,英特尔FPGA和英特尔Nervana ASIC技术。
相比于为运行单个工作负载而优化的专用深度学习硬件加速器,英特尔FPGA的高度灵活性让用户可以自定义硬件以满足特定的工作负载需求,并可以随着深度学习工作负载和使用模式的更改而快速地重新配置硬件。英特尔Stratix 10 FPGA结合了硬化处理器模块,这种模块可提供高水平的持续性能和效率,并可根据用户的自定义来灵活的编程。
许多硅人工智能加速器目前需要将多个请求分组(称为“批处理”)以实现高性能。微软的Project Brainwave平台利用英特尔Stratix 10技术,在单个请求上展示了超过每秒39万亿次浮点运算的性能,在云中确立了实时人工智能计算的新标准。Stratix 10 FPGA为实时人工智能计算确立了新的云性能标准,具有创纪录性的低延迟、高性能以及无需批量处理人工智能请求的多种特点。
微软研究院NexT的著名工程师Doug Burger说:“我们利用英特尔FPGA的高度灵活性快速整合创新,同时提供与许多基于ASIC的深度学习处理单元相当或更高的性能。微软正努力在Azure云中部署Project Brainwave,以便客户最终能够以创纪录式的高性能运行复杂的深度学习模型。”
通过加速模型训练、快速评分和高度可扩展的基础设施,基于英特尔技术的机器学习平台将数据转化为可操作的商业智能。结合最新的英特尔至强可扩展处理器,英特尔FPGA可自定义和编程以提供低延迟和灵活的精度,与单独的英特尔至强处理器相比,在深度学习推理方面每瓦特功耗具有更高的性能。