Flex Logix为边缘AI启动推理协处理器

【Flex Logix为边缘AI启动推理协处理器】
Flex Logix Technologies公司透露,它已开发出一种用于边缘AI处理的新型协处理器:InferX X1 。新芯片基于嵌入式现场可编程门阵列(eFPGA)芯片设计的专利互连技术 。它将eFPGA技术与推理优化的nnMAX集群结合在新的组合芯片中 。
总部位于加利福尼亚州山景城的公司表示,其第一个芯片设计(超出其通常的芯片技术许可业务)将以相当于竞争对手的功率和成本的一小部分提供接近数据中心的吞吐量 。Flex Logix声称它提供的吞吐量是现有推理边缘芯片的10倍 。
新芯片可能会用于边缘网关,低端服务器,机器人和其他高性能边缘设备 。Flex Logix在加利福尼亚州圣克拉拉的Linley处理器大会上发布了该芯片 。
Flex Logix InferX X1芯片通过单个DRAM(动态随机存取存储器芯片)在边缘应用中提供高吞吐量 。该公司声称每瓦特的吞吐量比现有解决方案高得多,芯片的性能优势在低批量生产时尤为强劲,这在通常只有一个摄像头或传感器的边缘应用中是必需的 。
InferX X1在小批量产品上的性能接近数据中心推理板,并针对每个图像需要数千亿次操作的大型模型进行了优化 。例如,对于YOLOv3实时对象识别,InferX X1以批量大小= 1处理12.7帧/秒的200万像素图像 。性能与图像大小大致呈线性关系,因此对于100万像素图像,帧速率大约翻倍 。这是一个单一的DRAM 。
InferX X1将作为边缘设备的芯片和边缘服务器和网关的半高半长PCIe卡提供 。它使用nnMAX编译器进行编程,该编译器采用Tensorflow Lite或ONNX型号 。推理引擎的内部体系结构对用户是隐藏的 。
“神经网络推理中的艰巨挑战是最大限度地减少数据移动和能耗,这是我们的互连技术可以做得非常好的事情,”Flex Logix首席执行官Geoff Tate在一份声明中表示 。“在处理层时,使用我们的可重配置互连为整个阶段配置数据路径,使InferX像[自定义芯片]一样运行,然后快速重新配置下一层 。由于我们的大部分带宽来自本地SRAM,InferX
只需要一个DRAM,简化了芯片和封装,并降低了成本和功耗 。“
添加了Tate,“我们的片上Winograd转换进一步减少了因重量加载带宽,因为Winograd格式的权重是1.8倍 。我们的混合数字功能使客户能够在实际使用整数8,但可以根据需要回退到浮点,以实现所需的预测精度 。这些功能组合可实现高预测精度,高吞吐量,低成本和低功耗边缘推断 。“
nnMAX目前正在开发中,将于2019年第三季度在SoC中集成.InferX X1将在2019年第三季度完成其设计,芯片和PCIe板样品将在不久后推出 。Tate于2014年共同创建了Flex Logix,迄今为止该公司已筹集了超过2500万美元 。

    推荐阅读