边缘AI计算的芯片/平台整理

整理于 Fri Apr 24 2020 15:19:42 GMT+0800 (中国标准时间)

LastEditTime: 2020-06-17 17:59:33

NVIDIA

Jetson TX1(2015)/ TX2(2017)

TX2与TX1对比:

JETSON TX1 TX2 4G TX2 TX2i
AI Perdormance 1 TOPS 1.3 TOPS 1.3 TOPS 1.3 TOPS
GPU Maxwell/256 CUDA Cores Pascal/256 CUDA Cores Pascal/256 CUDA Cores Pascal/256 CUDA Cores
CPU 4-core ARM Cortex A57 2-core Denver 2 64-bit CPU and 4-core ARM A57 2-core Denver 2 64-bit CPU and 4-core ARM A57 2-core Denver 2 64-bit CPU and 4-core ARM A57
Memory 4GB LPDDR4 4GB 128-bit LPDDR4 8GB 128-bit LPDDR4 8GB 128-bit LPDDR4+EEC
Storage 16GB EMMC 5.1 16GB EMMC 5.1 32GB EMMC 5.1 32GB EMMC 5.1
Power Under 10W 7.5w/15W 7.5w/15W 10w/20w
CSI 12x CSI2 D-PHY 1.1 lanes (1.5Gbps/Lane) 12x CSI2 D-PHY 1.1 lanes (2.5 Gbps/Lane) 12x CSI2 D-PHY 1.1 lanes (2.5 Gbps/Lane) 12x CSI2 D-PHY 1.1 lanes (2.5 Gbps/Lane)
DL Accelerator - - - -
Vision Accelerator - - - -
Wi-Fi Yes - Yes -

Jetson Nano

  • Jetson Nano 产品链接 (opens new window), 官网售价:$99 Module:$129
  • GPU:NVIDIA Maxwell architecture with 128 NVIDIA CUDA® cores
  • CPU:4-core ARM Cortex-A57 MPCore processor
  • 内存:4 GB 64-bit LPDDR4,存储:16 GB eMMC 5.1
  • 算力:0.47 TFLOPS@fp32
  • 视频解码:8路1080p @ 30,视频编码:4路1080p @ 30
  • 功率:5W

华为海思

HI3559A(2018)

  • Hi3559AV100 芯片参数文档 PDF (opens new window)
  • GPU:2-core ARM Mali G71@900 MHz, 256 KB cache,
  • 处理:
    • 2-core ARM Cortex A73@1.8 GHz, 32 KB I cache, 64 KB D cache or 512 KB L2 cache
    • 2-core ARM Cortex A53@1.2 GHz, 32 KB I cache, 32 KB D cache or 256 KB L2 cache
    • 1-core ARM Cortex A53@1 GHz, 32 KB I cache, 32 KB D cache or 128 KB L2 cache
    • Neon acceleration and integrated FPU
  • 内存:4GB LPDDR4, 存储:8GB eMMC
  • 视频解码:4K@120,视频编码:4K@120+1080P@30,H.265编码,视频录制:4x4K@30(视频编解码速度一致?)

算丰科技(比特大陆子公司)

AI计算盒SE5(2019)

  • SE5 产品链接 (opens new window)
  • 芯片:BM1684,标配内存12G,存储32G
  • CPU:8核A53@2.3GHz
  • 算力:2.2TFLOPS@fp32,17.6TOPS@int8
  • 视频解码:38路1080P@25FPS,视频编码:2路1080P@25FPS
  • 图片编解码:480张/秒 1080P
  • 支持Caffe/TensorFlow/PyTorch/MXNet/Paddle Lite等主流深度学习框架

AI迷你机SE3(2019)

AI计算模组SM5(2019)

  • SM5 产品链接 (opens new window)
  • 芯片:BM1684,标配内存12G
  • CPU:8核A53@2.3GHz
  • 算力:2.2TFLOPS@fp32,17.6TOPS@int8, Winograd卷积加速下最高可达35.2TOPS@int8,16路高清视频
  • 视频解码:38路1080P@25FPS,视频编码:2路1080P@25FPS,支持H264/H265格式,可实现超过16路视频流人脸检测分析或视频结构化
  • 支持AI业界主流框架Caffe, Tensorflow, Pytorch, Paddle, Mxnet
  • 最大功耗25W

瑞星微

RK3399 / RK3399 Pro(2018)

比特大陆

BM1880(2018 / 协处理器)

  • BM1880 产品链接 (opens new window)
  • 算力为 1Tops@int8,在Winograd模式下可达 2Tops@int8。
  • 此产品也是AI协处理器,没有视频流解码功能,需要搭配 Host CPU 进行使用。

寒武纪

思元220 M.2边缘端人工智能加速卡(协处理器)

地平线

WARNING

地平线实际是一家算法公司,因此购买的厂商无法使用其产品移植自己的算法,只能打包全部使用。

Journey 征程

Sunrise 旭日

Google

WARNING

Google 的这两块产品是TPU,并且不支持反向传播。

Google Coral USB(协处理器)

  • 支持 USB 3.1 端口和缆线(SuperSpeed,5GB / s传输速度)
  • 尺寸:30 x 65 x 8 mm
  • 官方价格:$ 74.99

Google Coral Dev Board

Board Mobilenet v1 (ms) Mobilenet v2 (ms) Idle Current (MA) Peak Current (MA) FPS
Coral Dev Board 15.7 20.9 600 960 47.85
Coral USB Accelerator 49.3 58.1 470 880 17.21
Nvidia jetson Nano (TF) 276.0 309.3 450 1220 3.23
Nvidiajetson Nano (TF-TRT) 61.6 72.3 450 1220 13.83
Movidius NCS 115.7 204.5 500 860 4.89
Intel NCS2 87.2 118.6 480 910 8.43
Macbook Pro 33.0 71.0 1570 1950 14.08
Raspberry Pi 480.3 654.0 410 1050 1.53

Intel

Intel Movidius(协处理器)

  • 淘宝 ¥550 左右
  • 算力 1TFLOPS@fp32
  • 一个神经计算棒,一般搭配树莓派使用
  • 似乎是要停止支持了?