飞桨对昆仑XPU芯片的支持¶

自飞桨2.0版本起支持昆仑XPU，目前基于昆仑XPU和X86（Intel）CPU可实现12个模型单机单卡/单机多卡的训练，如下图所示：

模型	领域	模型readme	编程范式	可用的CPU类型	单机多卡支持
VGG16/19	图像分类	模型链接	静态图	X86（Intel）	支持
ResNet50	图像分类	模型链接	静态图	X86（Intel）ARM（飞腾）	支持
MobileNet_v3	图像分类	模型链接	静态图	X86（Intel）	支持
HRNet	图像分类	模型链接	静态图	X86（Intel）	支持
Yolov3-DarkNet53	目标检测	模型链接	静态图	X86（Intel）	支持
Yolov3-MobileNetv1	目标检测	模型链接	静态图	X86（Intel）	支持
Mask_RCNN	目标检测	模型链接	静态图	X86（Intel）	支持
Deeplab_v3	图像分割	模型链接	静态图	X86（Intel）	支持
Unet	图像分割	模型链接	静态图	X86（Intel）	支持
Bert-Base	NLP	模型链接	静态图/动态图	X86（Intel）	支持（静态图）
Ernie-Base	NLP		静态图/动态图	X86（Intel）	支持（静态图）
DQN	强化学习	模型链接	静态图	X86（Intel）	支持

模型放置在飞桨模型套件中，各领域套件是 github.com/PaddlePaddle 下的独立repo，clone下载即可获取所需的模型文件：

随着ARM架构的高性能、低功耗、低成本的优势日益突显，ARM CPU更多地进入PC和服务器领域，众多新锐国产CPU也纷纷采用ARM架构。在这一趋势下，我们开始尝试在飞腾CPU和昆仑XPU上运行飞桨，当前已验证ResNet50的训练效果。

更多的常用模型以及动态图组网将在后续版本增加。高性能预测库PaddleInference、PaddleLite、PaddleServing将在近期发布的新版本中支持昆仑XPU。敬请期待。