01

导读

你知道人脸、商品、车辆识别，以图搜图乃至自动驾驶，背后的技术是什么嘛？

一般会觉得不就是图像分类、目标检测这些东西嘛，有什么难的？

其实这背后是综合使用目标检测、图像分类、度量学习、图像检索的通用图像识别系统…

度量学习是啥？图像检索是啥？通用图像识别系统又是啥？！

目前通用图像识别系统快速搭建神器—PP-ShiTu 开源项目已经上线。

开源地址：

https://github.com/PaddlePaddle/PaddleClas

02

PP-ShiTu开源技术解读

图像识别又比图像分类、目标检测强在哪里呢？

拿[商品识别]举个栗子，如果你用单纯的图像分类和目标检测，你会发现：

PP-ShiTu图像识别系统可以完美解决以上问题。

准备好需要识别的物体图片后，只需三步，多类别、微差异、高速度等问题通通不再是问题，绝对的 “开箱即用”，而且它不仅可以用作商品识别，还可以进行车辆、人脸、Logo、行人识别！！！

而这个图像识别系统的4个核心构成模块，都是经过精心打磨。无论是单独使用亦或是串联开发，都有非凡的效果：

主体检测： 采用高精度超轻量的PP-PicoDet检测算法，它的出现，使PP-ShiTu的主体检测模块预测速度提升了15倍以上，而精度几乎不衰减。

骨干网络： 采用CPU级超高性价比的轻量化骨干网络PP-LCNet，它的准确率不仅超越大模型ResNet50的模型效果，预测速度还是后者的3倍！简直香个跟头！而PP-ShiTu充分挖掘该网络的潜力，学习一个具有超强泛化能力的特征提取模型，同一模型可在多个数据集上同时实现高精度识别。

度量学习： 集成ArcMargin度量学习方法，轻松将图像转换成特征向量，训练出鲁棒的图像特征，以供后续进行检索识别。

检索系统： 集成Faiss算法，高效完成向量检索。当增加新的品类时，不需要重新训练提取特征模型，仅需要更新检索库即可识别新的目标，一次训练长期使用，还兼容(Linux, Windows, MacOS)多平台。

开发者不仅可以单独或自主组装使用这四个模块，还可以直接采用构建好的车辆识别、LOGO识别、商品识别、动漫识别四个系统。只需要补充好检索库，就可以直接投产使用了！

欢迎Star🌟收藏上车！

传送门：
https://github.com/PaddlePaddle/PaddleClas

快速体验：

https://github.com/PaddlePaddle/PaddleClas/blob/release/2.3/docs/zh_CN/quick_start/quick_start_recognition.md