小目标检测、图像分类、图像识别等开源数据集汇总

极市平台

共 2591字,需浏览 6分钟

 ·

2022-03-15 21:16

↑ 点击蓝字 关注极市平台

编辑丨极市平台

极市导读

 

本文收集整理了多个小目标检测、图像识别、图像分类等方向的开源数据集,本次还有猫咪、斯坦福狗狗数据集以及3D MNIST数字识别等~ >>加入极市CV技术交流群,走在计算机视觉的最前沿

往期回顾:

15个目标检测开源数据集汇总

人脸识别常用开源数据集大全

10个开源工业检测数据集汇总

21个深度学习开源数据集分类汇总

开源真实场景图像检测数据集汇总

宠物图像数据集

数据集下载地址:http://m6z.cn/5TAgdC

一个包含 37 个类别的宠物数据集,每个类别大约有 200 张图像。这些图像在比例、姿势和照明方面有很大的变化。所有图像都有相关的品种、头部 ROI 和像素级三元图分割的地面实况注释。

街景门牌号 (SVHN) 数据集

数据集下载地址:http://m6z.cn/5ExMWb

SVHN 是一个真实世界的图像数据集,用于开发机器学习和对象识别算法,对数据预处理和格式化的要求最低。它可以被视为与MNIST风格相似(例如,图像是经过裁剪的小数字),但包含一个数量级的更多标记数据(超过 600,000 个数字图像),并且来自一个更难、未解决的现实世界问题(识别自然场景图像中的数字和数字)。SVHN 是从谷歌街景图像中的门牌号获得的。

3D MNIST 数字识别图像数据

数据集下载地址:http://m6z.cn/5SUfEd

该数据集的目的是提供一种简单的方法来开始处理 3D 计算机视觉问题,例如 3D 形状识别。

文档影印和内容数据

数据集下载地址:http://m6z.cn/6nF67S

MediaTeam Oulu Document 数据集是一个文档扫描图像和文档内容数据集,包含 500篇 1975年之前的文档信息。

猫咪数据集

数据集下载地址:http://m6z.cn/5TAgbw

CAT 数据集包括超过 9,000 张猫图像。对于每张图像,猫的头部都有九个点的注释,眼睛两个,嘴巴一个,耳朵六个。

CBCL 街道场景数据

数据集下载地址:http://m6z.cn/5TAgeA

StreetScenes Challenge Framework 是用于对象检测的图像、注释、软件和性能测量的集合。每张图像都是从马萨诸塞州波士顿及其周边地区的 DSC-F717 相机拍摄的。然后用围绕 9 个对象类别的每个示例的多边形手动标记每个图像,包括 [汽车、行人、自行车、建筑物、树木、天空、道路、人行道和商店]。这些图像的标记是在仔细检查下完成的,以确保对象总是以相同的方式标记,关于遮挡和其他常见的图像变换。

小目标检测数据集

数据集下载地址:http://m6z.cn/616t6R

从Internet(例如YouTube或Google)上的图像/视频收集的四个小物体数据集,包括4种类型的图像,可用于小物体目标检测的研究。

数据集包含四类:

  • fly:飞行数据集,包含600个视频帧,平均每帧86±39个物体(648×72 @ 30 fps)。32张图像用于训练(1:6:187),50张图像用于测试(301:6:600)。
  • honeybee:蜜蜂数据集,包含118张图像,每张图像平均有28±6个蜜蜂(640×480)。数据集被平均分配用于训练和测试集。仅前32张图像用于训练。
  • seagull:海鸥数据集,包含三个高分辨率图像(624×964),每个图像平均有866±107个海鸥。第一张图片用于训练,其余图片用于测试。
  • fish:鱼数据集,包含387帧视频数据,平均每帧56±9条鱼(300×410 @ 30 fps)。32张图像进行训练(1:3:94),65张图像进行测试(193:3:387)。

斯坦福狗狗数据集

数据集下载地址:http://m6z.cn/6nF6kM

斯坦福狗数据集包含来自世界各地的 120 种狗的图像。该数据集是使用 ImageNet 中的图像和注释构建的,用于细粒度图像分类任务。

该数据集的内容:

  • 类别数:120
  • 图片数量:20,580
  • 注释:类标签、边界框

标注鱼类数据集

数据集下载地址:http://m6z.cn/616t8X

野生图像数据集中的标记鱼类由 NOAA Fisheries(国家海洋渔业服务局)提供,以鼓励对无约束水下图像的自动图像分析算法进行开发、测试和性能评估。

该数据集包括鱼类、无脊椎动物和海床的图像,这些图像是使用部署在远程操作车辆 (ROV) 上的摄像系统收集的,用于渔业调查。

Stanford 汽车图片数据

数据集下载地址:http://m6z.cn/616wop

Cars 数据集包含 196 类汽车的 16,185 张图像。数据分为 8,144 个训练图像和 8,041 个测试图像,其中每个类别大致按 50-50 分割。课程通常在品牌、型号、年份级别,例如 2012 Tesla Model S 或 2012 BMW M3 coupe。


公众号后台回复“数据集”获取50+深度学习数据集下载~

△点击卡片关注极市平台,获取最新CV干货
极市干货
数据集资源汇总:10个开源工业检测数据集汇总21个深度学习开源数据集分类汇总
算法trick目标检测比赛中的tricks集锦从39个kaggle竞赛中总结出来的图像分割的Tips和Tricks
技术综述:一文弄懂各种loss function工业图像异常检测最新研究总结(2019-2020)


CV技术社群邀请函 #

△长按添加极市小助手
添加极市小助手微信(ID : cvmart4)

备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)


即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群


每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~


觉得有用麻烦给个在看啦~  
浏览 20
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报