机器学习/数据挖掘/深度学习数据集—图像和视频数据集


目录:

    MNIST 数据集

    机器学习领域内用于手写字识别的数据集,数据集中包含6个万训练集、10000个示例测试集。,每个样本图像的宽高为28*28。这些数据集的大小已经归一化,并且形成固定大小,因此预处理工作基本已经完成。在机器学习中,主流的机器学习工具(包括sklearn)很多都使用该数据集作为入门级别的介绍和应用。

    推荐度:★★★,推荐应用方向:机器学习入门

    介绍和下载地址:http://yann.lecun.com/exdb/mnist/

    CIFAR 10 & CIFAR 100 数据集

    CIFAR-10数据集由10个类别的60000 32x32彩色图像组成,每个类别有6000张图像。

    有50000个训练图像和10000个测试图像。数据集的类别涵盖航空、车辆、鸟类、猫类、狗类、狐狸类、马类、船类、卡车等日常生活类别,可用于计算机视觉相关方向。

    推荐度:★★★,推荐应用方向:图像处理和图像识别

    介绍和下载地址:http://www.cs.toronto.edu/~kriz/cifar.html/

    谷歌Open Images Dataset 图像数据集

    其中包括大约9百万标注图片、横跨6000个类别标签,平均每个图像拥有8个标签。该数据集的标签涵盖比拥有1000个类别标签的ImageNet具体更多的现实实体,可用于计算机视觉方向的训练。

    推荐度:★★★,推荐应用方向:图像处理和图像识别

    介绍地址:https://research.googleblog.com/2016/09/introducing-open-images-dataset.html

    下载地址:https://github.com/openimages/dataset

    ImageNet 数据集

    ImageNet数据集是目前深度学习图像领域应用得非常多的一个领域,该数据集有1000多个图像,涵盖图像分类、定位、检测等应用方向。Imagenet数据集文档详细,有专门的团队维护,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。很多大型科技公司都会参加ImageNet图像识别大赛,包括百度、谷歌、微软等。

    推荐度:★★★,推荐应用方向:图像识别

    介绍和下载地址:http://www.image-net.org/

    Tiny Images Dataset

    该数据集由79302017张图像组成,每张图像为32x32彩色图像。 该数据以二进制文件的形式存储,大约有400Gb图像。

    推荐度:★★,推荐应用方向:图像识别

    介绍和下载地址:http://horatio.cs.nyu.edu/mit/tiny/data/index.html

    CoPhIR

    CoPhIR是从Flickr中采集的大概1.06亿个图像数据集,图像中不仅包含了图表本身的数据,例如位置、标题、GPS、标签、评论等,还可提取出颜色模式、颜色布局、边缘直方图、均匀纹理等数据。

    推荐度:★★,推荐应用方向:图像识别

    介绍和下载地址:http://cophir.isti.cnr.it/whatis.html

    LSUN数据集

    国外的PASCAL VOC和ImageNet ILSVRC比赛使用的数据集,数据领域包括卧室、冰箱、教师、厨房、起居室、酒店等多个主题。

    推荐度:★★,推荐应用方向:图像识别

    介绍和下载地址:http://lsun.cs.princeton.edu

    Labeled Faces in the Wild 数据集

    该数据集是用于研究无约束面部识别问题的面部照片数据库。数据集包含从网络收集的13000多张图像。每张脸都贴上了所画的人的名字,图片中的1680人在数据集中有两个或更多不同的照片。

    推荐度:★★,推荐应用方向:人脸识别

    介绍和下载地址:http://vis-www.cs.umass.edu/lfw/

    SVHN

    SVHN数据来源于Google街景视图中房屋信息,它是一个真实世界的图像数据集,用于开发机器学习和对象识别算法,对数据预处理和格式化的要求最低。它跟MNIST相似,但是包含更多数量级的标签数据(超过60万个数字图像),并且来源更加多样,用来识别自然场景图像中的数字。

    推荐度:★★,推荐应用方向:机器学习、图像识别

    介绍和下载地址:http://ufldl.stanford.edu/housenumbers/

    COCO

    COCO(Common Objects in Context)是一个新的图像识别、分割和图像语义数据集,由微软赞助,图像中不仅有标注类别、位置信息,还有对图像的语义文本描述。COCO数据集的开源使得近两、三年来图像分割语义理解取得了巨大的进展,也几乎成为了图像语义理解算法性能评价的“标准”数据集。

    推荐度:★★★,推荐应用方向:图像识别、图像语义理解

    介绍和下载地址:http://mscoco.org/

    谷歌YouTube-8M

    YouTube-8M一个大型的多样性标注的视频数据集,目前拥有700万的YouTube视频链接、45万小时视频时长、3.2亿视频/音频特征、4716个分类、平均每个视频拥有3个标签。

    推荐度:★★★,推荐应用方向:视频理解、表示学习(representation learning)、嘈杂数据建模、转移学习(transfer learning)和视频域适配方法(domain adaptation approaches)

    数据集介绍和下载地址:https://research.google.com/youtube8m/。

    Udacity开源的车辆行使视频数据集

    数据集大概有223G,主要是有关车辆驾驶的数据,其中除了车辆拍摄的图像以外,还包括车辆本身的属性和参数信息,例如经纬度、制动器、油门、转向度、转速等。这些数据可用于车辆自动驾驶方向的模型训练和学习。

    推荐度:★★★,推荐应用方向:自动驾驶

    介绍和下载地址:https://github.com/udacity/self-driving-car

    牛津RobotCar 视频数据集

    RobotCar数据集包含时间范围超过1年,测试超过100次的相同路线的驾驶数据。数据集采集了天气、交通、行人、建筑和道路施工等不同组合的数据。

    推荐度:★★★,推荐应用方向:自动驾驶

    介绍和下载地址:http://robotcar-dataset.robots.ox.ac.uk/

    Udacity开源的自然场景短视频数据集

    数据集大概为9T,由3500万个视频剪辑组成,每个视频为短视频(32帧),大约1秒左右的时长。

    推荐度:★★★,推荐应用方向:目标跟踪、视频目标识别

    介绍和下载地址:http://web.mit.edu/vondrick/tinyvideo/#data