ai资产管理
AI资产管理
1. 数据集管理
1.1. 公共数据集
进入智算控制台的【数据集管理】菜单,点击【公共数据集】选项卡,进入公共数据集列表页面。
目前平台提供的公共数据集包括:
数据集名称 | 路径 | 大小 | 描述信息 |
---|---|---|---|
KITTI | /root/nas-public/KITTI | 24GB | 自动驾驶场景数据集 |
IMDB | /root/nas-public/IMDB | 80MB | 电影影评情感分类,训练集 25000 条评论,正面评价标为 1,负面评价标为 0。测试集 25000 条评论。 |
MNIST | /root/nas-public/MNIST | 11MB | 经典的小型(28x28 像素)灰度手写数字数据集,共 10 类,用于灰度数据图像识别。训练集 60000 张,测试集 10000 张 |
MOT17 | /root/nas-public/MOT17 | 5GB | 多目标跟踪竞赛MOT Challenge |
MOT20 | /root/nas-public/MOT20 | 5GB | 密集人群中行人跟踪数据集(多目标跟踪) |
drive | /root/nas-public/drive | 28MB | 用于视网膜病变研究的数据集,相关图像均来自于荷兰的糖尿病视网膜病变筛查计划,其被用于视网膜图像中的血管分割比较研究 |
got10k | /root/nas-public/got10k | 66GB | 大型目标跟踪数据集 |
CIFAR10 | /root/nas-public/CIFAR-10 | 163MB | 10 个类别,32x32 像素彩色图像,用于图像分类。训练集 50000 张,测试集 10000 张。 |
REUTERS | /root/nas-public/REUTERS | 13MB | 路透社新闻专线主题分类,11228条新闻专线,46个主题。 |
VOC2007 | /root/nas-public/VOC2007 | 851MB | VOC 2007检测和语义分割数据集 |
VOC2012 | /root/nas-public/VOC2012 | 2GB | VOC 2012检测和语义分割数据集 |
CIFAR100 | /root/nas-public/CIFAR-100 | 161MB | 100 个类别,32x32 像素彩色图像,用于图像分类。训练集 50000 张,测试集 10000 张。 |
IMAGENET | /root/nas-public/ImageNet | 142GB | 目前世界上最大的图像识别数据库,主要用于机器视觉领域的图像分类和目标检测。 |
coco2017 | /root/nas-public/coco2017 | 25GB | 2017年 COCO 竞赛的数据集。 |
vggface2 | /root/nas-public/vggface2 | 37GB | 该数据集包含9131个主体身份的331万张图像,平均每个主体有362.6张图像 |
TF-FLOWERS | /root/nas-public/TF-FLOWERS | 218MB | 数据集为五种花朵数据集,分别为雏菊(daisy),郁金香(tulips),向日葵(sunflowers),玫瑰(roses),蒲公英(dandelion)。 |
cityscapes | /root/nas-public/cityscapes | 11GB | Cityscapes拥有5000张在城市环境中驾驶场景的图像(2975train,500 val,1525test)。它具有19个类别的密集像素标注(97%coverage),其中8个具有实例级分割。 |
CATS-VS-DOGS | /root/nas-public/CATS-VS-DOGS | 826MB | Kaggle大数据竞赛的猫狗大战数据集,有1738张图片可供训练。 |
IMAGENET-100 | /root/nas-public/IMAGENET-100 | 16GB | ImageNet 100类数据集。 |
FASHION MNIST | /root/nas-public/FASHION-MNIST | 29MB | 训练集 60000 张,大小28x28,共10类(0-9),测试集 10000 张图像。 |
ADEChallengeData2016 | /root/nas-public/ade20k | 922MB | ADE20K场景语义分割数据集 |
1.2. 我的数据集
添加我的数据集
进入智算控制台的【AI资产管理】-【数据集】菜单,点击【我的数据集】选项卡,点击我的数据集页面的【添加数据集】按钮,进入我的数据集添加页面。
在数据集添加页面完成信息填写,确认后点击确认。
数据集创建页面包括以下参数:
参数名称 | 说明 |
---|---|
数据集名称 | 自定义数据集名称 |
描述信息 | 描述信息 |
区域 | 数据集所在区域 |
类型 | 文件/文件夹 |
数据集文件 | 当类型为文件时,选择我的网盘中的数据集文件路径 |
数据集文件夹 | 当类型为文件时,选择我的网盘中的数据集文夹路径 |
1.3. 查看我的数据集
进入智算控制台的【AI资产管理】-【数据集】菜单,点击【我的数据集】选项卡,进入我的数据集列表页面。
在我的数据集列表页面,点击数据集名称,可查看数据集详情。
2. 我的数据集其他相关操作
操作类型 | 描述 |
---|---|
修改数据集 | 可修改数据集的名称、描述信息 |
删除数据集 | 可删除我的数据集,删除后解除数据集和网盘数据的对应关系,不会删除实际数据 |
标签设置 | 为我的数据集设置标签信息,支持批量设置 |