编者按:本文来自微信公众号“HyperAI超神经”(ID:HyperAI),作者:神经星星,36氪经授权发布。
内容概要:近期在 Kaggle 的数据集中,我们发现了一个独特的秃头人像数据集,作者整理了 20 万张秃头人像,共计 1.3 G大小。
关键词:数据集 人脸识别
见过对植物图片数据集的,也见过对名人人脸数据集,但你见过专门针对「秃头党」进行分类和识别的吗?
一位印度学生 Ashish Jangra ,最近在 Kaggle 上发布了一个名为「Bald Classification Dataset」的数据集。
没错,就是这个「秃头」
据介绍,Bald Classification Dataset(秃头数据集)由 Ashish Jangra 于今年 5 月发布。
数据集中包含 20 万张光头人像的图像,分为测试集、训练集、验证集三个文件夹,每个文件夹也包括 Bald 和 NotBald 两种图像。
数据集样例截图
其中秃头人像数据集的来源,主要是欧美公众人物,包含政商界、娱乐圈、体育界人士。
Bald Classification Dataset
发布人员: Ashish Jangra
包含数量:20 万张秃头人像
数据格式:JPG
数据大小:1.3 G
发布时间:2020 年 5 月
下载地址:https://hyper.ai/datasets/12385
发布者 Ashish Jangra 也是个停不下来的人。他是一位 95 后,2016 年开始就读于 Lovely Professional University(印度拉夫里科技大学)的计算机专业。
发量惊人的数据集作者,哼!
通过 Udacity、Coursera 和很多开源的课程,学习了 Python 和机器学习的知识。
还在 YouTube 上上传了自己的教学课程,包括 70 分钟的计算机视觉入门课程,和口罩人脸识别的最佳实践课程。
作者个人主页:https://ashishjangra.com/
数据集也下载好了,问题来了,怎么用?我们为大家简单设计了几个该数据集的使用场景:
通过训练秃头数据集,可以快速算出合影、视频、或区域街景中,目标区域中的「含秃率」。
可以得出一个区域里某类人群的作息规律、审美习惯、职业背景等等玄学相关因素,公司或学校也可以通过「含秃率」的统计,进行对年度贡献团队/实验室的评定参考。
在皮肤科、内分泌科、脱发专科门诊,协助医生进行病理性脱发的病程判定。
虽然医生也能一眼就看出来,但是有一个基于人工智能的判断结果,也可以让病人心服口服,不再倔强。
我们经常会在地铁、电梯内看到雍x植发、科X源的广告,相信这款工具也能有效地帮助植发机构,更快找到销售线索。
无论是在密集人群中发现目标群体,还是对比特定区域之间的目标群体密度,都可以进行尝试。
除了可以访问原作者的 Kaggle 项目主页,我们还将整个数据集搬运回来了。
访问 https://hyper.ai 主页,搜索关键词秃头,或者直接访问https://hyper.ai/datasets/12385
都可以找到该数据集,支持通过直链、磁力链接、 BT 种子、REST API 等下载方式进行下载。
这么好的数据集,还不快快下载来看看?