资讯 人工智能开发者
此为临时链接,仅用于文章预览,将在时失效

浮世绘面孔数据集 | 雷峰网-米乐m6平台

作者:ai研习社-译站
2020/11/13 11:17

译者:ai研习社()

双语原文链接:


作为论文[1]的一部分,我使用浮世绘的人脸图像数据集来训练stylegan模型,本文包含该数据集的链接和该数据集的详细信息。

更新

数据集

浮世绘人脸数据集包含来自浮世绘照片的5209张脸部图像。 图像格式为1024x1024的jpeg,并已根据ffhq数据集所使用的过程进行了对齐。 上面是数据集中(几乎)所有图像的地图,越相似的图像彼此越靠近[2]。 为便于显示,图像像素已降至 256x256。

更多细节

图片是从数个博物馆网站上刮下来的,然后我试着用amazon rekognition从每个图片中检测面部和面部标志。 rekognition相对合理地完成了任务,但是显然并不完美,很多面部都被遗漏了,并且许多图像中都存在对齐错误。 许多图像的分辨率不是很高,因此要生成可用的1024x1024分辨率的数据集,我使用在数据集上训练的预训练esrgan [3]模型来按需放大图像,这些图像偶尔会出现一些瑕疵,但大体上结果不错。

其他数据集

是浮世绘人脸的另一个数据集[4],它具有更多的变化和标签,但是图像分辨率较低且人脸未对齐。


许可和使用

此数据集是根据提供的。

如果使用数据集,请引用为“aligned ukiyo-e faces dataset, justin pinkney 2020”或一个bibtex条目:

@misc{pinkney2020ukiyoe,
      author = {justin n. m. pinkney},
      title = {aligned ukiyo-e faces dataset},
      year={2020},
      howpublished= {\url{https://www.justinpinkney.com/ukiyoe-dataset}}

  1. pinkney, justin n. m., and doron adler. ‘resolution dependent gan interpolation for controllable image synthesis between domains’. arxiv:2010.05334 [cs, eess], 20 october 2020. .

  2. 为了生成此图像,我首先使用在imagenet上预训练的resnet50从每个图像中提取cnn特征。 然后使用umap将这些高维特征向量投影到二维,然后使用lapjv算法完成网格划分。

  3. wang, xintao, ke yu, shixiang wu, jinjin gu, yihao liu, chao dong, chen change loy, yu qiao, and xiaoou tang. ‘esrgan: enhanced super-resolution generative adversarial networks’. arxiv:1809.00219 [cs], 1 september 2018. .

  4. tian, yingtao, chikahiko suzuki, tarin clanuwat, mikel bober-irizar, alex lamb, and asanobu kitamoto. ‘kaokore: a pre-modern japanese art facial expression dataset’. arxiv:2002.08595 [cs, stat], 20 february 2020. .


ai研习社是ai学术青年和ai开发者技术交流的在线社区。我们与高校、学术机构和产业界合作,通过提供学习、实战和求职服务,为ai学术青年和开发者的交流互助和职业发展打造一站式平台,致力成为中国最大的科技创新人才聚集地。

如果,你也是位热爱分享的ai爱好者。欢迎与译站一起,学习新知,分享成长。

长按图片保存图片,分享给好友或朋友圈

浮世绘面孔数据集

扫码查看文章
米乐m6平台

正在生成分享图...

取消
相关文章
网站地图