爬虫 MM 美女 beautiful girl spyder
可以爬取整个网站的图片,12个G,约13万张,代码用了2种来测试,一种是异步,一种是多进程(多线程一样),结果网速是瓶颈,一般使用多线程来写,简单一点
看心情放代码,仅供学习,谢谢!
使用这些美女图片作为原始图片制作了数据集:将脸部切了出来,切得非常的干净。
如何切的呢?经验就是,千万别用Opencv,垃圾得一匹,切的效果非常差,我用Opencv切了过后,又用了另外一个包(突然想不起来名字了,又不想回头看),来擦屁股,然后擦得非常干净,有时间了再直接用那个包来切一切,看看效果。