用Python做了鉴黄模型,内含多20万张“不可描述”图片

GitHub出现一个名为“NSFW Model”的项目。通俗一点来说,就是一个鉴黄模型。

这个模型,使用的数据来自前不久量子位介绍的那个数据集,内含多20万张“不可描述”图片。

同时,这个模型也被项目的贡献者做成了Demo。

既然有了Demo,那肯定是免不了测试一番……

Demo效果

Demo网站十分简单,进去之后能做什么一目了然。

上传图片之后,是自动给出结果,不需要点击其他按钮。但有时候不会给出结果…..还有待完善。

学习过程中有不懂的可以加入我们的学习交流秋秋圈784中间758后面214,与你分享Python企业当下人才需求及怎么从零基础学习Python,和学习什么内容。相关学习视频资料、开发工具都有分享

结果是数据集中提到的5种类别的可能性。分别是:hentai、sexy、neutral、drawings、porn。具体每个类别代表的意思,如下图所示:

好了,开始第一个测试:

这个图有71%的可能性是hentai;16%的可能性是porn。你觉得准吗?

再来一个:

71%的可能性是sexy。

但下面这个,就有点不好说了。

porn到了76%,19%是hentai。按照这个标准,《超体》别想正常上映了……

但整体上,这个模型还是能工作的,比如整个漫画,就很好的识别出来了,比如其他的一些,也能识别出来(但图片就不好放了)。

至于准确率怎么样,没法给出定论。如果你有兴趣,可以去体验下这个Demo。地址:

http://ai.midday.me/

话说话来,看到这个模型,你有没有想自己上手体验一下?GitHub有相关的开源代码。

请收好项目地址:

https://github.com/rockyzhengwu/nsfw

最后,数据集地址:

https://github.com/alexkimxyz/nsfw_data_scrapper

One More Thing

原文地址:https://blog.51cto.com/14445003/2421783

时间: 2024-11-12 06:31:04

用Python做了鉴黄模型,内含多20万张“不可描述”图片的相关文章

七牛国内首推鉴黄服务,6-8月 免费用

作为移动互联网行业最为热门的创业领域,在过去的几年中,移动社交类App和UGC类App大量涌现,因此在尽力确保产品定位差异化的同时,打造健康的社交生态也成为这些App能得以获得长期发展的关键.然而,由于这类App每天生成的图片信息量通常很大,并且有大量的色情图片混杂其中,所以高效准确地鉴别和剔除这些淫秽色情信息成为一项十分艰巨的任务. 基于此,七牛云携手专注于图像识别技术的图普科技推出了图片鉴黄服务(nrop),帮助七牛用户有效判断保存在七牛云的图片是属于色情.性感还是正常,并给出判断的分数,分

用python做中文自然语言预处理

这篇博客根据中文自然语言预处理的步骤分成几个板块.以做LDA实验为例,在处理数据之前,会写一个类似于实验报告的东西,用来指导做实验,OK,举例: 一,实验数据预处理(python,结巴分词)1.对于爬取的评论做分词和词性标注处理(mac-result.txt)2.对于结果只用公版的停用词表去停用词,不进行人工筛选(mac-result1.txt)3.保留:名词,名词短语(两者为评论描述主题) 形容词,动词,动词短语(对主题的描述)以及其他可能有实意的词   去除:副词,标点,拟声词等无实意词包括

python做题

Python题目 1.打印一个九九乘法表 #!/usr/bin/env python # -*- coding: utf-8 -*- """ __author__ = 'YeXiaodong' __QQ__= '12519460' __Email__ = '[email protected]' """ x = 1 list_table = [] print('九九乘法表'.center(100,' ')) while x < 10: lis

用python做自动化测试--对服务器端的自动化测试(2)-发送端模拟器

python的http client库很多,有httplib, urllib 和urllib2,但这几个用起来还是比较麻烦,requests 是高富帅(http://docs.python-requests.org/en/latest/),接口更简洁,优雅. 支持Json, 很方便设置发送的header, session管理. #!/usr/bin/env python #coding=utf-8 import time,logging,sys,os import pickle import u

使用python做科学计算

这里总结一个guide,主要针对刚开始做数据挖掘和数据分析的同学 说道统计分析工具你一定想到像excel,spss,sas,matlab以及R语言.R语言是这里面比较火的,它的强项是强大的绘图功能以及强大丰富的统计包,通过这个平台你可以了解统计前言的一些实现.它的唯一的问题就是性能问题.所以有时候你需要借用python. 使用R语言你可能需要Rstudio这个工具. python在在任何方面都有相当丰富的模块,科学计算领域也不例外,你可以查看python wiki也可以寻找相关的团体. 你可能会

用python做网页抓取与解析入门笔记[zz]

(from http://chentingpc.me/article/?id=961) 事情的起因是,我做survey的时候搜到了这两本书:Computational Social Network Analysis和Computational Social Network,感觉都蛮不错的,想下载下来看看,但是点开网页发现这个只能分章节下载,晕,我可没时间一章一章下载,想起了迅雷的下载全部链接,试试看,果真可以把他们一网打尽,但是,sadly,迅雷下载的时候,文件名没办法跟章节名对应起来,晕,我可

12岁的少年教你用Python做小游戏

原地址:http://blog.jobbole.com/46308/ 本文由 伯乐在线 - 贱圣OMG 翻译自 Julian Meyer.欢迎加入技术翻译小组.转载请参见文章末尾处的要求. [感谢@贱圣OMG 的热心翻译.如果其他朋友也有不错的原创或译文,可以尝试推荐给伯乐在线.] 你有没有想过电脑游戏是怎样制作出来的?其实它没有你想象的那样复杂! 在这个教程里,你要学做一个叫<兔子和獾>的塔防游戏,兔子作为英雄,需要在城堡里抵御獾的进攻. 为了写这个游戏的代码,你将会用Python.好吧,我

《用Python做HTTP接口测试》学习感悟

机缘巧合之下,报名参加了阿奎老师发布在"好班长"的课程<用Python做HTTP接口测试>,报名费:15rmb,不到一杯咖啡钱,目前为止的状态:坚定不移的跟下去,自学+课程模式每天一小时! 1.学习初衷 打算学习Python,这个想法开始于2017年,和在网络上遇到的绝大多数测试人员不同,我的工作单位是一个大型国企,虽然从事软件测试工作已经有四年,可事实上,无论是测试理论还是实际项目经验,都处于一种停滞不前的状态,作为一个有理想的测试猿(害羞脸),这样的工作状态让人心酸,因

[转] 用python做自动化测试

用python做自动化测试--序 https://wiki.python.org/moin/PythonTestingToolsTaxonomy 原 使用python进行windows自动化测试(1) http://my.oschina.net/yangyanxing/blog/166838 Python Testing Tools Taxonomy https://wiki.python.org/moin/PythonTestingToolsTaxonomy