万张PubFig人脸数据实现基于python+OpenCV的人脸特征定位程序(1)

在最近刷今日头条以及其他媒体软件时,经常会发现一些AI换脸的视频,于是我想,可不可以自己实现一个可以进行人脸识别的软件程序。我的具体流程是先配合python网络爬虫先进行万张PubFig人脸公共图片的爬取,分析出图片具体特征,然后再配合机器学习的OpenCV视觉库进行软件的构建。有一篇Github的文章讲得很详细,大家可以参考:https://github.com/Hironsan/BossSensor

前几篇博客先向大家讲解如何爬取PubFig人脸数据,然后本片的话先用一些动漫人脸图片,向大家展示基本的opencv库的操作,以及用一些公共人脸数据进行简单的人脸识别技术学习。

1.OpenCV简介

  OpenCV是一个开源的跨平台计算机视觉库,提供的有python接口,并实现了图像处理和计算机视觉方面的很多通用算法。

2.需要安装的包

  本篇先安装Opencv和numpy,pandas等数据分析包即可,如果感觉麻烦的话,可以直接安装Anaconda科学包(数据分析,挖掘,机器学习库合集),安装与不同编译器配置环境过程这里就不讲解了。

  下载地址(官网太慢了,推荐下面的地址):https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple/opencv-python/。python3.5以上的需要下载opencv_python-4.0之类的版本,这里用到的是opencv_python-4.0.0.21-cp37-cp37m-win_amd64.whl这个文件。

  安装完后,我们先用下面的代码输出一个图片:
  

import cv2

img = cv2.imread("1.jpg", 1)
cv2.imshow("1", img)
cv2.waitKey()

结果如下:

发现我们的环境已经成功安装了。

3.初步人脸识别

由于本篇文章是第一篇,因此这里先简单的展示一下opencv的一些机器视觉的基础方法,下面就进行介绍。

(1)导入人脸图片,这里用一张动漫图

代码和上面的类似,更改图片即可:

import cv2

img = cv2.imread("firstPer.jpg", 1)
cv2.imshow("1", img)
cv2.waitKey()
cv2.destroyAllWindows()

这里我们把这段代码封装成一个函数:

def viewImage(image, name_of_window):
    ‘‘‘
    image:图像对象
    name_of_window:图像窗口名称
    ‘‘‘
    cv2.namedWindow(name_of_window, cv2.WINDOW_NORMAL)
    cv2.imshow(name_of_window, image)
    cv2.waitKey()
    cv2.destroyAllWindows()

(2)一些基础图像处理的方法

cropped:cropped = image[y:y+h, x:x+w],就是以(y, x)为起点,裁剪大小为(h, w)的图像,以左上角为起点,竖直向下的方向为y轴,横向为x轴。

resized:dim = (width, height)

     resized = cv2.resize(img, dim, interpolation = cv2.INTER_AREA)

    调整图像的大小。

用下面的代码分别进行这两种图像的处理:

img = cv2.imread("firstPer.jpg", 1)
# 裁剪图片大小,裁剪100范围的图片
cropped = img[0:100, 0:100]
viewImage(cropped,"firstPer")

img = cv2.imread("firstPer.jpg", 1)
scale_percent = 30    #调整30%的大小
width = int(img.shape[1] * scale_percent / 100)
height = int(img.shape[0] * scale_percent / 100)
dim = (width, height)
resized = cv2.resize(img, dim, interpolation = cv2.INTER_AREA)
viewImage(resized,"firstPer")

还有一一些用的操作方法,就是旋转,调节亮度,变模糊/平滑,绘制边框,绘制线段等,在这里并不是进行图像处理,因此就先不先向大家讲解。哈哈。

(3)图像灰度处理

在进行人脸识别时,好多地方都先进行图像变灰度的操作,这里也给大家介绍一下:

这里有一个阈值函数,gray_image,将所有图像变为比127更暗直至0或者增加亮度到255,将图像的彩色边框的内容略过。

灰度处理代码:

gray_image = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
viewImage(gray_image,"gray Image")

结果:

亮度彩色阈值处理代码:

one,threshold_image = cv2.threshold(img, 127, 255, 0)
viewImage(threshold_image,"firstPer")

结果:

主要是有后面的三个参数控制,大家有兴趣可以自行学习。

(4)人脸识别初讲

  如果我们需要进行人脸识别,需要下载一些opencv配置文件,地址为:https://github.com/opencv/opencv/tree/master/data/haarcascades,这里我们用到的是haarcascade_frontalface_default.xml文件。用下面的代码进行检测:

face_cascade = cv2.CascadeClassifier(‘haarcascade_frontalface_default.xml‘)
img = cv2.imread("firstPer.jpg")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
faces = face_cascade.detectMultiScale(
gray,                # 灰度图
scaleFactor= 1.1,    # 缩放比例
minNeighbors= 2,    # 识别出一个人脸之前在当前物体周围需要检测的物体数目
minSize=(50, 50)    #窗口的大小
)

firstPer = format(len(faces)) + "faces detected!"
print(firstPer)# Draw a rectangle around the faces
for (x, y, w, h) in faces:
    cv2.rectangle(img, (x, y), (x+w, y+h), (255, 255, 0), 2)
viewImage(img,firstPer)

detectMultiScale函数是一个检测物体的通用函数。当我们把它用于人脸检测时,它就会从图像中检测出人脸。

但是我们却发现,根本没有检测出我们可爱的小樱的脸,这是为什么呢?不急,我们先用其他图片检测:

再来一张最美的图片:

这时我们发现,识别程序识别的时候会有两个要注意的地方,第一个是动漫图片线条简单,有时候并不能识别出;而且识别的能力和图片的清晰度也有关系。

针对第一个问题,在接下来的教程中,我会使用哥伦比亚大学的公共PubFig人脸库作为人脸识别数据集,进行机器视觉的训练。向大家讲解一下如何用机器学习训练一个不仅仅能够识别人脸,而且还能够识别表情的软件,欢迎大家继续关注我的博客,如果有宝贵建议的话,请在下方评论。

原文地址:https://www.cnblogs.com/ITXiaoAng/p/11553402.html

时间: 2024-10-13 03:09:16

万张PubFig人脸数据实现基于python+OpenCV的人脸特征定位程序(1)的相关文章

基于python+opencv的人脸检测+

人脸检测分为两种:一种是基于知识的,一种是基于深度学习的.深度不会学习 人脸识别属于目标检测,主要涉及两个方面: ①先对检测的物体进行概率统计,从而知道待检测对象的一些特征,建立其目标的检测模型 ②用得到的模型来匹配输入的图像,如果有匹配则则输出匹配的区域,否则什么也不做. 我们看到的图片和计算机不一样,计算机看到的是一串串数字矩阵,图片由多个像素组成,拿我们熟悉的RGB图像来说,每个像素又有红绿蓝三个通道,假如每个像素的单个通道由uint8类型字符组成,那么三通道的像素便会有24位,这是我们常

一行导出所有任意微软SQL server数据脚本-基于Python的微软官方mssql-scripter工具使用全讲解

文章标题: 一行导出所有任意微软SQL server数据脚本-基于Python的微软官方mssql-scripter工具使用全讲解关键字 : mssql-scripter,SQL Server文章分类: 技术分享 创建时间: 2020年3月30日 _.-"\ _.-" \ ,-" \ \ \ \ \Zoomla逐浪CMS\ \ \ web开发秘笈\ \ \ \ z01.com _.-; \ \ _.-" : \ \,-" _.-" \( _.-&

AI新时代-大神教你使用python+Opencv完成人脸解锁(附源码)

好吧,伙计们,我回来了.说我拖更不写文章的可以过来用你的小拳拳狠命地捶我胸口.... 那么今天我们来讲关于使用python+opencv+face++来实现人脸验证及人脸解锁.代码量同样不多,你可以将这些代码运用在其它一些智能领域,如智能家居,进门的时候判断你是谁,也可以加入机器学习判断来的人是客人还是熟人.在讲之前我们会先适当的拓扑一下关于人脸识别的知识点.OK废话少说下面开始正是话题. 解锁原理: 原理呢,其实很简单,没有那么复杂难懂(当然除了官方语言之外).我们先来通俗的说一下利用Face

基于Python & Opencv 图像处理算法

Alg1:图像数据格式之间相互转换.png to .jpg(其他的请举一反三) 1 import cv2 2 import glob 3 4 def png2jpg(): 5 images = glob.glob('*.png') # 获取当前路径下的所有后缀名为.png的文件 6 count = 0 # 不断累加,提供输出图像名称 7 for i in images: 8 print('Picture %d is Processing...' % count) 9 I = cv2.imread

Python看春运,万条拼车数据背后的春节迁徙地图

Python看春运,万条拼车数据背后的春节迁徙地图 今天是正月初九,春运返程也已过半.这篇文章,作者对北京.上海.广州.深圳.杭州等地 1万多条出行数据进行分析,得出了一些有意思的结论,并且绘制了这几个城市春运的迁移图.虽然数据在取样公平性上不能完全符合标准,但是思路还是值得大家学习参考的~ 目录 前言 统计结果 爬虫思路 统计思路 后记 前言 很早之前发过一篇关于某拼车平台爬虫的文章,因为工作比较忙,一直没有下文.最近年底稍微空了些,加上碰上春节返乡大潮,刚好再拿过来写一下数据分析的思路. 本

用Python做了鉴黄模型,内含多20万张“不可描述”图片

GitHub出现一个名为"NSFW Model"的项目.通俗一点来说,就是一个鉴黄模型. 这个模型,使用的数据来自前不久量子位介绍的那个数据集,内含多20万张"不可描述"图片. 同时,这个模型也被项目的贡献者做成了Demo. 既然有了Demo,那肯定是免不了测试一番-- Demo效果 Demo网站十分简单,进去之后能做什么一目了然. 上传图片之后,是自动给出结果,不需要点击其他按钮.但有时候不会给出结果-..还有待完善. 学习过程中有不懂的可以加入我们的学习交流秋秋

利用Python sklearn的SVM对AT&T人脸数据进行人脸识别

要求:使用10-fold交叉验证方法实现SVM的对人脸库识别,列出不同核函数参数对识别结果的影响,要求画对比曲线. 使用Python完成,主要参考文献[4],其中遇到不懂的功能函数一个一个的查官方文档和相关资料.其中包含了使用Python画图,遍历文件,读取图片,PCA降维,SVM,交叉验证等知识. 0.数据说明预处理 下载AT&T人脸数据(http://www.cl.cam.ac.uk/research/dtg/attarchive/facedatabase.html),解压缩后为40个文件夹

基于Python项目的Redis缓存消耗内存数据简单分析(附详细操作步骤)

目录 1 准备工作 2 具体实施   1 准备工作 什么是Redis? Redis:一个高性能的key-value数据库.支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用:提供string.list.set.zset.hash等数据结构的存储,并支持数据的备份. 本文适合使用的场景:当一个项目中Redis缓存的数据量逐渐增大,Redis缓存的数据占用内存也会越来越大,而且其中有很多很可能是价值不大的数据.由于Redis是一个key-value数据库,所以对其中的数

(数据科学学习手札47)基于Python的网络数据采集实战(2)

一.简介 马上大四了,最近在暑期实习,在数据挖掘的主业之外,也帮助同事做了很多网络数据采集的内容,接下来的数篇文章就将一一罗列出来,来续写几个月前开的这个网络数据采集实战的坑. 二.马蜂窝评论数据采集实战 2.1 数据要求 这次我们需要采集的数据是知名旅游网站马蜂窝下重庆区域内所有景点的用户评论数据,如下图所示: 思路是,先获取所有景点的poi ID,即每一个景点主页url地址中的唯一数字: 这一步和(数据科学学习手札33)基于Python的网络数据采集实战(1)中做法类似,即在下述界面: 翻页