OpenCV是计算机视觉处理的库,它是用C/C++实现的,通过安装Python也可以进行使用。当然这个库不止是能实现人脸识别,还能识别其他的事物,具体的内容可以参考官方说明:http://opencv-python-tutroals.readthedocs.io/en/latest/index.html。本文我们将使用这个库来体验一下简单的人脸识别。
准备
在Python中可以先尝试使用pip指令进行简单的安装,打开PowerShell窗口输入pip install OpenCV。如果不成功需要下载.whl文件来安装,可以到这个网站(https://www.lfd.uci.edu/~gohlke/pythonlibs/)找到合适的版本下载:
因为我的Windows系统为64位,Python版本为3.6,所以选择倒数第三个。安装完成之后在控制台输入import cv2回车没有报错则说明正常安装完毕。使用OpenCV库需要安装numpy库,如没有则需先安装numpy库,如已经安装了numpy库还不能安装成功,则需更新numpy到最新版本。
除此之外,需要安装用于人脸识别的cascade文件,这个文件是一系列包含人脸识别数据的xml文件,详细的下载地址通过以下链接下载,这个链接也包含一些例子以及代码:https://codeload.github.com/shantnu/FaceDetect/zip/master
实现过程
在OpenCV安装好之后我们可以正式开始这个库的使用,这个库使用的基本思路是这样:引入cv2库->创建一个可以人脸识别的对象->读取照片并将照片进行处理以方便识别->调用对象的方法进行人脸识别->将结果输出显示。这就是整个人脸识别的过程,接下来实现,体会一下人脸识别的过程,并把我在实现过程中遇到的问题以及解决方法分享一下。
首先实现前两三个步骤:引入cv2库->创建一个可以人脸识别的对象->读取照片并将照片进行处理以方便识别,实现代码以及注释如下:
将照片的存放路径存储在变量image_path中,将人脸识别用到的cascade文件的存放路径存储在变量cascade_path中,需要注意的是照片的名称不能出现中文,否则会报错。
接下来就到了程序中的核心部分:调用对象的方法进行人脸识别,这里调用已经创建好的对象facecascade的detectMultiScale方法来检测物体,因为使用了检测人脸的cascade文件haarcascade_frontalface_default.xml来创建对象,所以本文检测的物体为人脸。
在https://codeload.github.com/shantnu/FaceDetect/zip/master给出的例子代码中,detectMultiScale的方法如下:
gray为我们灰度处理后的灰度照片;scaleFactor可以理解为距离补偿,人在拍照时距离镜头的远近会影响到识别效果;minNeighbors用来定义周围有多少个物体,minSize用来定义检测窗口的大小,其中scaleFactor、minNeighbors以及minSize是可以自己修改来纠正识别的效果。最后这个flags=cv2.cv.CV_HAAR_SCALE_IMAGE其实时有误的,可能是因为OpenCV更新到3.0之后的关系,运行之后会出现AttributeError: module 'cv2' has no attribute 'cv'错误,经过一番折腾之后终于在StackOverflow上找到解决方法:https://stackoverflow.com/questions/30013009/opencv-3-0-0-dev-python-bindings-not-working-properly/30013069#30013069,需要将flags置为0。所以者部分的代码如下:
可以再想一下,既然flags为0了,那我们直接删除行不行呢?经过运行证明也是可以的,具体的原因是什么,有兴趣的看官可以查询一下。这里我们只追求能正常运行即可。
在检测到有人脸之后,会返回一个列表,存储再变量detectfaces中,我们遍历这个列表,调用cv2模块的rectangle方法来进行处理,将人脸标注出来,最后展示处理后的图片效果:
实现效果
选取两张照片进行测试,实现效果如下:
照片大小调整
在检测的时候选取来几张比较大的照片,在运行的时候发现照片显示窗口只能显示一部分,不能缩小,经过一番折腾之后在以下链接找到解决方法:https://www.tutorialkart.com/opencv/python/opencv-python-resize-image/#Downscale,可以调整输出照片的大小,实现后的代码如下:
结束
以上就是图片人脸识别的体验,既然有了图片的人脸识别,就会有视频的识别,视频的识别可以拆分成一帧一帧的图片进行识别;除了人脸识别,还可以有其他物体的识别,车、人等。有兴趣的看官可以查读相关的资料,欢迎各位看官关注!
本文暂时没有评论,来添加一个吧(●'◡'●)