网站首页 > 技术文章 正文
一个基于人体姿态研究的手语图像识别系统。根据OpenPose人体姿态开源模型和YOLOv3自训练手部模型检测视频和图像,再把数字特征进行分类器模型预测,将预测结果以文本形式展现出来。
基于人体姿态的手语图像识别系统是由多模块组成的,主要分为训练模块和识别模块两个部分。
1. 视频帧处理
Python+Opencv2(三)保存视频关键帧
2. OpenPose人体姿态识别
Openpose人体骨骼、手势--静态图像标记及分类(附源码) Openpose人体骨骼、手势--静态图像标记及分类2(附源码)
由于仅靠人体姿态4和7关键点不足以识别手部位置,容易误判,因此在最终设计中引入了yolo手部识别。
3. yolov3手部模型训练
项目结构主要分为两大部分:YOLOv3深度模型训练部分和YOLOv3和OpenPose手语姿态识别部分。
训练模型思路:
环境:【GPU】win10 (1050Ti)+anaconda3+python3.6+CUDA10.0+tensorflow-gpu2.1.0 训练模型:【Keras+TensorFlow+Yolo3】一文掌握图像标注、训练、识别(tf2填坑) 识别:【Keras+TensorFlow+Yolo3】教你如何识别影视剧模型
模型训练参考代码:https://gitee.com/cungudafa/keras-yolo3 yolo3识别这里参考于:https://github.com/AaronJny/tf2-keras-yolo3
4. 人体姿态数字特征提取
识别完整过程思路:
在OpenPose设计中阐述过求解距离和角度的公式及方法,最终因为个体差异每个人的骨骼可能不同,目前优化为距离比(即小臂3-4关键点的距离与脖子长度0-1关键点距离之比)。
基于 keras的yolo3训练部分项目结构如下表所示:
keras-yolo3训练项目结构: 名称 |类型 |内容 |--|--|--| yolov3.weights |配置文件| 权重文件 yolov3.cfg |配置文件| 配置文件 convert.py| 函数| 模型格式转换 train.py| 函数 |模型训练 voc_annotation.py |函数 |voc格式标签 yolo_annotations.py |函数| yolo格式标签 yolo.py |函数 |yolo方法接口 model_data |文件夹 |参数配置 nets |文件夹 |yolo网络 utils |文件夹 |图片加载工具类 VOCdevkit |文件夹 |VOC格式数据集 logs |文件夹| h5训练的模型生成目录
其中logs文件夹用于存放训练好的模型,VOCdevkit用于存放图片和标注信息。
猜你喜欢
- 2024-12-26 SDXL Controlnet Tile V2模型发布:高清分辨率图像处理,效果爆炸
- 2024-12-26 现役韩国男团舞蹈整齐度哪家强?AI计算后说:SEVENTEEN
- 2024-12-26 使用Python实现虚拟试衣间 python虚拟变量
- 2024-12-26 你知道怎么使用OpenCV检测篮球运动员吗?
- 2024-12-26 每天一个AI姬,OpenPose官网上线,AI绘画创作更加活灵活现
- 2024-12-26 comfyui图生图及衍生的进阶工作流,从底层逻辑解析搭建逻辑!
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)