基于RealSense的坐姿检测技术

计算机的飞速普及,让人们将越来越多的工作放在计算机上去完成,各行各业,尤其是程序开发人员、文字工作者,在计算机上的工作时间越来越长,这种情况下不良的坐姿对颈肩腰椎都会产生很大影响,容易导致多种疾病的发生。青少年接触计算机的年龄越来越小,保持良好的坐姿对于青少年的成长发育以及保护视力都大有裨益。调查显示肩部腰部疾病的发病率越来越高,发病年龄越来越小,跟长期坐着工作有关,我们还发现有一些奇特的办公是站立办公甚至在跑步机上办公。这些问题都说明,坐姿正确与否对健康有很大影响。在工作强度越来越大、休息锻炼时间越来越少的今天,如何保持正确坐姿就变得非常有必要了。

  本文首先介绍英特尔RealSense实感设备[1]的组成结构以及该设备是如何获得现实场景下的三维数据。针对本课题,利用英特尔RealSense官方SDK提取出用户面部大约70个特征点的三维数据。这些特征点的三维数据是本文坐姿检测算法的基础。在得到用户面部70多个点的三维数据之后,计算出用户此时头部的转动及俯仰角度、头部与计算机显示屏之间的距离,并使用支持向量机(SVM) [2]进行训练和识别实验,实现了对“歪头”“驼背”“仰视过大”“俯视过大”“距离屏幕过近”等不良坐姿的判定,并经过多次实验取得了较好的实验结果。通过与MySQL数据库[3] 结合,将坐姿特征、每日不同坐姿的时间长度记录下来,进行数据分析,生成报表给用户,从而达到完整的检测、提醒、矫正的目的。

1 实时坐姿检测算法

1.1 硬件及开发环境

  RealSense是英特尔推出的深度摄像头,最新一代设备是全VGA分辨率(640 x 480 60fps)的深度摄像头,以及1080p分辨率的RGB摄像头,在拍摄1080p画面的时候传输速率为30fps。检测范围在0.2米至1.2米之间,根据不同的使用场景和使用的算法,检测的距离也不一样的。目前已经有多款笔记本电脑默认配备RealSense实感摄像头,本文采用的是开发版本的RealSense摄像头,用于开发人员进行开发,如图1。

  开发款的基本尺寸是150mm x 30mm x 58mm,根据官方介绍,需要的环境配置如下,需要具备USB3.0接口,根据实际测试,台式机最好使用后置USB3.0接口,保证足够稳定的供电。官方声称需要使用Intel 第四代以及之后的酷睿系列CPU才能够完成开发,在本文开发过程中使用的是第三代的Core i5 CPU同样能够正常使用。

  需要注意的是,目前Intel RealSense SDK仅支持Windows 8.1以及之后的Windows 64位操作系统,暂不支持Mac OS 以及Linux。

1.2 坐姿检测算法

1.2.1 坐姿检测系统设计

  整套坐姿检测系统的设计流程如图2。

  坐姿检测系统包括五个主要部分,分别是用户信息的录入,设备初始化以及图像预处理,实时坐姿检测、坐姿信息进行统计、内容结果展示与提醒。其中实时坐姿检测模块是本文的重点研究,设计流程如图3。

  在实时坐姿检测当中,如果开启目光跟踪技术,则利用目光跟踪技术进行校正,进行辅助判断,以增强系统的稳定性和准确性。

1.2.2 算法判定

  用户的头部运动以及头部状态是主要的特征提取空间,通过RealSense,在三维坐标中,对头部的仰角(PITCH,绕X轴旋转)、偏航角(YAW,绕Y轴旋转)、翻滚角(ROLL,绕Z轴旋转)、高度信息、空间位置信息进行坐标变换提取,将转换过的数据进行卡尔曼滤波[4],获得较为准确的数据进行坐姿比对,如果头部信息各项参数满足一定指标,则判定该用户的坐姿是端正的,如下图4。

  当欧拉角[5]的翻滚角ROLL的绝对值大于10度时,可以认为用户头部左右歪头幅度过大,是错误的坐姿,需要进行提醒,更准确来说,当ROLL值为正的10度以上时,用户头部向右倾斜角度过大,当值小于负10度时,用户头部向左倾斜角度过大;当欧拉角的YAW的绝对值大于18度,可以认为用户头部的左右转头扭头的幅度过大,这样的错误坐姿经常出现在程序员群体中,因为很多程序员都是使用两台显示器或更多台显示器,由于桌子不足够大,用户与显示器之间距离过近,在观看显示器的时候需要大幅度的扭头,对颈部肩部造成了额外的负担,也属于不良坐姿,更确切的描述,当YAW值大于正18度时,用户头部向右旋转幅度过大,当YAW值小于负18度时,用户头部向左旋转的幅度过大;当欧拉角的PITCH值加5之后的绝对值大于25度,则可以判定用户的头部俯仰程度过大,属于不正确坐姿,通常情况下,用户在使用电脑的时候显示器都会略低于用户的头部高度,而且最适宜的坐姿也不是头部一定要平视显示器,而是稍微低一点点头,这样有助于减轻肩部脊椎等的压力,较适合长时间的工作,更准确地说,当欧拉角的PITCH值大于20度,用户是在仰起头在看显示器画面,这种情况的典型错误坐姿就是手托下巴抬头看显示器,如图5,在阅读长段文字或者浏览视频内容的时候经常会出现这样的坐姿,而当欧拉角的PITCH值小于负30度时,用户低头幅度过大,可以判定用户坐姿不正确,这种情况下对脊柱的损伤较为严重,出现这种不良坐姿的多为佩戴眼睛的用户;

  另外一种典型的错误坐姿就是距离显示器过近,通过RealSense的深度信息,可以快速地获得到用户的头部、肩部相对于摄像头的距离,并且可以精确地获得到用户眼睛到摄像头的距离信息,因此可以快速地判断用户是否距离显示器过近,本文实验的显示器尺寸是17寸,用户与显示器的最佳距离在70厘米至80厘米,小于70厘米时距离显示器过近,通常这样的情况都是因为驼背造成的,而且反过来距离显示器过近,不但会对视力造成严重损伤,也会加重驼背的情况。正确坐姿如图-6。

1.2.3 实验结果分析

  实验组数为4组,每组一名同学,共四人,实验结果数据如表1-表4。

  通过对不同同学的测试数据进行分析,可以发现,算法的准确率在90%以上,相比于传统的智能硬件识别方法40%的准确率有了大幅度的提升,但是在实验中也发现,第二组的检测准确率较低,通过对测试同学的身高、视力等信息的咨询,还发现另外一个重要因素,用户平时使用的桌子大小、座椅高低对用户的坐姿会造成很大影响,一套合适的座椅书桌对健康也是非常有必要的。

2 总结

  本文设计了一种利用Intel RealSense摄像头完成的实时坐姿检测算法,适用人群主要针对需要长时间坐在电脑前进行工作的白领或者程序员群体,综合分析用户头部、眼部的数据,准确的判断出用户当前坐姿是否端正,相比于传统的智能硬件[6]解决方案,省去了单独佩戴智能硬件设备的繁琐,并且极大地提高了检测准确度,达到了90%以上的准确率,同时极低的误警率也保证了在实际应用场景中不会干扰到用户的正常工作。在算法和整体系统软件的设计上仍有一定的优化改进空间,在对图像信息进行处理之前可以采用更好的图像降噪算法,用户面部特征数据在处理的时候可以进行滤波处理,以减少采集数据误差及跳变对检测造成的影响。

时间: 2024-10-27 11:18:36

基于RealSense的坐姿检测技术的相关文章

利用基于压缩的图挖掘技术进行基于行为的恶意软件检测技术

利用基于压缩的图挖掘进行基于行为的恶意软件检测技术 摘要——基于行为的检测方法通常用来处理经过了静态混淆的恶意软件的威胁.这种方法通常使用图来代表进程或者系统的行为,通常使用基于频率的挖掘技术,从恶意软件图的数据集中提取特征模式.分子挖掘领域最近的研究表明,基于频率的图挖掘算法通常会寻找高辨识度模式的次最优方法.我们提出了一种恶意软件检测的方法,使用基于量化数据流图的压缩挖掘方法,来获得精确度较高的检测模型.我们在一组大型多样的恶意软件数据集上的实验显示,我们的方法在比基于频率的检测模型高出了6

基于离散余弦变换的同图复制的检测技术

本文是一则学习小结 图像篡改的背景及意义 ??目前图像已经成为人类社会中必不可少的一部分,人们的日常生活中到处都可以见到图像.特别在医学.商业.军事.情报.学术研究.法律和新闻领域中,图像作为原始事件或现象的真实记录,具有信息载体和数字证明的作用.然而人们渐渐发现图像的真实性已经不再可靠了.篡改图像出现的频率越来越大,要分辨出它们也越来越困难. 已知检测技术 数字水印 易损水印,半易损水印和鲁棒水印 水印在图像篡改之前存在 要求所有设备都带有水印装置是不可能的 盲检测技术 不依赖数字水印,是基于

人脸识别活体检测技术讨论:基于背景人脸相对运动的活体判断方法

活体检测是人脸识别安全性的重要保障,是人脸识别厂商将产品普及应用于各行业的重要竞争力.目前活体判断的方法很多,但很难基于一种方法就能达到理想的效果,往往需要多种算法的交叉判断,本文主要介绍一种简单有效的活体判断方法.在很多情况下,高清照片和真人在某些光线条件下在相机中的成像很接近,这就导致仅仅基于面部的特征很难准确判断活体.在大部分场景下,人手拿着照片,手机或者pad不会完全静止不动,而在有运动时,真人和照片的区别很大:真实人脸运动与背景无相关性,照片,手机或者Pad在运动时,人脸运动与周围背景

目标检测梳理:基于深度学习的目标检测技术演进:R-CNN、Fast R-CNN、Faster R-CNN(转)

基于深度学习的目标检测技术演进:R-CNN.Fast R-CNN.Faster R-CNN(转) 原文链接:https://www.cnblogs.com/skyfsm/p/6806246.html object detection我的理解,就是在给定的图片中精确找到物体所在位置,并标注出物体的类别.object detection要解决的问题就是物体在哪里,是什么这整个流程的问题.然而,这个问题可不是那么容易解决的,物体的尺寸变化范围很大,摆放物体的角度,姿态不定,而且可以出现在图片的任何地方

paper 27 :图像/视觉显著性检测技术发展情况梳理(Saliency Detection、Visual Attention)

1. 早期C. Koch与S. Ullman的研究工作. 他们提出了非常有影响力的生物启发模型. C. Koch and S. Ullman . Shifts in selective visual attention: Towards the underlying neural circuitry. Human Neurobiology, 4(4):219-227, 1985. C. Koch and T. Poggio. Predicting the Visual World: Silenc

javascript客户端检测技术

 1. Firefox    Gecko是firefox的呈现引擎.当初的Gecko是作为通用Mozilla浏览器一部分开发的,而第一个采用Gecko引擎的浏览器是Netscape6: 我们可以使用用户代理检测下:如下JS代码: var ua = navigator.userAgent; console.log(ua); 在windows下firefox下打印如下:    Mozilla/5.0 (Windows NT 6.1; WOW64; rv:38.0) Gecko/20100101 Fi

客户端检测技术

客户端检测是javascript开发中最具争议的一个话题,由于浏览器之间存在差别,通常需要根据不同的浏览器能力分别编写不同的代码. 能力检测: 在编写代码之前先检测浏览器的能力.例如,脚本在调用某个函数之前,可能先检测该函数是否存在.这种检测方法将开发人员从考虑具体的浏览器类型和版本中解放出来,让它们把注意力集中到相应的能力是否存在上.能力无法精确地检测特定的浏览器和版本. 怪癖检测: 怪癖实际上是浏览器实际中存在的bug,例如早期的Webkit中就存在一个怪癖,即它会在for-in循环中返回被

入侵检测技术考点

第一章.入侵检测概述 入侵检测定义:入侵是指在非授权得情况下,试图存取信息.处理信息或破坏以使系统不可靠.不可用的故意行为. 入侵检测的基本原理:主要分为四个阶段: 1.      数据收集:数据收集是入侵检测的基础,采用不同的方法进行分析. 2.      数据处理:从原始数据中除去冗余.杂声,并且进行格式化以及标准化处理. 3.      数据分析:检查数据是否正常,或者显示是否存在入侵. 4.      响应处理:发现入侵,采取措施进行保护,保留入侵证据并且通知管理员. 1.4 入侵检测的

伪AP检测技术研究

转载自:http://www.whitecell-club.org/?p=310 随着城市无线局域网热点在公共场所大规模的部署,无线局域网安全变得尤为突出和重要,其中伪AP钓鱼攻击是无线网络中严重的安全威胁之一. 受到各种客观因素的限制,很多数据在WiFi网络上传输时都是明文的,如一般的网页.图片等:甚至还有很多网站或邮件系统在手机用户进行登陆时,将帐号和密码也进行了明文传输或只是简单加密传输(加密过程可逆).因此,一旦有手机接入攻击者架设的伪AP,那么通过该伪AP传输的各种信息,包括帐号和密码