学术动态
您当前的位置: > 动态研究  > 学术动态

基于视频和人体姿态估计的老年人摔倒监测研究

  • 期号:2021-06 总90期

黄展原1,2,李兵1,李庚浩1,3

1.对外经济贸易大学信息学院,北京,中国,

2.东北大学计算机学院,加州,美国,

3.中国人民大学汉青经济与金融高级研究院,北京,中国)

人口老龄化所带来的养老服务问题是现代社会面临的严重问题。例如在很多国家跌倒是造成老年人因伤致死的最大原因,因此如何对老年人进行自动摔倒监测就成为养老服务亟待解决的问题。目前,在室内摔倒监测领域中,基于可穿戴设备和基于环境传感器等主流摔倒监测方法面临着设备复杂、成本较高等问题。

鉴于此,本文将人体姿态估计引入摔倒监测领域,提出了一种基于2D视频的摔倒监测算法。首先利用OpenPose数据集提取原始数据中人体关节的位置,该数据集和开源框架是由卡内基·梅隆大学的感知计算实验室建立的,可以检测包含多人图像(2D3D)中的人体关节点。其次利用这些具有增强特征的数据构建静态分类模型和动态分类模型。

静态分类模型即对每一帧图像进行分类,由于摔倒是一个过程,每一帧都有一种状态,因此需要对每帧进行判断。文中将状态分为正常(0)、摔倒进行中(1)和摔倒已结束(2)三种状态。模型的核心算法为基于高斯核函数(RBF)的支持向量机(SVM)。由于在摔倒检测中,样本类别是不均衡的,摔倒中和已摔倒在视频中占帧数的百分比大致为3%~7%,因此本文进一步采用惩罚系数和类别权重参数分别控制对错分样本的损失度量和不同类别样本的权重。

静态分类模型的输出为视频中所有帧的标签构成的标签序列,如“0011122”,紧接着动态分类模型的功能为对这个多帧序列进行分类。对于整个视频,其间可能发生了若干次摔倒,因此动态模型每次只需要将视频中一段时间所包含的内容进行分类即可。通过计算发现,在数据集中发生摔倒的平均所需帧数为14帧左右(视频录制条件为每秒30帧),考虑到要让动态模型分类时必须保证每次输入的帧数包含一部分摔倒前和摔倒后的影像,所以每次输入20帧左右。考虑到数据预处理中只保留了视频中一半的帧数,则每次输入10个连续的标签序列即可。动态模型的核心算法为基于线性核函数(Linear Kernel)的支持向量机。

本文在3个公共摔倒数据集上进行模型训练和摔倒监测的测试,取得了较好的效果,但是模型的判断时延大概在3倍左右,即视频播放1s,判断摔倒与否的结论会在3s后得出,无法实现完全实时的摔倒监测。同时,本文对错误分类进行了人工分析,指出错误分类的原因大多为:家具遮挡,以及模型没有较好地区分坐下、蹲下与摔倒的姿势差异。进一步地,本文通过上限分析(Ceiling Analysis)发现,动态分类模型的提升空间并不大,但特征提取和静态分类模型部分仍有较大的提升空间,值得进行更多的探索。总的来说,本文仅使用人体姿态特征就取得了不错的分类效果,证实了该特征在摔倒监测研究中的潜力,为摔倒检测相关研究提供了一定的参考。

 

资料来源:

根据黄展原等于2021年发表在 计算机工程与科学 期刊题目为基于视频和人体姿态估计的老年人摔倒监测研究的文章缩写整理而成。

(责任编辑:刘妃)

Copyright © 2021 RESEARCH INSTITUTE OF SMART SENIOR CARE. All rights reserved

京ICP备18021587号-6