详解动作捕捉技术原理与应用优缺点分析(详解动作捕捉技术原理与应用优缺点)

电影《魔戒》里的咕鲁,电影《泰迪熊》里的毛绒熊,电影《阿凡达》里的部落公主.电影中经典替身的生动表演总能深深打动观众,它们都是由一项重要技术3354动作捕捉赋予生命的。

运动捕捉(Mocap)是指记录和处理人或其他物体的运动的技术。在多个摄像机捕捉到真实演员的动作后,这些动作被还原并渲染成相应的虚拟图像。这个过程的技术应用就是动作捕捉,英文表达为运动捕捉。

运动捕捉技术涉及计算机可以直接理解和处理的数据,用于物理空间中物体的尺寸测量、定位和方向确定等。在运动物体的关键位置设置追踪器,通过运动捕捉系统捕捉追踪器的位置,经计算机处理后得到三维空间坐标的数据。当数据被计算机识别后,可以应用于动画、步态分析、生物力学、人体工程学等领域。

运动捕捉技术的背景

运动捕捉的起源一般认为是1915年Fleischer发明的图像描述。这是动漫制作中产生的一种技术。艺术家通过在播放给他们的现场文章剪辑中仔细描绘每一个静态画面,来模拟虚拟世界中动画角色的现实表现。

这个过程本身就很无聊。但对这些动画师来说,幸运且难忘的是,1983年,麻省理工学院(MIT)开发了一套图形木偶。

这个系统使用了早期的光学运动捕捉系统,称为眼动,它依靠一系列发光二极管通过制作动作来生成动画脚本(Sturman,1999)。本质上,这个木偶充当了第一个动作捕捉服装。它自带的感应球数量非常有限,可以大致定位人体结构的关键骨骼点。

这项技术的出现迅速为动作捕捉的快速发展奠定了基础,为后续各种动作捕捉提供了方向,也引领了动作捕捉技术的潮流,包括今天的动作捕捉技术。

动作捕捉技术的基本原理

动作捕捉系统是指用于实现动作捕捉的专业技术设备。根据不同的原理,不同的动作捕捉系统有不同的系统组成。

一般来说,运动捕捉系统通常由硬件和软件组成。通常,硬件包括信号发射和接收传感器、信号传输设备和数据处理设备。一般来说,软件包括系统设置、空间定位和校准、运动捕捉和数据处理等功能模块。

发射传感器通常位于运动物体的关键位置,如人体的关节处。连续发射的信号被定位传感器接收后,通过传输设备进入数据处理工作站,在软件中解算运动,得到相干的三维运动数据,包括运动目标的三维空间坐标、人体关节的六自由度运动参数等。并生成三维骨骼运动数据,可用于驱动骨骼动画。这是动作捕捉系统的一般工作流程。

动作捕捉技术的组成

传感器

所谓传感器,就是固定在运动物体特定部位的跟踪装置。它将向运动捕捉系统提供运动对象的位置信息,并且通常跟踪器的数量将根据捕捉的细节来确定。

信号捕获设备

根据动作捕捉系统的类型,这种设备会有所不同。它们负责位置信号的捕捉。对于机械系统,它是一个捕捉电信号的电路板,对于光学运动捕捉系统,它是一个高分辨率的红外摄像头。

数据传输设备

运动捕捉系统,尤其是需要实时效果的系统,需要快速准确地将大量的运动数据从信号捕捉设备传输到计算机系统进行处理,而数据传输设备就是用来完成这一任务的。

数据处理设备

运动捕捉系统捕捉到的数据需要进行校正和处理,然后必须结合三维模型来完成计算机动画,这就需要我们应用数据处理软件或硬件来完成这项工作。不管是软件还是硬件,都是用电脑的高速运算能力来完成数据处理,让三维模型能够真实自然的移动。在剧中,汤姆汉克斯穿着一件带有150个传感器的黑色紧身衣,这样电脑就可以捕捉到他的眼睑、嘴唇、眉毛甚至每一个身体的表情和动作。

动作捕捉技术的类型

动作捕捉系统有很多种。一般按照技术原理可以分为机械式、声学式、电磁式、惯性传感器式、光学式五大类。其中,光学类型根据目标特性不同可分为标记点光学和未标记点光学。最近市场上出现了所谓的热运动捕捉系统,本质上属于无标记点光学运动捕捉的范畴,但光学成像传感器主要工作在近红外或红外波段。

机械类型

机械运动捕捉系统依靠机械设备来跟踪和测量运动轨迹。典型的系统由多个接头和刚性连杆组成。角度传感器安装在可旋转的关节中,可以测量关节旋转角度的变化。当装置运动时,根据角度传感器测得的角度变化和连杆的长度,可以得到杆的端点在空间的位置和运动轨迹。X-1st就是这类产品的代表。其优点是成本低、精度高、采样频率高,但最大的缺点是动作表演不方便。联动结构和传感器电缆限制了表演者动作极大,特别是连续运动受到阻碍,难以实现真正的动态还原。

声学

声运动捕捉系统一般由发射机、接收机和处理系统组成。发射装置一般指超声波发生器,接收系统一般由三个以上的超声波探头阵列组成。通过测量声波从发射器到传感器的时间差或相位差,确定到接收器的距离,并根据三个三角形接收传感器获得的距离信息计算超声波发生器到接收器的位置和方向。它最大的优点是成本低,缺点是精度差,实时性低,受噪声和多次反射影响大。

电磁型

电磁运动捕捉系统一般由发射机、接收机和数据处理单元组成。发射源在空间产生按一定时空规律分布的电磁场;接收传感器放置在表演者的关键位置的身体。当表演者在电磁场中移动时,接收传感器通过电缆或无线将接收到的信号传输到处理单元。根据这些信号,可以计算每个传感器的空间位置和方向。Polhemus和Ascension是这类产品制造商的代表。它们最大的特点是使用简单,鲁棒性好,实时性强。它们的缺点是对金属物体很敏感。金属物体引起的电磁场畸变对精度影响很大,采样率低,不利于快速运动的捕捉。线缆传感器连接也对动作表现形成约束和障碍,不利于复杂动作的表现。

惯性类型

惯性运动捕捉系统由姿态传感器、信号接收器和数据处理系统组成。姿态传感器固定在人体主要肢体上,通过蓝牙等无线传输将姿态信号传输到数据处理系统,计算出运动。其中姿态传感器集成了惯性传感器、重力传感器、加速度计、磁感应仪、微陀螺仪等元件,获取肢体各部分的姿态信息。然后,结合骨骼的长度信息和骨骼的层次连接关系,计算相关节点的空间位置信息。代表产品有Xsens、3DSuite等。这些产品的主要优点是便携性强,操作简单,几乎无限的表演空间,方便户外使用。但由于技术原理的限制,弊端显而易见。一方面,传感器本身可以进行绝对空间定位,综合肢体各部位姿态信息得到的空间位置信息造成不同程度的积分漂移,导致空间定位不准确;另一方面,原理本身是基于单脚支撑和地面约束的假设,系统可以解决两脚离地的运动定位。此外,传感器自身重量和线缆连接也会制约动作性能,设备成本会随着捕捉对象数量的增加而成倍增加。一些传感器也会受到周围铁磁体的影响的准确性。

光学类型

光学运动捕捉系统是基于计算机视觉的原理[2][3],由多个高速摄像机从不同角度对目标特征点进行监视和跟踪,完成运动捕捉的任务。理论上,对于空间中的任意一点,只要能被两台摄像机同时看到,就可以确定该点此时在空间中的位置。当摄像机以足够高的速率连续拍摄时,可以从图像序列中获得该点的运动轨迹。

这些系统的采集传感器通常是光学相机,不同的是有不同类型的目标传感器。一种是基于二维图像特征或三维形状特征提取的关节信息作为检测目标。这类系统可以统称为无标记点光学运动捕捉系统,另一类是将标记点粘贴在物体上作为目标传感器。这种系统被称为标记点光学运动捕捉系统。

1、未标记的光学元件

无标记点运动捕捉的原理大致有三种:第一种是基于普通文章图像的运动捕捉,通过2D图像的人体轮廓检测提取2D图像中关节点的坐标,然后根据多摄像机视觉的3D测量计算出关节的3D坐标。由于常见图像信息杂乱,这种计算通常鲁棒性差,速度慢,实时性差,关节缺乏量化的信息参考,因此计算误差较大。目前,这类技术大多处于实验室研究阶段。二是基于主动热源照射分离前景和背景信息的红外相机图像的运动捕捉,称为热运动捕捉。原理与第一种类似,只是在热源照射后,图像前景和背景的分离大大提高了人体图形检测的速度,提高了三维重建的鲁棒性和计算速度。而来自固定方向的热源照射导致运动捕捉时人体运动方向受限,很难捕捉到360度全方位的运动,如转弯、俯仰等,不适用,也不可能。第三是3D深度信息的运动捕捉。该系统基于结构光编码投影实时获取视场中物体的三维深度信息,根据三维形状检测人体轮廓,提取关节运动轨迹。这类技术的代表产品是微软公司的kinect传感器[5],在动作识别方面鲁棒性好,采样率高,价格非常低廉。很多发烧友尝试使用kinect进行动作捕捉,但效果并不理想。这是因为kinect 的应用定位是运动识别传感器,而不是精确捕捉,也有一些

2、标记的光学元件

标记点光学运动捕捉系统一般由光学标记器、运动捕捉摄像机、信号传输设备和数据处理工作站组成。人们通常所说的光学运动捕捉系统通常是指这种标记点的运动捕捉系统。将标志点贴在运动物体的关键部位(如人体的关节等。),多个动作捕捉相机从不同角度实时检测标记点,数据实时传输到数据处理工作站。根据三角测量原理,精确计算标记点的空间坐标,然后从生物运动学原理计算骨骼的6自由度运动。

这里根据标记点发光技术的不同,可以分为主动式和被动式光学运动捕捉系统:

(1)主动光学

主动光学运动捕捉系统的标志点由led组成,附着在人体的主要关节上。发光二极管通过电缆连接,并由绑在人体表面的电源设备供电。

其主要优点是采用高亮度led作为光学识别器,可以在一定程度上捕捉室外运动,LED受脉冲信号控制,使得LED可以通过时域编码进行识别,鲁棒性好,跟踪精度高。

缺点是:

首先,时序编码的LED识别原理本质上是依靠摄像机在不同时间对不同的标记进行捕捉成像进行ID识别,相当于在同一动作帧中依次曝光每个标记,破坏了动作捕捉中标记检测的同步性,导致动作变形,不利于快速动作捕捉;

其次,由于相机帧率多用于识别单帧中的不同标记点,有效动作帧的采样率较低,不利于快速运动捕捉和数据分析。

第三,LED标志物的可视角度小(发射角度约120度),通常将两个摄像头集成在一个抓拍镜头中进行近距离采集。这种狭窄的基线结构导致视觉3D测量的精度较低,在运动过程中由于运动遮挡等问题,频繁的数据丢失仍然是不可避免的。如果尽可能避免遮挡造成的数据丢失,则需要增加一倍的运动捕捉镜头数量来弥补遮挡盲区,设备成本也会增加一倍。

第四,由于时序编码原理的限制,系统能够支持的标记总数受到严格限制。在保证足够采样率的前提下,同时采集的个数不要超过2个,标记点越多,单帧逐点曝光时间越长,运动变形越严重。

(2)无源光学型

被动式光学运动捕捉系统,又称反射式光学运动捕捉系统,其标志点通常是一种高亮度回归反射球,贴在人体主要关节处。从动作捕捉镜头发射的LED照射光通过反射球反射到动作捕捉相机,并且在空间中检测和定位标记。

其主要优点是技术成熟,精度高,采样率高,动作捕捉准确,性能和使用灵活快速,标记点可以低成本随意添加和排列,应用范围广;

主要缺点是:

一是对视场内的太阳光捕捉敏感,太阳光在地面形成的光斑可能被误认为标志点,造成目标干扰,因此系统一般需要在室内环境下正常工作;

其次,标志点的识别容易出错。由于反射标志点没有唯一对应的ID信息,运动过程中的遮挡等问题很容易导致目标跟踪的错误,造成标志点ID的混乱。这种情况通常会导致运动捕捉的场景实时动画演示效果差,动作容易错位,后期处理过程中需要人工干预修复数据,大大增加了工作量。而新一代技术嵌入了先进的智能捕捉技术,具有强大的标记点自动识别和纠错能力,很大程度上满足了现场实时动画演示的需求,大大减少了人工干预的工作量,进一步增强了实用性

动作捕捉的优点是表演者活动范围广,不受线缆和机械设备的限制,使用方便。采样率高,可以满足大部分运动测量的需要。Marker价格便宜,易于扩展。更实用的是,可以方便的实现电影和游戏中的各种炫酷特效。

劣势

该系统价格昂贵,虽然可以捕捉实时运动,但后期处理(包括标识物的识别、跟踪和空间坐标的计算)需要很长时间。这种系统对演出场地的光照和反射很敏感。设备的校准也很复杂,尤其是当运动复杂时。不同部位的标记容易混淆和遮挡,导致错误的结果,在后处理过程中往往需要人工干预。由于各种限制,几乎所有的光学跟踪系统仍然需要依靠后处理程序来分析、处理和整理捕获的数据,然后才能应用于动画角色模型。

运动捕捉技术的主要应用领域

动画制作

将运动捕捉技术应用到动画中,可以大大提高动画的水平。大大提高了动画制作的效率,降低了成本,使动画制作过程更加直观,效果更加生动。

虚拟现实系统

为了实现人与虚拟环境和系统的交互,需要确定参与者的位置和方向头、手、身体等。准确跟踪和衡量参与者动作,并实时检测这些动作,以便将这些数据反馈给显示和控制系统。这些工作对于虚拟现实系统是必不可少的,虚拟现实系统是运动捕捉技术的研究内容。

机器人远程控制

机器人将危险环境的信息传递给控制器,控制器根据信息做出各种动作。动作捕捉系统捕捉动作,实时传输给机器人,控制它完成同样的动作。与传统的遥控方式相比,该系统可以实现更加直观、细致、复杂、灵活、快速的动作控制,大大提高了机器人处理复杂情况的能力。目前,机器人的全自动控制还不成熟,因此这项技术意义重大。

互动游戏

动作捕捉技术可以用来捕捉玩家的各种动作,用来驱动游戏环境中角色的动作,给玩家一种全新的参与感,增强游戏的真实感和交互性。

体育

运动捕捉技术可以捕捉运动员动作,便于定量分析。结合人体生理学和物理学原理,研究和改进方法,使运动训练摆脱单纯依靠经验的状态,进入理论化和数字化时代。也可以捕捉到较差运动员的动作,与优秀运动员的动作进行对比,从而帮助他们训练。

此外,在人机工程学研究、模拟训练、生物力学研究等领域,动作捕捉技术同样大有可为。可以预计,随着技术本身的发展和相关应用领域技术水平的提高,运动捕捉技术将会得到越来越广泛的应用。

本文为传感器技术平台原创文章。转载需联系我们获得授权!未经允许转载,我们将进行投诉!