TOG 2017
http://vcai.mpi-inf.mpg.de/projects/VNect/
Abstract
우리는 하나의 카메라를 이용해서 안정적이고 견고한 방식의 full global 3D skeletal pose를 캡쳐하는 실시간 방식에 대해 제안한다. 우리의 기법은 새로운 CNN 기반의 pose regressor를 kinematic skeleton fitting과 결합하는 방식으로 탄생되었다. 우리의 fully convolutional pose formulation은 실시간에 2D 조인트를 3D 조인트로 regress하면서, 인풋 프레임이 완벽하게 크롭되어오지 않을 때에도 작동가능하다. 실시간 kinematic skeleton fitting은 CNN 출력물을 이용하여 현재 이용하고 있는 kinematic skeleton을 기반으로 temporally stable한 3D 글로벌 pose reconstruction을 수행한다. 이 방식은 하나의 RGB 카메라만을 이용하여 3D 캐릭터 컨트롤을 할 수 있게 한다. 우리 기법의 정확도는 17년 당시 최선의 offline 3D 단안 RGB pose estimation 기법과 비교되었다. 우리의 기법은 RGBD 기법과 견줄만 하거나, 종종 더 나은 결과를 생성하는데, RGB 만을 가지고 이러한 결과를 얻는다는 것은 훨씬 다양한 곳에 적용이 가능하다.
음 생각보다 간단한데?......
'인공지능 공부' 카테고리의 다른 글
BOA (Bilevel Online Adaptation) for Out-of-Domain Human Mesh Reconstruction 읽기 (0) | 2022.07.29 |
---|---|
PIFuHD: Multi-Level Pixel-Aligned Implicit Function for High-Resolution 3D Human Digitization (0) | 2022.03.24 |
Mesh Graphormer (0) | 2022.03.03 |
VIBE: Video Inference for Human Body Pose and Shape Estimation (0) | 2022.03.03 |
PyTorch Image Models(timm) 퀵 가이드 (0) | 2022.02.24 |