실시간으로 사람 동작을 인식한다

한양대 이영문 교수팀, AI 기술 '포즈플러스섹' 개발
페이스북 기술보다 5배이상 빨라… 모션캡쳐 등 활용

사람 포즈와 픽셀 수준의 개인 인식을 바운딩박스(bounding box)없이 실시간으로 처리하는 '포즈플러스섹(PosePlusSeg)'의 AI 인식 기술. 한양대 이영문 교수 제공

[파이낸셜뉴스] 한양대 로봇공학과 이영문 교수팀이 실시간으로 사람이나 사람의 포즈를 인식·분석하는 인공지능(AI) 기술 '포즈플러스섹(PosePlusSeg)'을 개발했다. 포즈플러스섹은 AI가 사람을 인식함과 동시에 개별 행동을 추정하는 기술이다.

연구진은 이 기술이 페이스북의 사물인식 알고리즘 'Mask R-CNN'의 처리속도(5 fps)보다 5배 이상(28fps) 빠르다고 설명했다. 이를 통해 AI가 실시간으로 인식하고 분석할 수 있게 만들었다.

이영문 교수는 "이 기술이 모션캡쳐나 AI가 여러 사람을 동시에 인식하고 개인별 맞춤 서비스를 제공하는 어플리케이션 등 다양한 AI 영역에서 활용될 것"이라고 말했다.

AI가 사람의 행동을 파악하고 상황에 맞는 결정을 내리기 위해서는 사람을 정확히 인식하고 사람의 행동을 파악해야 한다.

하지만 기존 기술로는 사람의 포즈에 따라 인식률이 달라진다. 또 사람이 많아질 경우 연산량이 늘어나 분석 속도가 느려진다.

연구진은 이 문제를 해결하고자 사람을 먼저 찾고 신체부위를 찾아 포즈를 추정하는 기존 하향식(top-down) 방식 대신, 신체부위를 먼저 찾고 포즈를 추정하는 상향식(bottom-up) 방법을 사용했다.

연구진에 따르면, 포즈플러스섹의 핵심은 성능을 전반적으로 향상시키는 학습 패러다임을 통해 연산량 증가 없이 사람을 인식하고 포즈 추정한다.

또 이미지에서 물체가 어디에 위치하는지를 설명하는 기존 바운딩박스(bounding box) 방식의 개체 인식이 아닌 픽셀 방식으로 객체를 인식하고 포즈추정 모델을 동시에 학습하는 점도 특징이다.

이 기술은 독창성과 우수성을 인정받아 2월 22일부터 3월 1일까지 열리는 세계적인 AI 컨퍼런스 'AAAI'에서 발표될 예정이다.

한편 이번 연구는 인공지능융합센터, 한국연구재단, 정보통신기획평가원의 지원을 받아 진행됐다.

monarch@fnnews.com 김만기 기자

실시간으로 사람 동작을 인식한다

fnSurvey