의학·과학 과학

실시간으로 사람 동작을 인식한다

파이낸셜뉴스

입력 2022.01.31 12:00

수정 2022.01.31 11:59

한양대 이영문 교수팀, AI 기술 '포즈플러스섹' 개발
페이스북 기술보다 5배이상 빨라… 모션캡쳐 등 활용
사람 포즈와 픽셀 수준의 개인 인식을 바운딩박스(bounding box)없이 실시간으로 처리하는 '포즈플러스섹(PosePlusSeg)'의 AI 인식 기술. 한양대 이영문 교수 제공
사람 포즈와 픽셀 수준의 개인 인식을 바운딩박스(bounding box)없이 실시간으로 처리하는 '포즈플러스섹(PosePlusSeg)'의 AI 인식 기술. 한양대 이영문 교수 제공


[파이낸셜뉴스] 한양대 로봇공학과 이영문 교수팀이 실시간으로 사람이나 사람의 포즈를 인식·분석하는 인공지능(AI) 기술 '포즈플러스섹(PosePlusSeg)'을 개발했다. 포즈플러스섹은 AI가 사람을 인식함과 동시에 개별 행동을 추정하는 기술이다.

연구진은 이 기술이 페이스북의 사물인식 알고리즘 'Mask R-CNN'의 처리속도(5 fps)보다 5배 이상(28fps) 빠르다고 설명했다. 이를 통해 AI가 실시간으로 인식하고 분석할 수 있게 만들었다.

이영문 교수는 "이 기술이 모션캡쳐나 AI가 여러 사람을 동시에 인식하고 개인별 맞춤 서비스를 제공하는 어플리케이션 등 다양한 AI 영역에서 활용될 것"이라고 말했다.


AI가 사람의 행동을 파악하고 상황에 맞는 결정을 내리기 위해서는 사람을 정확히 인식하고 사람의 행동을 파악해야 한다.

하지만 기존 기술로는 사람의 포즈에 따라 인식률이 달라진다. 또 사람이 많아질 경우 연산량이 늘어나 분석 속도가 느려진다.

연구진은 이 문제를 해결하고자 사람을 먼저 찾고 신체부위를 찾아 포즈를 추정하는 기존 하향식(top-down) 방식 대신, 신체부위를 먼저 찾고 포즈를 추정하는 상향식(bottom-up) 방법을 사용했다.

연구진에 따르면, 포즈플러스섹의 핵심은 성능을 전반적으로 향상시키는 학습 패러다임을 통해 연산량 증가 없이 사람을 인식하고 포즈 추정한다.

또 이미지에서 물체가 어디에 위치하는지를 설명하는 기존 바운딩박스(bounding box) 방식의 개체 인식이 아닌 픽셀 방식으로 객체를 인식하고 포즈추정 모델을 동시에 학습하는 점도 특징이다.

이 기술은 독창성과 우수성을 인정받아 2월 22일부터 3월 1일까지 열리는 세계적인 AI 컨퍼런스 'AAAI'에서 발표될 예정이다.


한편 이번 연구는 인공지능융합센터, 한국연구재단, 정보통신기획평가원의 지원을 받아 진행됐다.

monarch@fnnews.com 김만기 기자

fnSurvey