학습없는 이미지 캡셔닝AI, KAIST팀 2위

      2023.06.19 14:05   수정 : 2023.06.19 14:05기사원문
【밴쿠버(캐나다)=한국과학기자협회 공동취재단】 한국과학기술원(KAIST) 연구팀이 사람처럼 학습한 적 없는 이미지나 영상을 읽어내는 생성형 인공지능(AI) 모델을 개발해 전세계 142개 팀과 겨뤄 2위를 차지했다.

LG AI연구원이 세계 최대 컴퓨터 비전 학회 'CVPR'을 앞두고 18일(현지시간) 캐나다 밴쿠버 컨벤션 센터에서 '제로샷 이미지 캡셔닝'을 주제로 워크숍을 개최했다.

이날 워크숍에서는 올 2월부터 4월까지 진행된 'LG 글로벌 AI 챌린지'에서 2위를 차지한 KAIST 연구팀의 오영택 전기및전자공학부 박사과정생의 수상자 발표가 진행됐다.



올해 처음으로 개최한 이번 챌린지에 전세계 총 142개 연구팀이 참여한 가운데 중국 난징과기대 연구팀과 한국 KAIST 연구팀이 각각 1, 2위를 차지했다. 또한 카카오브레인과 우리은행 연구팀이 3, 4위를 각각 차지했다.


LG AI연구원은 국제전기전자공학회(IEEE)가 개최하는 'CVPR'에서 연구 분야 성숙도가 일정 수준 이상 될 때까지 수년간 이어가는 경우가 많은 만큼 이번 워크숍을 시작으로 이미지 캡셔닝 분야 연구를 주도해 나간다는 방침이다.

이날 워크숍에서는 'LG 글로벌 AI 챌린지'에서 2위를 차지한 KAIST 연구팀의 오영택 전기및전자공학부 박사과정생의 수상자 발표가 진행됐다.

오영택 연구원은 "LG AI연구원이 첫 진행한 'LG 글로벌 AI 챌린지'에서 AI가 기존 이미지 데이터를 참조할 때 부하가 걸리지 않도록 최적화하는 데 초점을 맞춰 좋은 결과를 낼 수 있었다"며 "최근 이미지를 보고 이를 글로 묘사하는 '비전 인식' 분야에 관심이 집중되고 있다"고 강조했다.

난징과기대 연구진은 이미지 캡셔닝 AI모델의 이미지 이해력을 높이기 위해 유사한 내용을 담고 있는 참조 데이터를 대규모 학습시켜 AI 모델의 정확도에서 가장 높은 점수를 얻어 우승을 차지했다.

워크숍에서 챌린지 주관사로 발표에 나선 알레산드라 살라 셔터스톡 AI·데이터사이언스 총괄책임자는 "AI모델을 만들 때 가장 중요한 것은 데이터를 수집하고 고품질화하는 작업"이라며 "이미지 캡셔닝 AI모델에는 편견과 고정관념을 배제하고 다양성·형평성·포용성을 가지도록 해야 한다"고 설명했다.

김승환 LG AI연구원 비전랩장은 내년 CVPR에서도 챌린지와 워크숍을 이어갈 계획이라고 밝혔다.
김승환 비젼랩장은 "올해는 일반 이미지를 주로 썼다면 내년엔 다양한 분야에 활용되는 이미지 등 실제로 활용할 수 있는 형태까지 확장하겠다"며 "이미지 이해 연구에서 연구원의 리더십을 확장해 나갈 것"이라고 말했다.

monarch@fnnews.com 김만기 기자

Hot 포토

많이 본 뉴스