IT 정보통신

학습한적 없는데 읽어낸다... KAIST팀 캡셔닝 AI '2위' [LG '캡셔닝 AI' 최초 공개]

파이낸셜뉴스

입력 2023.06.19 19:25

수정 2023.06.19 19:25

LG 글로벌 챌린지 142곳 참여
1위는 정확도 높인 난징과기대
【파이낸셜뉴스 서울·밴쿠버(캐나다)=김만기 기자 한국과학기자협회 공동취재단】 한국과학기술원(KAIST) 연구팀이 사람처럼 학습한 적 없는 이미지나 영상을 읽어내는 생성형 인공지능(AI) 모델을 개발해 전세계 142개 팀과 겨뤄 2위를 차지했다.

LG AI연구원이 세계 최대 컴퓨터 비전 학회 'CVPR'을 앞두고 18일(현지시간) 캐나다 밴쿠버 컨벤션센터에서 '제로샷 이미지 캡셔닝'을 주제로 워크숍을 개최했다. 이날 워크숍에서는 올 2~4월 진행된 'LG 글로벌 AI 챌린지'에서 2위를 차지한 KAIST 연구팀의 오영택 전기및전자공학부 박사과정생의 수상자 발표가 진행됐다.

올해 처음 개최한 이번 챌린지에 전 세계 총 142개 연구팀이 참여한 가운데 중국 난징과기대 연구팀과 한국 KAIST 연구팀이 각각 1·2위를 차지했다.
또 카카오브레인과 우리은행 연구팀이 3·4위를 각각 차지했다.
LG AI연구원은 국제전기전자공학회(IEEE)가 개최하는 'CVPR'에서 연구 분야 성숙도가 일정수준 이상 될 때까지 수년간 이어가는 경우가 많은 만큼 이번 워크숍을 시작으로 이미지 캡셔닝 분야 연구를 주도해 나갈 방침이다.


난징과기대 연구진은 이미지 캡셔닝 AI모델의 이미지 이해력을 높이기 위해 유사한 내용을 담고 있는 참조 데이터를 대규모 학습시켜 AI 모델의 정확도에서 가장 높은 점수를 얻어 우승을 차지했다.


fnSurvey