개인정보보호위원회는 AI 개발에 필수적인 공개 데이터를 적법하고 안전하게 처리하는 기준이 될 '인공지능(AI) 개발·서비스를 위한 공개된 개인정보 처리 안내서'를 마련해 17일 공개했다.
생성형AI가 폭발적으로 성장하면서 광범위한 데이터 학습이 필수가 됐다. 공개 데이터는 사진, 게시물, 영상 등 인터넷 상 누구나 합법적으로 접근할 수 있는 데이터로 생성형AI 개발을 위한 학습의 핵심 요소다. AI 기업들은 커먼크롤, 위키백과, 블로그, 웹사이트 등에 있는 공개 데이터를 웹 스크래핑 등의 방식으로 수집해 AI 학습데이터로 활용하고 있다.
조윤주 기자
※ 저작권자 ⓒ 파이낸셜뉴스, 무단전재-재배포 금지