메뉴 건너뛰기

정부가 운영하는 ‘AI허브’에서 내려받을 수 있는 AI 학습용 데이터들

"자율주행 AI 서비스 개발을 위한 차량 운전자와 탑승자의 상황 인식 영상"
"한국인 얼굴의 통계적 특징 파악을 위한 안면 이미지 데이터"
"반려동물의 행동을 AI가 학습할 수 있도록 행동을 분류한 영상"

'AI 허브'(https://www.aihub.or.kr/)에서 누구나 내려받을 수 있는 인공지능(AI) 학습용 데이터들입니다.

정부는 한국지능정보사회진흥원(지능정보원)을 전담 기관으로 두고 이 같은 데이터를 다양하게 만들어 공개하는 'AI 데이터사업'을 진행하고 있습니다.

2017년부터 내년까지 총 2조 5천억 원의 예산을 들여 1,300여 종의 AI 학습용 데이터를 만드는 게 목표입니다. 이렇게 큰 돈을 들인 정부 사업이 잘 되고 있는지 감사원이 들여다봤더니 부실투성이였습니다.

■"1,100억 122종 데이터 안 만들거나, 만들어도 공개 안 하고 방치"

감사원은 특히 해당 사업이 크게 확대된 2020년부터 2년 동안 구축한 AI 학습용 데이터들을 집중적으로 들여다봤습니다. 이 사업에는 총 7020억 원이 들어갔습니다.

이 기간 선정된 데이터 구축사업은 360종이었는데, 이 가운데 1148억 원의 사업비가 쓰인 122종 데이터 품질에 문제가 있는 것으로 판단했습니다.

'교통문제 해결을 위한 CCTV 교통영상' 등 33종 데이터는 수행기관이 사업비를 받아가고선 일부 데이터를 2년 넘도록 만들지 않았습니다. 그런데도 관리기관인 한국지능정보사회진흥원은 이를 그대로 방치하고 있었습니다.

또 '자율주행버스 개발 노선 주행 이미지' 등 사업 수행기관이 데이터를 만들어 뒀는데도 길게는 2년 가까이 대외에 공개하지 않은 채 둔 데이터들도 32종에 달했습니다.

심지어 '다양한 장르의 춤사위 동작' 데이터의 경우 업체가 50테라바이트(TB) 용량의 전체 데이터를 업로드했지만, 지능정보원의 운영 오류로 데이터 절반 가량이 사라진 채 절반 가량만 남아있는 것으로 파악됐습니다. 이 데이터 사업비는 19억 원에 달했습니다.

감사원 관계자는 이와 관련해 "지난해 6월 감사 당시 데이터가 절반 뿐이어서 시정을 요구했지만, 아직까지 데이터가 절반만 공개된 채 방치돼 있다"고 지적했습니다.

이에 대해 지능정보원 관계자는 "수행기관에 누락 데이터를 확인해 다시 올려달라고 요청했고, 다시 올라오는 대로 전체 데이터를 공개할 예정"이라고 설명했습니다.

■축산 농가에 돌아갈 데이터수집비 빼돌린 업체 적발


해당 사업 과정에선 일부 업체가 사업비를 횡령한 사실도 드러났습니다.

가축 관리용 인공지능 시스템 개발을 위한 소, 돼지 등 가축 영상 데이터 구축 사업에 선정된 업체 대표가 장인, 지인 등과 공모해 사업비 38억 중 13억9천만 원을 빼돌렸습니다.

이들은 축산 농가로부터 CCTV 영상 데이터 지급 비용을 지불해준 것처럼 꾸미거나 CCTV 설치 비용을 부풀리는 식으로 사업비를 가로챘습니다.

감사원의 요청으로 검찰이 현재 이 업체 대표와 장인 등을 수사 중입니다.

■"클라우드센터 화재 등에 취약…카카오 복구 지연 사태 재연 우려"

공공 클라우드 센터가 화재 등 재난 상황 대비에 취약하다는 점도 지적됐습니다.

현재 과기정통부의 인증을 받아 9개 기업이 공공용 민간 클라우드센터를 운영하고 있습니다. 그런데
일부 클라우드센터의 경우 불이 났을 때를 대비한 백업 시스템인 재해복구센터의 서버 등 장비가 터무니없이 부족해 재해복구센터 역할을 하기 어렵다는 겁니다.

2022년 판교 카카오 데이터센터 화재 당시 복구에 5일 이상 걸리면서 이용자들이 불편을 겪었던 것과 같은 사례가 재연될 수 있다는 얘깁니다.

감사원은 과학기술정보통신부에 공공용 클라우드센터의 중요 장비가 각 클라우드센터의 재해복구센터에도 구비돼 있는지 점검하는 방안을 마련하라고 통보했습니다.

■관리부실 배경으로 '한국판 뉴딜 종합계획' 예산 급증 지목

감사원은 정부의 AI 데이터 구축 사업 등이 정부의 중점 사업인데도 부실하게 관리된 배경으로 2020년 문재인 정부의 '한국판 뉴딜 종합계획' 추진으로 인한 예산 급증을 꼽았습니다.

2020년 7월 문재인 정부는 '한국판 뉴딜 종합계획'을 수립해 당초 390억 원 규모였던 AI 학습용 데이터 구축 사업비는 2조5천억 원으로 대폭 확대됐습니다.

중소기업이 필요로 하는 AI 솔루션을 공급하기 위한 'AI바우처 사업' 예산도 39억 원에서 9,500억 원으로 늘었습니다.

감사원 관계자는 "예산 급증으로 사업 규모가 급격히 불어나면서 밀어내기식 집행 등이 이뤄진 것으로 보인다"면서 "사업을 관장해야 할 지능정보원의 역량에 비해 사업 규모가 너무 컸던 부분이 관리 부실로 이어졌다"라고 지적했습니다.

■ 제보하기
▷ 전화 : 02-781-1234, 4444
▷ 이메일 : [email protected]
▷ 카카오톡 : 'KBS제보' 검색, 채널 추가
▷ 네이버, 유튜브에서 KBS뉴스를 구독해주세요!



KBS

번호 제목 글쓴이 날짜
21908 "성수보다 합정?" 20대부터 넥타이부대까지 다 잡은 마포 상권[마포구의 비밀③] 랭크뉴스 2024.06.17
21907 형제복지원 수사 검사의 추락 [현장에서] 랭크뉴스 2024.06.17
21906 푸틴 24년 만에 평양으로... 시진핑 넘어서는 北 '역대급' 환대 랭크뉴스 2024.06.17
21905 2011년생 동갑내기 발전소… 왜 석탄은 살아남고 풍력은 삽도 못 떴나 [창간기획: 초당적 '30년 전략' 짜자] 랭크뉴스 2024.06.17
21904 尹대통령 지지율, 1.4%p 떨어진 30.1%…10주째 횡보만 랭크뉴스 2024.06.17
21903 서울대병원 교수, 오늘부터 집단 휴진… 환자·의료계 불안감 랭크뉴스 2024.06.17
21902 "尹대통령 지지율 30.1%…10주 연속 30% 초반대"[리얼미터] 랭크뉴스 2024.06.17
21901 7만 명이 춤췄더니 땅이 '흔들'…지진까지 일으키는 스위프트 '위엄' 랭크뉴스 2024.06.17
21900 양육비 떼먹는 아빠의 직업은 ‘아동 학대’ 전문 인권변호사 [창+] 랭크뉴스 2024.06.17
21899 ‘50도 육박’ 사우디 메카 성지순례서 요르단인 14명 숨져 랭크뉴스 2024.06.17
21898 "직접 벌어 해결해라" 아들을 거리로 내몬 이유는? 랭크뉴스 2024.06.17
21897 박세리 집 강제 경매 넘어갔다…직접 설계한 '나혼산' 그 건물 랭크뉴스 2024.06.17
21896 엔비디아 못지 않네…Z세대 사로잡은 K컬처 ETF 수익률 '쑥쑥' 랭크뉴스 2024.06.17
21895 “도우미, 가정부, 파출부, 식모 아닌 근로자입니다”…법 시행 2년 휴·폐업 왜? 랭크뉴스 2024.06.17
21894 서울대병원, 오늘부터 휴진…정부 “진료거부 방치 엄정 대응” 랭크뉴스 2024.06.17
21893 법사위, 소위 열어 채 상병 특검법 심사…여당 불참할 듯 랭크뉴스 2024.06.17
21892 [최훈 칼럼] 여의도에 공룡이 산다 랭크뉴스 2024.06.17
21891 김 여사 도움으로 韓서 수술…누워만 있던 아이, 이젠 뛴다 랭크뉴스 2024.06.17
21890 "제발 승진시키지 마세요"…가늘고 길게 가고 싶은 '임포족'을 아시나요? 랭크뉴스 2024.06.17
21889 "홍대병의 고장, 마포구 상권이 오래가는 이유" 도보마포 신현오 인터뷰 [마포구의 비밀④] 랭크뉴스 2024.06.17