[중국 AI 연구 산실 'BAAI' 단독 인터뷰]
"딥시크, 오픈소스·치열한 경쟁이 촉발"
"한국, '인재·인프라·오픈소스' 주력해야"
"딥시크, 오픈소스·치열한 경쟁이 촉발"
"한국, '인재·인프라·오픈소스' 주력해야"
편집자주
다음 세대의 삶을 책임질 미래 첨단 산업이 경쟁력을 잃어가고 있다. 추격자였던 중국이 선도국으로 변모하는 사이 한국 기술은 규제와 정쟁에 발목 잡혀 제자리걸음을 했다. '뛰는 차이나, 기로의 K산업' 2부에선 미래 산업 경쟁력을 회복하기 위한 전략을 분석했다.중국의 인공지능(AI) 모델 연구를 선도하며 AI 산업 발전을 이끄는 비영리·비정부 연구기관 '베이징 인공지능 아카데미(BAAI)'는 연구기관으로는 이례적으로 지난 3월 도널드 트럼프 2기 미국 행정부의 '수출 제한 블랙리스트'에 올랐다. 지난 22일 베이징시 하이뎬구의 BAAI에서 진행된 인터뷰에서 린융화 BAAI 부원장이 발언하고 있다. BAAI가 한국 언론과 인터뷰를 진행한 것은 이번이 처음이다. 베이징=이혜미 특파원
지난 1월 중국의 인공지능(AI) 업체 딥시크가 오픈소스(소스코드를 공개한 소프트웨어)로 공개한 '딥시크 R1' 추론형 AI 모델의 등장은 전 세계에 중국의 '첨단기술 굴기'를 보여준 상징적 사건이었다. 출시 후 채 2주도 되지 않아 바이두, 알리바바, 텐센트 등 중국의 대형 인터넷 업체는 물론이고 로봇과 전기차 업체까지 '딥시크 적용' 행렬에 일사불란하게 동참하는 모습도 인상적이었다. 일각에서는 "중국 특유의 국가 주도 정책이 개입했을 것"이라는 분석이 나왔다.
그러나 22일 베이징 하이뎬구에 위치한 '베이징 인공지능 아카데미(BAAI)'에서 만난 린융화 BAAI 부원장은 딥시크 성공엔 정부의 역할보다 오픈소스 방식이 촉발한 중국 AI 산업 내의 치열한 경쟁이 큰 역할을 했다고 강조했다. 딥시크나 챗GPT 같은 대규모 언어 모델(LLM)을 구축하려면 막대한 비용이 드는데, 오픈소스 방식은 중복 투자를 줄이고 경쟁과 협업을 동시에 가능케 하므로 혁신을 만들어낼 수 있다는 설명이다. 실제로 중국 공업정보화부에 따르면 중국 내 AI 기업은 4,400개(2023년 기준)가 넘고, 2014년부터 10년간 출원된 생성형AI 관련 특허 5만4,000여 건 가운데 중국 출원 특허는 3만8,210건으로 약 70%를 차지한다.
2018년 설립된 BAAI는 독립된 비영리 연구기관이다. 중국 최고 석학들과 연구를 진행하는데, 지금까지 약 200개가 넘는 AI 모델(LLM, 멀티모달 LLM 등)과 140개 이상 데이터셋(AI 모델 훈련을 위한 방대한 데이터 모음)을 오픈소스로 공개했다. 2021년 BAAI가 발표한 LLM '우다오 2.0'은 당시 오픈AI의 챗GPT-3보다 약 10배 많은 매개변수를 적용하며 중국 AI의 수준을 비약적으로 높였다는 평가를 받는다.
올 초 출범한 도널드 트럼프 2기 미국 행정부는 지난 3월 BAAI를 '수출 통제 블랙리스트'에 올렸다. 비정부·비영리 연구기관에 가해진 제재로는 의외라는 평가가 잇따랐다. 오픈AI로 대표되는 미국 AI 산업의 헤게모니를 깨고 수익화 전략을 흔들기 위한 중국의 오픈소스 전략을 두고, 트럼프 정부가 이를 중국의 글로벌 AI 영향력 확대로 받아들인 결과로 풀이된다.
중국 생성형 인공지능(AI) 업체 '딥시크' 로고. 로이터 연합뉴스 자료사진
한국일보는 미중 간 AI 패권 경쟁이 격화하고 중국의 AI 발전이 세계적 주목을 받는 지금, 한국 언론 중 처음으로 BAAI와 인터뷰를 진행했다
.
린 부원장은 IBM 중국연구소 소장을 역임하고, 2019년 포브스의 '중국 여성 과학기술자' 명단에도 이름을 올린 저명한 AI 전문가다. 다음은 린 부원장과의 일문일답.-BAAI가 중국 AI 산업 내에서 갖는 전략적 위치는.
"우리의 정체성은 '인공지능 혁신을 이끄는 주체'가 되는 것이다. 대학이 하기 어려운 일, 기업이 꺼리는 산업 발전과 혁신에 중요한 일을 수행한다. 대학은 여러 자원과 연구 방향을 연계해 체계적으로 혁신을 추진해 나가는 것에 어려움을 겪고, 상업적 목표를 추구하는 기업은 장기적인 연구 투자나 공공기술 개발에 소극적이다. BAAI는 장기적인 목표를 가진 첨단 혁신 연구를 진행하고, 공공기술 측면의 혁신 돌파구를 마련하는 데 주력한다."
-AI 연구는 막대한 재원을 필요로 하는데.
"독립적인 비영리 기관인 BAAI는 정부 투자, 기업의 기부, 연구 프로젝트 등 여러 경로로 재원을 조달한다. '원장 책임제'로 운영되며 발전 전략과 매년 장기 프로젝트 투자는 모두 BAAI가 결정한다. AI 연구 혁신이 고위험성과 불확실성을 갖고 있는 만큼, 연구 인력과 과학자들이 더 자율적으로 의사결정을 내릴 수 있도록 하기 위함이다."
-정부 주도 정책, 대규모 데이터 인프라, 빠른 상용화 속도 등이 특징인 '중국식 AI 발전 모델'이 주목받고 있다.
"우리는 특별히 '중국식 AI 발전 모델'을 강조하지는 않는다. 다만 중국 AI의 발전은 여러 주체의 협력으로 이루어지고 있다는 점을 강조하고 싶다. 챗GPT 출시 직후인 2023년, 글로벌 데이터셋에서 중국어의 비중이 매우 낮다는 걸 알게 됐다. 이에 대학, 기업, 연구기관 등 수십 개 단체와 협업해 중국어 데이터셋을 공동 대응으로 구축했다. 우리는 데이터를 수집하고 이를 오픈소스로 공유하는 일을 적극적으로 진행하고 있으며, 이것이 국내 AI 모델 산업의 제품화와 상업화 과정을 가속화하고 있다. 2023년 8월에는 불과 8개의 AI 모델이 당국의 등록 절차를 통과했지만, 지난 한 해에는 200개 이상 AI 모델이 등록됐다."
-중국처럼 국가가 주도하는 AI 산업에 대해서는 늘 윤리적 비판이 뒤따른다.
"데이터셋 구축은 정부의 강제적인 지시에 따른 것이 아니라, 정부가 장려하고 기업이 자발적으로 참여한 결과다. AI 윤리 문제가 세계적으로 주목받는 상황에서 BAAI는 데이터셋을 공개하기 전 폭력, 편견, 사생활 침해 등 윤리적 위험 요소를 철저히 제거하고 필터링한다."
-미국의 AI 칩 수출 제한 등 규제가 중국의 AI 연구에 미치는 영향이 있나.
"국제 정세는 확실히 AI 연구에 영향을 미친다. 하지만 중국은 일찌감치 반도체 연구와 혁신을 시작해왔다. BAAI는 2021년부터 대비를 해왔으며, 2022년부터 다양한 AI 칩과 하드웨어 환경에서 모델을 실행할 수 있게 하는 오픈소스 시스템 소프트웨어인 'FlagOS'도 구축하고 있다. 다만 이는 미국의 기술 제한에 대응하기 위한 것이라기보다는, LLM에 필요한 연산 능력이 너무 비싸기에 더 많은 사람들이 저비용으로 AI 연산 능력을 사용할 수 있도록 하기 위한 것이었다."
-한국도 국가 차원에서 AI를 발전시켜야 한다는 논의가 활발하다.
"△인재 전략 △데이터 인프라 구축 △오픈소스 생태계 조성을 강조하고 싶다. AI 기술 발전은 인재에 달려 있으므로, 국내 인재 양성과 함께 해외 우수 인재 유치를 통해 기술 역량을 확장해야 한다. 또 한국어는 단순한 언어가 아니라 중요한 문화 자산이므로, 고품질의 한국어 데이터셋 구축이 필요하다. 마지막으로 막대한 비용이 드는 초거대 AI 혁신에서 산업 전반의 효율성을 높이는 오픈소스 개방과 협업은 필수다. 딥시크도 오픈소스로 출시된 것이 아니었다면 이렇게 빠른 산업 전환을 촉진할 수 없었을 것이다."
중국 베이징시 하이뎬구에 위치한 베이징 인공지능 아카데미(BAAI) 전경. 베이징=이혜미 특파원