[베인의 위닝 전략]
사진=REUTERS
올해 설 연휴 글로벌 테크 업계는 중국 스타트업이 개발한 인공지능(AI) ‘딥시크(DeepSeek)’의 등장으로 격변의 소용돌이에 휘말렸다.
테크 기술을 주로 다루지 않던 미국 뉴욕포스트마저 1면에 ‘적색 경보: 중국 AI의 ‘스푸트니크 모먼트’가 미국 주식시장의 패닉을 불렀다’는 자극적인 헤드라인을 실었을 정도로 영미권 여론은 크게 동요했다.
이 소식이 전해진 직후 엔비디아, AMD, 인텔 등 주요 AI 관련 기업들의 주가가 급락했고 데이터센터 전력 공급 기업들의 주가도 20% 이상 하락하는 등 시장은 즉각적인 반응을 보였다.
표면적으로는 딥시크의 파격적인 개발 비용 절감이 주목받았다. 오픈AI가 GPT-4를 개발하는 데 1억 달러와 1만6000대의 그래픽처리장치(GPU)를 필요로 했던 것과 대조적으로 딥시크는 불과 600만 달러와 2000대의 GPU만으로 유사한 성능을 구현했다고 발표했기 때문이다.
베인앤드컴퍼니가 이들 AI의 성능을 자체적으로 테스트한 결과에 따르면 딥시크는 정보 검색과 추론 능력에서 실제로 GPT-4와 유사한 수준의 성능을 보여준 것으로 분석된다. 오픈AI와 견줘볼 때 90% 이상 낮은 비용으로 세계 최고 수준의 AI 성능을 구현한 것이다.
사실 ‘가성비 AI’의 등장은 그리 놀랍지 않다. AI 추론 비용이 매년 10배씩 감소해온 것은 자연스러운 진화의 결과로 보는 전문가들이 적지 않다. 2022년 초 GPT-3의 토큰당 60달러였던 비용이 2024년 초 0.1달러까지 하락한 것이 이를 방증한다.
더 큰 충격은 중국의 무명 오픈소스 스타트업이 미국 테크 업계의 최신 기술을 총동원해 단숨에 선두권에 진입했다는 점이다. 일부 업계 전문가들은 딥시크가 단순히 비용 절감을 이룬 것이 아니라 AI 개발의 새로운 패러다임을 제시했다고 보고 있다.
2023년 설립된 이 회사는 중국 퀀트펀드 하이플라이어의 지원을 받아 200명도 채 되지 않는 인력으로 이러한 성과를 냈다. 이는 AI 개발이 더 이상 거대 테크 기업들의 전유물이 아닐 수 있다는 가능성을 시사한다.
추론 모델 가격 비교 - 오픈AI 대비 20~40배 저렴. 자료=베인앤드컴퍼니·그래픽=송영 기자
중국發 AI 혁신의 실체와 논란
딥시크의 핵심 경쟁력은 ‘Mixture-of-Experts(MoE)’ 아키텍처와 ‘Multi-head Latent Attention(MHLA)’ 메커니즘의 기술적 결합에 있다. 딥시크에 따르면 이 회사는 6710억 개의 파라미터 중 370억 개만을 선택적으로 활성화했다.
결론적으로 메모리 사용량을 기존 대비 5~13% 수준으로 감축하는 데 성공한 것이다. 또한 일반적인 AI 모델이 모든 입력값에 대해 전체 파라미터를 사용하는 것과 달리 MoE는 각 작업에 가장 적합한 ‘전문가’ 네트워크만을 선택적으로 활용한다. 이는 인간이 특정 문제를 해결할 때 관련 전문가의 도움만을 받는 것과 유사한 방식이다.
특히 주목할 만한 것은 강화학습을 통한 모델 개선 방식이다. 기존의 지도학습 기반 미세조정(SFT) 대신 모델의 자동화된 평가 기능을 활용해 학습 과정에서 지속적인 성능 개선이 가능하도록 했다. 이러한 접근법은 고비용의 레이블링된 데이터 없이도 모델의 성능을 향상시킬 수 있다는 점에서 혁신적이다.
동시에 여러 의문점도 제기되고 있다. 실제 개발 비용의 검증 문제, 오픈AI 모델 활용 여부, IP 도용 논란 등이 그것이다. 특히 중국 기업이 최신 GPU를 어떻게 확보했는지, 그리고 공개된 비용이 전체 개발 과정의 실제 비용을 반영하는지에 대한 의구심이 존재한다.
AI 아웃소싱 업체 스케일AI의 최고경영자(CEO) 알렉산더 왕은 “중국의 연구실은 보통 생각하는 것보다 H100을 더 많이 보유하고 있으며 딥시크는 약 5만 개의 H100을 보유하고 있다”고 주장했다.
MMLU 기준 백만 토큰당 최저가 비교. 자료=베인앤드컴퍼니·그래픽=송영 기자
제본스의 역설로 본 AI 산업의 새로운 변곡점
논란에도 불구하고 딥시크의 등장이 시장에 미친 영향은 분명하다. 저비용 개발 모델의 가능성이 입증되면서 고비용 인프라 투자에 대한 재검토가 이뤄지고 있다.
특히 클라우드 서비스 제공업체들의 대규모 설비투자 계획에 대한 의구심이 커지고 있으며 이는 데이터센터 관련 기업들의 주가 하락으로 이어졌다. 그러나 AI 산업 전문가들은 오히려 이러한 변화가 AI 시장 규모를 더욱 확대할 것으로 전망한다.
업계에선 최근 AI 시장의 동향을 분석할 때 19세기 영국의 경제학자 윌리엄 스탠리 제본스의 이론을 종종 거론한다. ‘제본스의 역설’은 “기술 발전으로 자원 사용의 효율성이 높아지면 역설적으로 해당 자원의 총 소비량이 증가한다”는 게 핵심이다.
실제로 AI 추론 비용이 2022년 초 GPT-3의 토큰당 60달러에서 2024년 초 0.1달러 수준으로 급감했음에도 AI 컴퓨팅 수요는 오히려 증가하고 있다.
사티아 나델라 마이크로소프트 CEO는 이런 맥락에서 “AI가 더욱 효율적이고 접근하기 쉬워질수록 그 활용은 폭발적으로 증가할 것”이라고 전망했다. 비용 장벽이 낮아지면서 더 많은 기업과 개발자들이 AI를 활용할 수 있게 됐고 이는 새로운 응용 분야 개척으로 이어지고 있다.
이러한 변화는 AI 산업 생태계 전반에 영향을 미치고 있다. 클라우드 서비스 제공업체들은 인프라 투자 계획을 재검토하고 있으며 반도체 업체들은 더욱 효율적인 AI 칩 개발에 박차를 가하고 있다.
소프트웨어 기업들은 특화된 도메인에서의 AI 모델 개발에 주목하고 있으며 에너지 기업들은 데이터센터의 전력 효율성 향상을 위한 새로운 솔루션을 모색하고 있다.
올트먼도 인정한 딥시크 성능…“한국도 독자 성장 전략 필요”
딥시크의 사례는 한국 AI 산업에 중요한 시사점을 제공한다. 무한한 자본과 컴퓨팅 파워의 경쟁이 아닌, 효율성과 최적화를 통한 혁신이 가능하다는 것을 보여주었기 때문이다. 이는 한정된 자원으로 경쟁해야 하는 한국 기업들에 새로운 기회가 될 수 있다.
특히 주목할 점은 딥시크가 보여준 ‘효율 혁신’의 가능성이다. 리카이푸 전 구글 차이나 대표는 “미국은 연구와 혁신, 특히 획기적인 혁신을 일구는 데 강할지 몰라도 기존의 기술을 더 효율적으로 만드는 엔지니어링 기술만큼은 중국이 더 뛰어나다”며 “컴퓨팅 성능과 자본이 제한된 환경에서 중국은 자연스럽게 최대한 효율적으로 개발하는 방법을 터득했다”고 했다.
이는 20세기 후반 일본과 한국이 전자, 자동차 산업에서 보여준 성공 방정식과 유사하다. 샘 올트먼 오픈AI 창업자는 이와 관련해 “딥시크의 R1은 특히 가격 대비 성능 측면에서 인상적인 모델”이라고 인정하면서 “물론 오픈AI가 훨씬 뛰어난 모델을 제공하겠지만 새로운 경쟁자의 등장이 동기를 부여한다”고 강조했다.
한국 역시 이러한 흐름에서 자체적인 경쟁력을 구축해야 한다는 지적이 나온다. 시장의 논란과 우려에도 불구하고 딥시크가 연 새로운 지평은 이미 돌이킬 수 없는 변화를 예고하고 있다.
저비용 고효율 AI 개발의 가능성이 입증된 만큼 이를 기회로 활용하는 것이 한국 AI 산업의 과제가 될 것이며 글로벌 AI 산업이 기술력과 효율성의 새로운 균형점을 찾아가는 이 시점에서 한국은 자신의 강점을 살린 독자적인 발전 전략을 수립하고 실행해 나가야 한다.
윤성원 베인앤드컴퍼니 대표파트너·신창민 베인앤드컴퍼니 부파트너. 사진=베인앤드컴퍼니
윤성원 베인앤드컴퍼니 대표파트너·신창민 베인앤드컴퍼니 부파트너