반복영역 건너뛰기
지역메뉴 바로가기
주메뉴 바로가기
본문 바로가기

이슈 & 트렌드

이슈 & 트렌드

경제, 정치·외교, 사회·문화 등 다양한 분야의 주요 이슈에 대한 동향을 정리하여 제공합니다.

美 제재가 촉발한 혁신...中 AI 스타트업 딥시크 돌풍

CSF 2025-01-31

☐ 중국 AI 스타트업 딥시크가 발표한 대형 언어모델이 오픈AI와 대등한 성능을 보이면서도 훨씬 저렴한 가격과 오픈소스 정책을 내세워 글로벌 AI 업계의 주목을 받음. 중국 본토 엘리트들로 구성된 소규모 팀임에도 혁신적인 아키텍처와 알고리즘 개발로 기술력을 입증했으며, 허깅페이스에서 최다 다운로드를 기록하는 등 글로벌 시장에서도 성과를 거둠. 미국의 기술 제재가 오히려 중국 기업들의 자원 효율성과 기술 혁신을 촉진하는 계기가 되었다는 평가를 받고 있으며, 전문가들은 이러한 제한된 환경이 역설적으로 중국 AI 기업들의 창의적 혁신을 이끌어내고 있다고 분석함.

◦ 딥시크, 중국 AI 기업의 글로벌 도약 신호탄
- 중국 AI 스타트업 딥시크(DeepSeek)가 발표한 추론 대형 언어모델 '딥시크-R1'이 오픈AI(OpenAI)의 o1과 대등한 성능과 극도로 낮은 서비스 가격, 완전한 오픈소스 정책으로 글로벌 인공지능(AI) 업계의 주목을 받음. 딥시크-R1의 API 서비스 가격은 입력 토큰 100만 개당 1위안(캐시 히트(Cache hit))/4위안(캐시 미스(Cache miss))으로, 오픈AI o1 대비 각각 2%와 3.6% 수준임.
- 캘리포니아 대학교 버클리 캠퍼스 컴퓨터과학과 이안 스토이카(Ion Stoica) 교수는 딥시크-R1과 딥시크-V3가 GPT, 제미나이(Gemini), 클로드(Claude) 등 기존 대형 모델 훈련 비용의 일부만으로도 최첨단 성능을 달성했다고 평가함. 또한 버클리대학교 대형 모델 순위에서 딥시크-R1은 오픈소스와 독점 모델을 포함한 전체 모델 중 3위를 기록했다고 설명함.
- 최근 딥시크-R1은 오픈소스 커뮤니티 허깅페이스(Hugging Face)에서 다운로드 수 10.9만 회를 기록하며 최다 다운로드 대형 모델로 등극함. 또한 1월 27일 오전, 딥시크 앱은 애플 중국 지역과 미국 지역 앱스토어 무료 앱 다운로드 순위에서 1위를 차지했으며, 미국 지역 다운로드 순위에서 챗GPT(ChatGPT)를 넘어섰음.
- 미국 AI 기업 스케일AI(Scale AI)의 창업자 알렉산더 왕(Alexandr Wang)은 "지난 10년간 미국이 AI 경쟁에서 중국을 앞서왔으나, 딥시크의 AI 대형 모델 출시가 이를 변화시킬 수 있다"고 언급함. 미국 빅테크 기업 메타(Meta)의 수석 AI 과학자 얀 르쿤(Yann LeCun)은 "딥시크의 성공이 주는 가장 큰 교훈은 중국 경쟁자의 위협 증가가 아닌, 누구나 혜택을 받을 수 있도록 AI 모델을 오픈소스로 유지하는 것의 가치"라고 평가함. 또한 "그들은 새로운 아이디어를 가지고 다른 사람들의 작업을 기반으로 구현했으며, 그들의 성과가 공개되고 오픈소스화되어 모든 사람이 혜택을 받을 수 있게 되었다"고 설명함.

◦ 딥시크 개발팀, 중국 본토 엘리트로 구성
- 딥시크의 창업자 량원펑(梁文锋)은 저장대학교(浙江大学) 정보통신공학 석사 출신으로, 중국 퀀트 헤지펀드 하이플라이어(High-Flyer)의 실질적 지배자임. 하이플라이어는 1만 개 이상의 엔비디아 GPU를 확보한 것으로 알려졌으며, 량원펑은 딥시크의 80% 이상 지분을 보유하고 있음.
- 1985년 광둥 잔장(广东湛江) 출신인 량원펑은 2002년 저장대학교 전자정보공학과에 입학했으며, 2007년 동 대학원 정보통신공학과에 진학해 기계 시각 연구를 수행함. 2008년 재학 중 팀을 꾸려 시장 동향, 금융 시장, 거시경제 등의 데이터를 수집하기 시작했으며, 2010년 석사 졸업 후 청두의 저렴한 임대 주택에서 생활하며 다양한 시도 끝에 금융 분야에 진출함.
- 딥시크는 140명 미만의 소규모 조직으로, 엔지니어와 연구개발 인력 대부분이 칭화대학교(清华大学), 베이징대학교(北京大学), 중산대학교(中山大学), 베이징우전대학교(北京邮电大学) 등 중국 최상위 대학 출신임. 해외 유학파는 극소수이며, 재학 중인 박사과정 학생들도 다수 포함됨. 회사는 경험보다 능력을 중시하는 채용 원칙을 고수하며, 신입 및 1-2년 차 인재를 핵심 기술직에 배치함.
- 딥시크-V2 모델의 주요 혁신인 MLA(Multi-head Latent Attention) 아키텍처 개발에는 베이징대학교 물리학과 출신 가오화줘(高华佐)와 베이징우전대학교 출신 정왕딩(曾旺丁)이 핵심적 기여를 함. 훈련 비용을 크게 절감한 GRPO(Group Relative Policy Optimization) 알고리즘은 베이징대학교 박사과정 주치하오(朱琪豪) 등이 개발함.
- 주요 핵심 멤버로는 칭화대학교 대화형 인공지능(CoAI) 연구실 박사 출신의 사오즈훙(邵智宏), 딥시크 대형 모델 V1부터 V3까지 개발에 참여한 베이징대학교 다이다마이(代达劢), 엔비디아 인턴 출신으로 훈련 및 추론 기초 아키텍처를 담당하는 자오청강(赵成钢) 등이 있음.

◦ 미국의 對中 반도체 수출 통제가 오히려 중국 혁신 촉진
- 카네기 국제평화재단(Carnegie Endowment for International Peace)의 AI 연구원 매트 시한(Matt Sheehan)은 "미국의 수출 통제가 오히려 중국 기업들을 궁지로 몰았고, 이에 따라 그들은 제한된 컴퓨팅 자원의 효율성을 높여야만 했다"고 설명함. 이는 미국의 기술 제재가 오히려 중국 AI 기업들의 기술 혁신을 가속화하는 촉매제가 되고 있음을 시사함.
- 버클리대학교 스토이카 교수도 "제한된 조건과 자원 부족이 종종 혁신을 촉발하는데, 이번 경우가 바로 그러한 상황“이라고 설명함. 중-유럽국제경영대학원(CEIBS) 탄인량(谭寅亮) 교수는 중국과 미국의 최첨단 대형 모델 기술에 아직 6-9개월 수준의 격차가 존재하지만 긍정적 경쟁 환경을 통해 AI 성장 속도가 더욱 빨라질 것으로 예상함.
- 업계에서도 미국의 첨단 칩 수출 통제와 같은 제재가 중국의 AI 역량을 약화시키지 못했으며, 오히려 딥시크 등 스타트업들이 효율성, 자원 풀링, 협업을 우선시하는 방식으로 혁신을 추진하도록 촉진하고 있다고 평가함. 이는 제한된 환경이 역설적으로 더 효율적이고 창의적인 접근법을 이끌어내고 있음을 시사함.
- 중국정보통신연구원에서 지난해 발표한 보고서에 따르면, 전 세계 AI 대형 언어모델 수는 1,328개에 달하며, 이 중 36%가 중국에서 개발됨. 중국은 미국에 이어 세계 2위의 AI 기술 기여국임. 중국 알리윈(阿里云)은 29개 언어를 지원하는 100개 이상의 새로운 오픈소스 AI 모델을 발표했으며, 미니맥스(Minimax)와 01.AI(零一万物) 등의 스타트업도 자사 모델을 오픈소스로 공개함.



[관련 뉴스 브리핑]


[참고 자료]

목록