반복영역 건너뛰기
지역메뉴 바로가기
주메뉴 바로가기
본문 바로가기

전문가오피니언

전문가오피니언

주요 이슈에 대한 국내외 전문가들의 견해 및 제언이 담긴 칼럼을 제공합니다.

AI 시대, 중국 데이터 정책 동향의 이해

이상우 소속/직책 : 인하대 AI·데이터법센터 부센터장 2024-05-29

인공지능(AI) 기술 경쟁력과 데이터의 중요성

4차 산업혁명 시대의 핵심 기술인 AI 기술이 국가 경쟁력과 직결되고 있다. ChatGPT로 촉발된 AI 기술 개발 이슈는 비즈니스 영역을 넘어서, 국가의 핵무기 보유와 비견될 만큼 안보 차원에서도 그 중요성이 커지고 있다. 이처럼 중요한 AI 기술을 발전시키기 위해서는 AI 모델이 학습할 수 있는 데이터가 확보되어야 한다. 통상 학습하는 데이터가 많을수록 성능이 향상되기 때문이다.

2024년 4월 1일 월스트리트저널(WSJ) 보도에 따르면, AI 개발 기업들이 학습용 데이터 부족으로 인하여 어려움을 겪을 수 있다는 관측이 제기되었다. OpenAI가 개발 중인 GPT-5는 GPT-4에 비해 8배 이상의 데이터가 필요할 것으로 추산되는데, 현재 사용 가능한 학습용 데이터의 양은 이에 미치지 못할 것으로 예측됐다. 1)  최근 AI 반도체가 그 수요를 따라가지 못해 기술 개발에 있어서 장애 요인으로 작용하고 있는 것과 같이, 데이터가 부족하여 AI 개발 속도가 둔화될 수 있는 시기가 멀지 않았다는 것을 의미한다. 

이에 AI 개발에 사활을 걸고 있는 빅테크는 AI 학습용 데이터 확보에 사활을 걸고 있다. 2024년 4월 6일 뉴욕타임즈(NYT) 보도에 따르면, OpenAI는 GPT-4 개발이 한창이던 2021년, 기존에 수집한 학습용 데이터가 고갈될 위기에 처하자 유튜브(YouTube) 및 팟캐스트(Podcast) 콘텐츠를 무단으로 수집·사용하였다. 2) 당시 OpenAI 담당자는 저작권 침해 가능성을 인지하고  있었으나, AI를 학습시키는 것은 정당한 이용 목적에 해당한다고 생각하여, 이 같은 행위를 하였다는 것이 밝혀졌다. 더 놀라운 사실은 유튜브 를 운영하는 구글도 OpenAI의 행위를 인지하고 있었지만, 구글 역시 일부 유튜브 콘텐츠를 자사 AI 개발에 사용하였기 때문에 이를 묵인하였다는 주장도 확인되었다.

그렇다면 AI 시대에 그 중요도가 점차 높아지고 있는 데이터는 누구의 것이며, 어떻게 권리를 주장할 수 있을 것인가? 이를 이해하기 위해 ‘데이터 소유권론’을 간략히 살펴보겠다.

데이터 소유권론 현황과 한계 그리고 중국의 입장 3) 

데이터의 자산(資産) 가치가 높아짐에 따라 사람들은 관념적으로 데이터가 누구의 것인가라는 의문을 갖게되었고, 4) 이처럼 재산적 가치를 가지는 데이터의 법적 귀속 문제를 포괄적 틀로 규율하려는 배경에서 데이터 소유권론이 탄생하였다. 5) 하지만 아직까지 데이터 소유권의 개념 요소인 ‘데이터’와 ‘소유권’ 그 어느 것도 통일적으로 정리되지 않았고, 데이터에 관한 권리 침해 시 불법행위법에 대한 보호가 가능하다는 이유 등으로 데이터 일반에 배타적 독점권을 도입하려는 시도는 사실상 폐기되었으며, 6) 현재 데이터는 사법(私法) 질서 내에서 산발적으로 규율되고 있다. 유럽도 유럽연합(EU)이 추구하는 데이터 경제 구축의 규범적 토대를 형성하려는 노력의 일환으로 데이터 소유권 논의가 추진되었으나, 7) 전 세계 주요국과 마찬가지로 일반적·포괄적인 데이터 소유권 법제화에 이르지 못하였다.

입법적인 측면에서 데이터에 관한 포괄적이고 체계적인 법적 규율 요구에 부응한다는 점에서는 데이터 소유권이 매력적인 개념일 수 있으나, 정책적 차원에서 본다면 별다른 실익이 없다는 주장도 제기된다. 주된 근거로는 ① 데이터 소유권 법제가 추가로 창출할 수 있는 투자 인센티브가 크지 않고, 8)  ② 데이터의 거래와 이용이라는 측면에서는 거래 비용을 높여 오히려 걸림돌이 될 위험이 있으며, ③ 데이터 소유권 도입은 빅테크의 데이터 독과점 상태를 강화하는 방향으로 이어질 수 있다는 것이다.  9) 

중국도 데이터 권리 설정에 관한 입법에는 조심스러운 입장이다. 2017년 시행된 민법총칙(民法总则)의 초안이 작성될 때부터 이미 데이터 소유권 논의(数据权属问题)는 중국 입법자의 관심을 끌었으나, 당시 연구가 충분치 않아 성급한 법제화가 디지털 경제 발전을 저해할 수 있다는 우려가 제기되어 제127조에 “법률에 데이터(数据) 및 네트워크가상자산(网络虚拟财产) 보호에 관한 규정이 있는 경우, 해당 규정에 따른다”라고만 규정하였다. 10) 그 후로 데이터에 관한 분쟁이 급증하였음에도 불구하고, 2020년 5월 28일 제정된 민법전(民法典)도 동조를 그대로 유지하는 보수적인 입장을 취하였다.

국가차원의 입법이 조심스럽게 진행되는 반면, 지방정부는 적극적인 모습을 보여주고 있다. ‘중국법치발전보고(2023)’에 따르면, 2022년 말 기준, 21개 성(省)·시(市)에서 25건의 데이터 관련 조례가 공포되었으며, 지방 디지털 입법의 성급(省级) 적용률은 67.7%에 달하였다. 11)  데이터 재산권에 관한 입법 권한은 기본적으로 전국인민대표대회(전인대)와 그 상무위원회에 있으나(중국 입법법 제11조 제8항), 이 같은 지방정부의 입법 움직임 통해, 데이터에 관한 권리 설정 문제가 중국 디지털 경제 발전에 있어서 더 이상 미룰 수 없는 과제임을 알 수 있다.

새로운 생산요소로서의 데이터와 데이터 삼권(三权) 분할

국가차원에서 데이터 재산권에 관한 법률이 제정되지 않았지만, 지방정부에서 관련 입법을 진행할 수 있는 이유 중의 하나는 중국이 중앙정부(국무원)과 중앙의회(전인대)가 있음에도 불구하고, 해당 기관은 공산당의 영도에 따라 당의 방침을 집행할 뿐이며, 실질적으로는 공산당이 국가를 운영하는 ‘당-국가체제’인 것에 기인한다. 12) 삼권분립 체제인 우리나라의 경우 행정부가 정책을 추진함에 있어서 법적 근거를 제공하는 입법이 뒷받침되지 않을 경우 제동이 걸릴 수 있으나, 중국은 ‘당-국가체제’를 기반으로 당의 방침에 따라 정책도 법률만큼의 힘을 얻을 수 있다. 칭화대학 법학원 원장을 역임한 션웨이싱(申卫星) 교수의 “정책이 먼저 길을 열면, 입법이 뒤를 따른다”라는 말은 이 같은 중국 특징을 잘 표현하고 있다. 이에 정책문건 역시 중국에서 중요한 의미를 지닌다.

2019년 10월, 중국공산당은 제19기 중앙위원회 제4차 전체회의에서 처음으로 토지, 노동, 자본, 기술과 함께 데이터를 새로운 생산요소의 하나로 규정하였다. 데이터의 위상이 높아졌다는 표면적으로 드러난 사실 외에도, 내포된 의미를 분석하기 위해서는 생산요소로 함께 열거된 ‘토지’에 주목해야 한다. 우리는 중국을 사회주의 국가라고 칭하는데, 경제적 측면에서 보자면 사회주의는 일반적으로 토지 등 생산수단에 대한 공유제(公有制)를 주요내용으로 하고 있다. 13) 중국 또한 토지에 대해서 국가와 집단의 소유만을 인정하고 있다. 이에 도시에 있는 국유토지의 경우 토지사용권이 소유권으로부터 분리되어 물권으로 독립되고 시장에서 비교적 자유롭게 유통된다. 도시의 국유토지사용권은 용도에 따라 사용 기한이 정해져 있으며, 거주용지의 경우 70년이고, 만기 도래 시 연장 가능하다. 14) 1949년 중화인민공화국이 건국된 후 75주년을 맞이하는 현시점에서 중국의 공유제를 평가하는 것은 섣부른 판단일 수 있으나, 국가가 중장기적인 도시발전계획을 수립하고 도시의 토지를 효율성 높게 활용하는데 있어서 긍정적인 역할을 하였다고 평가받는다. 15) 

이러한 경험을 바탕으로 2022년 12월 2일 중국공산당 중앙위원회와 국무원은 ‘데이터 20조(数据二十条)’라고 불리는 ‘데이터 요소의 역할을 잘 수행하기 위한 데이터 기반 제도 구축에 관한 의견(关于构建数据基础制度更好发挥数据要素作用的意见)’의 발표를 통해, 16) 데이터 재산권을 ‘소유’에 초점을 두지 않고, ① 데이터 자원 보유권(持有权), ② 데이터 가공 사용권(使用权), ③ 데이터 상품 경영권(经营权)으로 분리한 재산권 운영 메커니즘을 구축하였다(제3조). 데이터 삼권(三权) 분할 매커니즘을 통해, 기본적으로 데이터 요소에 관한 각 참가자의 합법적인 권익 보호 제도를 구축·개선하고자 하였다(제7조). 동조의 주요내용을 살펴보면, 우선 데이터 출처자(来源者)가 생성된 데이터를 취득하거나 복제·전송할 수 있는 권익을 갖도록 보장하였으며, 보유한 데이터에 관한 데이터 처리자의 관리·통제 권익을 인정하였다. 또한 데이터 출처자의 권익이 보호된다는 전제 아래, 합법적으로 취득한 데이터의 가공·사용권을 인정 및 보호하며, 데이터 수집·가공 등 데이터 처리자의 노동 등의 기여를 존중하고, 데이터 처리자가 데이터를 사용하고 수익을 얻을 수 있는 권리를 충분히 보장하도록 하였다. 아울러 가공·분석 등을 거쳐 형성된 데이터 또는 데이터 파생 상품의 경영권을 보호하고, 데이터 처리자가 타인에게 데이터 또는 데이터 파생 상품을 허가할 수 있는 권리를 규범화하며, 데이터 요소의 순환 및 재사용을 촉진토록 하였다.

‘데이터 20조’에서 제안한 데이터 삼권 분할 메커니즘이 중국의 디지털 경제 발전 촉진에 긍정적인 역할을 할 것이라고 기대되나, 실행주체, 세부전략 등 구체적인 실행 방안이 미흡하다는 지적도 제기되었다. 이에 중국은 2023년 10월 25일 국가데이터국(国家数据局)를 공식 출범하여 데이터 기반 제도 수립 및 데이터 자원의 공유·개발·이용을 총괄토록 하였다.

국가데이터국 신설과 17) ‘데이터 요소 x’ 정책의 시행

2023년 중국의 데이터 생산 총량은 32ZB(zetabyte) 18) 를 초과하였다. 19) 이는 같은 해 전 세계에서 생산된 데이터 총량 120ZB의 26.7%에 해당하며, 중국은 적어도 정량적으로는 데이터 자원 부국이라 할 수 있을 것이다. 하지만 부처 간의 담당업무 충돌·공백 및 행정구역상 분절·파편화된 흐름으로 인하여 데이터 자원 활용이 원활하지 않았고, 개선의 필요성이 제기되었다. 이에 2023년 3월 7일, 14기 전인대는 ‘국무원 기구 개편안(国务院关于提请审议国务院机构改革方案的议案)’을 통과시킴으로써 데이터 기반 제도 수립 및 데이터 자원을 총괄하는 국가데이터국의 신설을 공식화하였고, 2023년 10월 출범하였다. ‘국무원 기구 개편안’ 공개 이후 국가데이터국을 통해 중국 당국이 데이터와 관련하여 더욱 엄격한 통제와 검열을 진행할 것이라는 우려의 목소리도 나왔으나, 초대(初代) 국장(局長)으로 중국 3대 통신사 차이나유니콤의 최고경영자(董事长)인 리우리에홍(刘烈红)을 선임하는 등, 현재까지는 데이터를 중국 경제의 새로운 모멘텀으로 활용하여 디지털 경제를 활성화하기 위한 정책 추진에 주력하고 있다. 

2023년 12월 31일, 국가데이터국은 출범 이후 최초로 17개 관계부처와 함께 ‘“데이터 요소 x” 3개년 행동계획(2024-2026년)(“数据要素×”三年行动计划(2024—2026年))’(데이터 요소 x)을 발표하였으며, 20) 동 문건은 ‘데이터 20조’를 이행하고 데이터 요소의 승수 효과를 충분히 발휘하며, 경제사회 발전에 기여함을 그 목적으로 밝히고 있다. 2026년 말까지, 각 경제 분야에서 시범성이 강하고 효과가 명확하며 영향력이 큰 300건 이상의 시범사업을 진행할 것을 구체적인 목표로 제시하였다. 데이터 요소 승수 효과가 발휘될 수 있는 대표적인 산업군으로는 ‘산업 제조(工业制造)’, ‘현대 농업(现代农业)’, ‘상업·무역 유통(商贸流通)’, ‘교통 운수(交通运输)’, ‘금융 서비스(金融服务)’, ‘과학기술 혁신(科技创新)’, ‘문화 관광(文化旅游)’, ‘의료 건강(医疗健康)’, ‘비상 관리(应急管理)’, ‘기상 서비스(气象服务)’, ‘도시 거버넌스(城市治理)’, ‘녹색 저탄소(绿色低碳)’ 분야가 제시되었으며, 이를 뒷받침하기 위해 데이터 공급 수준 향상(提升数据供给水平), 데이터 유통 환경 최적화(优化数据流通环境), 데이터 안전 보장 강화(加强数据安全保障)에 있어서 지속적인 연구가 진행되어야 함을 명시하였다. 

한 가지 흥미로운 점은 2015년 ‘인터넷+(互联网+)’ 행동계획 이래 정책문건에 다시 한번 사칙연산 기호를 사용하였다는 점인데, 과거에는 ‘더하기(+)’였던 반면, ‘데이터 요소 x’는 ‘곱하기(x)’를 사용하여 승수효과를 강조하였다. 이로부터 약 3개월 뒤인 2024년 3월 5일 공개된 AI 산업 육성책 ‘AI+(人工智能+)’ 이니셔티브가 다시 ‘더하기(+)’로 표기된 점을 보면, 데이터 요소 활용에 관한 중국 정부의 기대를 확인할 수 있다.

전망 및 시사점

코로나19 팬데믹 이후 디지털 경제가 중국 경제 성장의 중요 엔진 역할을 담당하게 되면서, 그 근간이라 할 수 있는 데이터의 중요성이 더욱 증대되고 있다. 또한 미국의 대(對) 중국 제재로 인하여 AI 반도체 등의 수급이 용이하지 않은바, 하드웨어의 결점을 보완하고 AI 기술 경쟁력을 확보하기 위해서는 양질의 데이터 중요성이 더욱 강조될 수밖에 없는 상황이다. 이에 중국은 현시점에서 일반적이고 포괄적인 데이터 법제의 정립이 어렵다는 것을 인지하고, 입법을 위한 연구를 지속하는 한편, 정책적으로 데이터를 생산요소로 편입하고, 여기에 기존의 ‘소유권’ 논의에서 벗어나, 데이터 삼권(데이터 자원 보유권, 데이터 가공 사용권, 데이터 상품 경영권) 분할 매커니즘을 구축하였다. 이러한 입법·정책적 노력이 축적되어 데이터 법률관계의 불투명성이 점차 해소될 것으로 기대된다.

삼권이 분립된 우리나라에서 중국과 같이 입법적 한계를 넘어 정책을 추진해 나가기란 불가능하다. 하지만 21대 국회를 표류 중인 ‘AI 기본법’은 회기 만료로 폐기 위기에 처해 있으며, 최근 국회와 정부의 대립 상황을 고려하면 AI·데이터 관련 법안의 통과가 22대 국회에서도 낙관적이지 않다. AI 시대에 데이터를 어떻게 활용하는지가 우리나라의 국가 경쟁력과 직결된 중차대한 일인 만큼 미래 세대를 위해서라도 AI·데이터 입법과 정책에 있어서는 국제적 동향을 정확하게 파악하고 우리나라가 경쟁력을 유지할 수 있도록 협치하는 지혜를 발휘해야 할 것이다.

또한 AI 기술 경쟁력 확보를 위해 양질의 데이터를 활용하는 것이 촌각을 다투는 일임을 고려하여, 우선허용·사후규제 방식의 규제샌드박스를 21) AI·데이터 분야에 확대 적용하는 것을 적극 검토해 볼 필요가 있다. 현재 저작권법, 부정경쟁방지법, 개인정보보호법 등에 의해 개별적·부분적으로 데이터의 귀속·보호 문제를 규율하고 있기 때문에 개발의 입장에서 보면 파편화된 입법이 허들로 작용하고 있다. 물론 현행 법제도 역시 나름의 중요한 역할을 하고 있지만, 기술 경쟁이 글로벌 경쟁체제 아래 이루어진다는 점을 고려하면, 국가 차원에서 변화하는 기술 환경에 맞춰 선제적으로 대응해야 한다.

중국의 정책적 노력을 이해하는 것에 그치지 말고 단기·중기·장기적으로 우리는 어떠한 입법·정책 추진계획을 수립해야 할지 치열하게 고민할 시기이다.

---
1)  WSJ(2024.4.1.), “For Data-Guzzling AI Companies, the Internet Is Too Small”, <https://www.wsj.com/tech/ai/ai-training-data-synthetic-openai-anthropic-9230f8d8>(최종방문일: 2024.5.21.).
2) NYT(2024.4.6.), “How Tech Giants Cut Corners to Harvest Data for A.I.”, <https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html>(최종방문일: 2024.5.21.).
3) 이성엽 편, 데이터와 법, 박영사, 2024, 66-105면에 수록된 권영준 대법관의 “데이터 귀속·보호·거래에 관한 법리 체계와 방향”을 기반으로 정리하였음을 밝힙니다.
4) 인하대학교 법학연구소 AI·데이터법센터, 데이터법, 세창출판사, 2022, 94면 참조.
5) ‘데이터 소유권론’ 탄생 배경에 관한 상세한 내용은 이성엽 편, 앞의 책, 70면 이하 참조.
6) 인하대학교 법학연구소 AI·데이터법센터, 위의 책, 102면. 
7) 이성엽 편, 앞의 책, 76면.
8) 데이터 소유권이 없는 지금도 데이터는 충분히 생산되고 있으며, 데이터에 대한 개별적 보호 법제도 큰 문제 없이 운영되고 있다는 점이 그 근거로 제시된다. 앞의 책, 79-80면.
9) 이러한 여러 가지 문제점 때문에 학계·실무계는 데이터 소유권이라는 새로운 권리의 창설은 불필요하다는 분위기가 형성되어 있다. 앞의 책, 80면.
10) 申卫星, “数据产权:从两权分离到三权分置”, 中国法律评论 2023年第6期(总第54期), 2023, 128-129页.
11) 莫纪宏·田禾主编, 中国法治发展报告No.21(2023), 社会科学文献出版社 2023年版, 2023, 1页.
12) 손한기, “중국의 당-국가체제에 관한 일고찰 -당내법규를 중심으로-”, 비교중국연구 제3권 제1호, 2022, 47면 이하 참조.
13) 중국 집체토지소유권에 관한 상세한 내용은 강광문. “중국 집체토지소유권(集體土地所有權)의 법적 성질에 대한 고찰”, 강원법학 제53권, 2018. 1면 이하 참조.
14) 공업용지의 경우에는 50년, 과학기술, 문화위생, 스포츠용지의 경우에는 50년, 상업, 관광, 여가용지의 경우에는 40년, 기타 용지의 경우에는 50년으로 각각 그 사용기한이 구분되어 있다. 강광문, “중국 심천경제특구 토지법제의 발전과정에 대한 고찰”, 헌법과통일법 제5호, 2015, 26면.
15) 김호, “중국의 도시토지소유권제도에 대한 고찰”, 동북아법연구 제15권 제3호, 2022, 3면.
16) ‘데이터 20조’에 관한 상세한 내용은 배덕현, “데이터 거래제도 구축에 대한 중국의 구상과 전망”, 한중사회과학연구 제22권 제2호, 2024, 49면 이하 참조.
17) 중국 국가데이터국에 관한 상세한 내용은 이상우 “중국 국가데이터국 신설 의의와 시사점”, 법조 제72권 제3호, 2023, 274면 이하 참조.
18)  1ZB=10억TB(terabyte)이며, 예를 들어, 30억 인구가 365일 동안 매일 화상회의를 진행하여 영상데이터를 생산할 경우, 생성되는 데이터 총량이 약 1ZB이다. 조선일보(2020.6.17.), “[김정호의 AI시대의 전략] 숨쉬기도, 침방울 속 바이러스도 모두 데이터가 되는 세상”, <https://www.chosun.com/site/data/html_dir/2020/06/16/2020061605010.html?utm_source=naver&utm_medium=referral&utm_campaign=naver-news> (최종방문일: 2024.5.21.).
19) 国家数据局(2024.4.2.), “数据产量超32ZB!数字中国持续释放“数”活力”, <https://mp.weixin.qq.com/s/sgqJpGT4FTBZdH_N_4olGg>(최종방문일: 2024.5.21.).
20) 国家数据局(2024.1.4.), “国家数据局等部门关于印发《“数据要素×”三年行动计划(2024—2026年)》的通知”, <https://mp.weixin.qq.com/s/YyhLQo4lZIFNMiyupdvO1A>(최종방문일: 2024.5.22.).
21) 규제샌드박스는 사업자가 신기술을 활용한 새로운 제품과 서비스를 일정 조건(기간·장소·규모 제한)하에서 시장에 우선 출시해 시험·검증할 수 있도록 현행 규제의 전부나 일부를 적용하지 않는 것을 말하며 그 과정에서 수집된 데이터를 토대로 합리적으로 규제를 개선하는 제도이다. 국무조정실, “규제샌드박스 소개 ”, <https://www.sandbox.go.kr/sandbox/info/sandbox_intro.jsp>(최종방문일: 2024.5.22.).

목록