반복영역 건너뛰기
지역메뉴 바로가기
주메뉴 바로가기
본문 바로가기

전문가오피니언

전문가오피니언

주요 이슈에 대한 국내외 전문가들의 견해 및 제언이 담긴 칼럼을 제공합니다.

빅데이터 분석으로 본 중국의 對한국 인식구조(1992년~2020년)

예성호 소속/직책 : 서울외대 교수/南京財經大學 CKDI 소장 2021-12-08

1. 연구 주제와 필요성 

본 연구는 내년 한중수교 30주년을 기념하여 중국이 한국을 어떻게 인식하고 있는지 빅데이터 분석을 통해 파악하고자 했다. 지금까지 중국의 한국연구 현황과 특징에 대한 논의는 진행된 바 있지만, 대부분 그 연구 대상과 범위가 연구자별, 분과학문별, 연도별과 같은 서지정보의 빈도분석이나 질적 내용분석에 머무르고 있다(김윤태,2006; 송현호,2012). 따라서 한국에 대한 중국의 인식이 어떠한지, 구체적으로 어떻게 형성되었는지에 대한 논의는 부족했다. 

본 연구에서 ‘중국의 對한국 인식구조’란 중국 지식인들이 한국을 어떻게 개념화해서 관련된 지식을 생산, 확산했는지 파악하는 것을 의미한다. 본 연구에서 ‘빅데이터 분석’이란 1992년 한중수교 이후 2020년까지 중국 지식인들이 생산한 전체 데이터에 대한 빈도 분석, 워드 클라우드(Word Cloud), 의미 연결망 분석(Semantic Network Analysis)을 통해 전체적이고 거시적인 패턴 파악을 의미한다(Schönberger&Cukier,2013; 조성준,2019).

2. 연구 방법: 데이터 수집과 데이터 분석

본 연구는 중국 대표적 학술DB 중 하나인 CNKI(China National Knowledge Infrastructure, 中國知網) 제목란에 ‘한국(韩国)’, ‘남한(南韩)’, ‘대한민국(大韩民国)’ 등의 키워드를 입력해서 관련 문헌을 검색했다.1) 문헌 종류는 중국 사회과학 인용색인 CSSCI(Chinese Social Sciences Citation Index), 핵심 저널(Core Journals) 등 전체 저널(Journal)을 모두 포함했다. 문헌 분야는 10가지 대분류 가운데 경제·경영 분야에 해당하는 ‘경제·경영과학(经济与管理科学)’을 선택했다.

1992년부터 2020년까지 총 12,255편의 학술 문헌이 검색되었으며, 연도별 분포도를 살펴보면 아래 <그림1>과 같다. 1992년 한중수교를 기점으로 관련 연구는 급격히 증가하고 있음을 알 수 있다. 1994년부터 등락을 거듭하다 1997년 아시아 금융위기를 시점으로 하락추세를 보이며 다소 주춤한 후, 2000년 이후 꾸준한 증가세를 보이고 있다. 2006년 최고 정점을 기록한 후 점차 하락 국면을 보이고 있다. 


3. 연구 결과

1) 키워드 분포도와 키워드 클라우드

본 연구는 총 12,255편의 저자 키워드를 그 분석 데이터로 활용했다. 저자 키워드 결측 문헌을 제외한 11,943편에서 총 88,649개의 키워드가 도출되었다. 

88,649개 키워드 분포도를 보면 아래 <그림2>와 같다. 소수의 키워드가 전체 상당수의 비율을 차지는 이른바 멱함수(power function) 분포를 띠고 있음을 확인할 수 있다. 텍스트에 등장하는 단어 출현 빈도와 그 분포를 측정하면, 출현 횟수가 미미한 대다수 단어와 출현 횟수가 극히 많은 소수의 단어가 존재하는 이른바 ‘부익부 빈익빈’의 통계적 패턴이 나타난다(Zipf,1949;Newman,2005). 아래 <그림2>의 키워드 분포도의 추세선(붉은색 점선)을 통해서 이러한 비대칭적 패턴을 직관적으로 확인할 수 있다.

워드 클라우드는 단어 중요성에 따른 글자 크기로 중요한 단어를 한눈에 파악할 수 있는 시각화 방법이다. 출현 빈도가 아닌 다른 단어와의 연결 정도를 측정하는 연결 중심성 분석 결과를 기반으로 상위 500위 키워드 클라우드를 도식화하면 아래 <그림2>와 같다. ‘한국(韩国)’이라는 키워드가 최상위에 분포된 빈도 분포와 달리, 다른 키워드와 연결 정도가 높은 ‘금융위기(金融危机)’, ‘경제발전(经济发展)’, ‘새마을운동(新村运动)’ 키워드 크기 순으로 표시되고 있음을 확인할 수 있다.


2) 연도별 키워드 분포 추이

본 연구는 1992년부터 2020년까지 각 연도별 상위 키워드의 분포도를 비교 분석했다. 

아래 <그림3>의 연도별 주요 키워드 분포 추이를 살펴보면, 크게 네 시기로 구분 가능함을 확인할 수 있다. 즉, 매년 빈도수 순위에서 상위 키워드와 전년 대비 급격히 부각된 키워드를 중심으로 살펴보면 다음과 같다. 제 1시기(굵은체 표시)는 1992년부터 1997년까지로 ‘경제발전(经济发展)’이라는 키워드가 최상위에 분포되어 있다. 제 2시기(굵은체 기울임 표시)는 1998년부터 2004년까지로 ‘금융위기(金融危机)’라는 키워드가 가장 부각되고 있다. 제 3시기(보통체 기울임 표시)는 2005년부터 2009년까지로 ‘새마을운동(新村运动)이라는 키워드가 가장 많이 분포되고 있다. 제 4시기(실선 박스 표시)는 2010년부터 2020년까지로 ‘한국(韩国)’, ‘중한(中韩)’, ‘시사점(启示)’, ‘향촌진흥(乡村振兴), ‘일대일로(一带一路)’ 등의 키워드가 부각되고 있다. 


3) 의미 연결망 분석

의미 연결망 분석은 키워드 간 연결 구조를 통해 문헌 의미를 파악하는 방법이다(Wasserman&Faust,2009). 1992년에서 2020년까지의 88,649개 키워드를 대상으로 의미 연결망 분석을 진행했다. 본 연구는 중국의 對한국 인식구조라는 거시적 패턴을 파악하는 데 그 목적이 있으므로, 전체 키워드 가운데 키워드 간 링크 수가 많은 키워드를 중심으로 분석했다. 상위 3%(동시 출현 횟수 17회 이상)에 해당하는 키워드의 의미 연결망 분석 결과를 도식화하면 아래와 같다.

아래 <그림4>에서 다른 키워드와의 연결 정도가 높은 키워드가 큰 원으로 표시된다. 연결 정도가 가장 높은 키워드가 ‘경제발전(经济发展)’, ‘금융위기(金融危机)’, ‘새마을운동(新村运动)’, ‘한국(韩国)’등임을 확인할 수 있다. 이들 키워드 간 동시 출현 횟수가 많을수록 그 연결선이 굵게 표시된다. ‘한국(韩国)-시사점(启示)’ 연결선이 가장 굵고, 다음으로 ‘금융기구(金融机构)-금융위기(金融危机)’, ‘한국(韩国)-중국(中国)’, ‘새마을운동(新村运动)-사회주의 신농촌(社会主义新农村) 등 임을 확인할 수 있다. 

이상의 연결 정도가 높은 키워드와 이들 키워드를 중심으로 상호 밀접히 연결되어 있는 키워드들을 분석하면, 크게 아래와 같은 인식구조를 파악할 수 있다. 한국의 새마을운동 경험을 시사점으로 삼아 중국 사회주의 신농촌 건설을 추진하는 인식구조, 한국이 노동 집약형 및 수출 지향형 산업으로 경제발전을 이루었다는 인식구조, 한국 경제발전 과정에서 외자도입으로 금융위기를 맞이했다는 인식구조 등이다. 


4. 결론 및 시사점

본 연구는 중국 학술 문헌에 대한 빅데이터 분석을 통해 아래와 같은 몇 가지 패턴을 확인할 수 있었다. 우선, 인식구조가 시기별로 매우 명확히 구분되고 있다. ‘경제발전(经济发展)’ 관련 인식구조의 제 1시기, ‘금융위기(金融危机)’ 관련 인식구조의 제 2시기, ‘새마을운동(新村运动)’ 관련 인식구조의 제 3시기, ‘한국(韩国)’, ‘중한(中韩)’, ‘시사점(启示)’, ‘향촌진흥(乡村振兴), ‘일대일로(一带一路)’ 등의 인식구조인 제 4시기로 구분할 수 있다. 
  
둘째, 인식 주체가 ‘한국(韩国)’에서 ‘중한(中韩)’으로 변화되고 있다는 점을 파악할 수 있다. 즉, 제 1시기에서 제 3시기까지는 한국을 성공과 실패 경험의 학습 대상으로 인식하고 중국 상황에 적용하는 단계였다면, 제 4시기는 ‘한국(韩国)’ 외에 ‘중한(中韩)’이라는 키워드가 크게 부각되면서 중국과 한국이라는 양자관계로의 인식 주체 변화가 발생하고 있음을 확인할 수 있다.  
  
셋째, 중국의 對한국 인식구조에 있어 ‘시사점(启示)’이라는 키워드가 매우 중요하게 작용하고 있음을 확인할 수 있다. 즉, 한국을 성공 경험의 발전모델이나 실패 경험의 반면교사로 생각하며 중국에 유익한 시사점을 도출하고 있다. 특히 이는 한국의 새마을운동 경험을 시사점으로 삼아 중국의 ‘사회주의 신농촌(社会主义新农村)’ 건설, ‘향촌진흥(乡村振兴)’ 등의 인식구조로 발전되고 있음을 통해서도 확인할 수 있다. 
  
종합해 보면, 중국의 對한국 인식구조는 개념적, 이론적 논의를 위한 연구보다는 중국에 적용할 수 있는 성공 사례와 실패 사례를 발굴 분석하고 그 시사점을 제안하는 정책적 연구가 상당히 많다. 한편, 이 부분은 중국학자의 학술 논문이 심층적 언론 보도나 정책보고서 같다는 해외 학자들의 평가와 밀접한 관련성이 있다(秦亚青, 2012). 중국 외교대학 총장을 역임했던 친야칭(秦亚青)은 “돌을 더듬으며 강을 건너라”라는 덩샤오핑(鄧小平)의 말을 인용하면서 이는 미리 계획되고 계산된 것이 아닌 모든 것을 실용적으로 신중하게 처리하라는 메시지였음을 지적한 바 있다(문정인,2010:374). 중국 지식인을 포함한 중국문화의 ‘실용성’이라는 특징이 강하게 작용하고 있음을 확인할 수 있다(예성호,2019). ‘과학기술’이라는 용어가 중국에서는 ‘과학적 기술’이라는 의미로 사용된다. 즉 진리를 위한 지식이 아닌 실용성을 최고의 목적으로 부국강병을 실현하고자 한다(余英時, 1984; 陈方正, 2009). 


-----
1) 본 연구는 예성호, 『중국과 대만의 한국학 지식 지형도:경제․경영 분야 학술 데이터 분석』, 한국학술정보, 2021년 12월(Forthcoming)의 내용을 활용하여 작성한 것임.  중국어의 한글 표기는 외래어 표기법을 준수해야 하지만, 학술 데이터 분석이라는 본 연구의 특성을 감안하여, 한글 독음과 함께 괄호 안에 해당 중국어(간체자)로 병기했음. 


<참고문헌>
김윤태, 「중국의 한국학 연구동향」, 『中國硏究』38卷, 2006.
문정인, 『중국의 내일을 묻다 (중국 최고 지성들과의 격정토론)』 , 삼성경제연구소, 2010.
송현호, 「중국지역의 한국학 현황」, 『한중인문학』, 35집, 2012. 
예성호, 「 중국의 한국학 지식지도 연구: 1992년-2016년 경제·경영 분야의 학술논문 키워드 연결망 분석」, 『 중국학연구』, 90집, 2019.
예성호, 『중국과 대만의 한국학 지식 지형도:경제·경영 분야 학술 데이터 분석』, 한국학술정보, 2021년 12월(Forthcoming)
조성준, 『세상을 읽는 새로운 언어, 빅데이터』, 21세기 북스, 2019.
余英時, 從價值系統看中國文化的現代意義: 中國文化與現代生活總論, 時報文化出版事業有限公司, 1984. 김병환 역, 『동양적 가치의 재발견-21세기 새로운 담론 코드』, 동아시아, 2007.
陈方正, 继承与叛逆:现代科学为何出现于西方, 生活.读书.新知三联书店, 2009.
秦亚青, 关系与过程: 中国国际关系理论的文化建构, 上海人民出版社, 2012.
Newman, M. E. (2005). Power laws, Pareto distributions and Zipf's law.Contemporary physics, 46(5), 323-351.
Viktor Mayer-Schönberger and Kenneth Cukier. (2013), Big Data: A Revolution That Will Transform How We Live, Work, and Think, Eamon Dolan/Houghton
Mifflin Harcourt. 이지연 역, 『빅 데이터가 만드는 세상-데이터는 알고 있다』, 21세기 북스, 2013. 
Wasserman, S. and K. Faust, (2009). Social Network Analysis: Methods and Applications, Cambridge: Cambridge University Press. 
Zipf, G. K., (1949). Human Behavior and the Principle of Least Effort. Addison-Welsey: Reading, Mass.
게시글 이동
이전글 중국 스마트 의료 및 원격의료의 현황과 발전 2021-12-21
다음글 중국 드론 산업정책과 법 2021-11-30

목록