반복영역 건너뛰기
지역메뉴 바로가기
주메뉴 바로가기
본문 바로가기

전문가오피니언

전문가오피니언

주요 이슈에 대한 국내외 전문가들의 견해 및 제언이 담긴 칼럼을 제공합니다.

빅데이터 열풍에 대한 냉철한 고찰

원쥔(文軍) 소속/직책 : 화동사범대학교 사회학연구소 소장 겸 교수 2016-10-24

최근 빅데이터는 사회 현실 및 이론에 막대한 영향력을 행사하면서, 모든 업계와 분야에서 빅데이터에 관한 논의가 이뤄지며 빅데이터 열풍이 불고 있다. 빅데이터가 매우 중요한 가치를 지닌다는 것에는 의심의 여지가 없다. 한 학자가 언급했듯이 빅데이터는 매우 중대한 시대적 ‘전환’이기 때문이다.

빅데이터는 인류의 생활과 세상을 이해하는 방식을 바꾸어놓고, 새로운 발명과 서비스의 원천으로 작용하고 있다. 그러므로 빅데이터에 관한 국가적 전략을 실시해야 할 필요가 있다. 한편, 빅데이터 열풍에 대해 냉철한 시각을 견지할 필요도 있다. 빅데이터가 초래할 리스크를 간과할 수 없기 때문이다. 빅데이터로 인해 초래될 각종 리스크를 직시해야만 빅데이터의 올바른 발전을 추동해 나갈 수 있다.

빅데이터의 ‘비(非)인격성’으로 인해 인류의 주체적 가치관과 데이터가 지니는 사회 및 문화적 의의를 소홀히 하지 않도록 해야 한다. 빅데이터는 ‘객관적인 데이터’만을 중시하며, ‘주관적인 데이터’는 반영하지 못한다는 근본적인 한계를 지니고 있다. 사회학의 각도에서 볼 때, 모든 데이터는 ‘사람’과 관련된 부호이다. 그러므로 이러한 부호가 내포하고 있는 사회 및 문화적 의미야말로 인류가 진정 이해하고 파악해야 하는 내용들이다. 예를 들어 인류와 인류가 살고 있는 사회의 가치적 주체성을 소홀히 하고, 빅데이터의 효율과 영향력을 무한대로 키우는 데에만 집중한다면 결국 가치가 ‘주객전도’되어 상상하기 어려운 부작용을 초래하게 될 것이다. 빅데이터의 원천은 사회이며, 사회에서 수집된 빅데이터는 또 다시 사회에 영향을 미친다. 디지털화될 수 있는 데이터이든, 그렇지 못한 데이터이든, 데이터에 대한 비교∙분석∙귀납은 모두 부호를 통한 인류의 상호작용을 반영하는 것이다. 빅데이터는 행동의 주체, 시간, 장소 등 3D 각도에서 만들어진 ‘데이터의 우주’라고 볼 수 있다. 빅데이터 시대에 개인정보는 데이터를 매개체로 다른 정보와 상호작용을 하게 된다. 만일 개인과 그 개인의 수많은 사회적 행위를 데이터 부호로만 본다면, 그 개인의 에너지와 열정은 알아채지 못할 것이며, 데이터로 만들어진 ‘비인간적인’개인을 바탕으로 집단의 양상과 사회 구성에 대한 결론을 도출하게 될 것이다.

빅데이터의 ‘대량화’로 인해 개별 데이터의 개성이 몰살되고 데이터의 ‘패권’만 강화되는 것을 예방해야 한다. 인터넷처럼 빅데이터 역시 동전의 양면과 같다. 대량화된 빅데이터는 인류가 사회 현상을 연구하고 분석하는데 있어 편의성을 제공함과 동시에 수많은 개별 데이터의 개별적 특징과 의미를 몰살시켰다. 연속적이고 거대한 데이터의 ‘바다’속에서 각기 고유의 특징과 의미를 지닌 개별 데이터들의 중요성이 간과되고, 빅데이터의 ‘패권’앞에 그저 하찮은 희생양으로 몰락하고 있다. 즉, 빅데이터로 인해 인류가 데이터를 차별적으로 인지하는 능력이 떨어지게 된 것이다. 빅데이터가 복잡한 것은 그 데이터 샘플의 양이 방대하기 때문이기도 하지만, 그보다는 무수한 데이터의 출처, 구조, 실체, 공간이 각기 다르고 더욱이 이들간의 상호 교류가 발생하고 있기 때문이다. 오늘날 이렇게 복잡하고 방대한 빅데이터를 다루는 기술을 보유한 사람은 소수에 불과하기 때문에 얼마든지‘데이터 폭력’이 발생할 수 있는 것이다. 이런 의미에서, 빅데이터로 인해 발생하는‘데이터 폭력’을 방지하는 것은 매우 중대한 과제이다.

빅데이터의 ‘파편화’는 인간이 체계적으로 인지하지 못하는 복잡한 사물을 탄생시켰다. 어떤 각도에서 보면, 빅데이터는 규범화되어 분석 가능한 형태가 되어야만 최대한으로 활용될 수 있는 가치를 지니게 된다. 그러나 방대한 양의 빅데이터는 규범화되고 분석 가능한 형태인 경우는 극히 드물고, 대부분 ‘파편화’되어 있어 그 가치를 충분히 활용하는 것이 매우 어려운 실정이다. 빅데이터를 충분히 활용한다면 이렇게 ‘파편화’되어 있는 데이터를 정확히 파악하고 체계적인 구조로 만들어 낼 수 있다. 빅데이터 연구모델은 ‘추론’이 아니라 ‘발견’을 더욱 중시해야 한다. 즉, 빅데이터 활용을 위해 진행되는 분석은 기존의 조사연구 방법처럼 가설과 검증을 통한 추론의 방식이 아니라, 빅데이터의 전체적인 귀납을 통해 사회현상에 대한 전체적인 분석을 하는 방식으로 진행되어야 한다. 이를 위해서는 빅데이터를 정확히 파악하고 정리할 수 있는 기술과 저장 체계를 더욱 업그레이드 시켜야 하며, 데이터 수집 단계에서부터 최대한 규범화시켜야 한다. 그렇지 않을 경우, 복잡한 사물을 체계적으로 인지하는 것이 매우 힘들어 질 수 있다.

빅데이터의 ‘모호성’으로 인해 대량의 정보 쓰레기가 발생하고 데이터 조작과 불법 확산이 일어나는 것을 예방해야 한다. 빅데이터 시대에 진정 필요한 것은 빅데이터 자체뿐만 아니라 빅데이터 배후에 숨겨져 있는 각종 정보 자원이다. 이러한 정보자원은 데이터 총량의 1/10,000, 혹은 그보다도 더 작을 수도 있다. 이런 각도에서 볼 때, 대량의 정보는 사실 모두 쓰레기라고도 볼 수 있는 것이다. 뿐만 아니라, 수많은 빅데이터는 그 자체로 모호성을 띄기 때문에 그 중에는 가짜 혹은 유해한 컨텐츠들도 포함되어 있다. 만일 데이터에만 의존해 무언가를 판단하고 분석하거나 심지어 주체적 사고 없이 데이터를 이용하고 확산시킨다면 무수히 많은 오판(誤判)이 초래될 것이다. 그러므로 기존의 조사연구 및 논리적 입증, 규범적 분석을 거치지 않고 취득한 정보라면, 데이터량이 많을수록 모호성이 커질 것이고, 이로 인한 쓰레기 정보 역시 많아질 것이다. 이는 데이터조작 및 불법 확산을 조장하게 될 것이다. 그러므로, 데이터의 사실 여부를 식별하고 판단하는 안목을 길러 맹목적으로 데이터에만 의존하여 오판을 내리거나 데이터의 ‘홍수’속에서 길을 잃는 우를 범하지 않도록 해야 한다.

출처: 인민일보, 2016-10-20

※본 글의 저작권은 인민망에 있으므로 인민망​의 허가 없이는 이를 무단 전재할 수 없습니다.
※원문은 첨부파일을 참조해 주십시오.​​​​​​​

목록