[출저: http://blog.naver.com/wiztree75/90195118347, 나무 (wiztree75)  ]

 

 

 

 

 

 

※빅 데이터란? : 시사사전 | 네이버 캐스트

 

 

 

 

 

 

 

인터넷이 성숙기로 접어들고 많은 정보와 지식들이 디지털화 되면서 인간과 세상에 관한 다양한 데이터들이 광범위하게 쌓여왔다. 오늘날 그런 방대한 데이터를 빅 데이터라 부른다. 빅데이터는 질보단  양으로 우리 인간의 시야를 넓혀준다. 빅 데이터를 통해 과거 빈약한 데이터들로 인해 추론과 직관에 의지해 들여다 볼 수 밖에 없었던 세계 뿐만 아니라, 우리가 인지하지 못했던 수 많은 신세계들도 드러나고 있다. 빅 데이터는 단순히 IT 업계만의 화두가 아니다. 인터넷이 우리의 일상이 되었듯이, 빅데이터 또한 그 영향력으로 인해 앞으로 우리의 입에 자연스럽게 오르내리게 될 것이다.1 

 

 

 

 

 

 

※위 그림의 상세 내용을 보려면 여기를 클릭! 

 

 

오늘은 빅 데이터란게 무엇인지, 그리고 빅데이터가 우리 삶에 어떤 영향을 어떻게 미친다는 것인지 그 빛과 어둠을 살펴보려 한다. 보다 나은 미래를 원한다면 이 빅데이터 지도를 꼭 주목해 보길 바란다.

 

 

 

 

 

 


[책] 빅 데이터가 만드는 세상 

 

 

 

 

 

빅 데이터에 대한 정보를 얻는 허브역할로서 책 "빅 데이터가 만드는 세상"을 선정해 봤다. 빅 데이터의 개념과 영향을 이 만큼 깔끔하게 잘 정리한 것도 없어 보인다. 현재 아마존에서도 지속적으로 좋은 반응을 얻으며 관련분야 최상위에 올려져 있는 책이다2. 쉽고 간결한 어휘로 쓰여졌기에 어렵지 않게 읽을 수 있고, 번역도 잘 되었다.

 

빅 데이터의 특징은 한마디로 양이 질을 압도한다는 것이다. N1=1all (하나의 정보 집합이 모두를 보여준다는 말)이란 등식이 성립할 정도로 데이터의 양은 압도적이다. 때문에 이 빅데이터의 세계에서 중요한 건 인과관계보다 상관관계다. 왜인지 몰라도 A가 발생하면 B가 발생하는 것이 보이기 때문에, 다음에 A라는 현상이 일어날때 B가 일어날 것임을 예측할 수 있다. 한 두개의 정보로는 그 확률을 장담할 수 없기에 인관관계를 밝혀봐야 하겠지만, 거의 전부를 보여주는 빅데이터를 통해 발견한 상관관계라면 인과관계를 몰라도 쉽게 예측할 수 있다. 3

 

이런 빅 데이터는 그 효용만큼이나 위험도 있다.(마치 원자력 처럼) 데이터가 너무 광범위하게 공유되는 나머지 개인의 사생활은 거의 없어질 지경에 처해있다. 어떻게 빅 데이터로부터 사생활을 보장 받을 것인가? 또한 어느 한 기업이 이 빅 데이터를 독점하면 어떻게 될까? 데이터를 너무 맹신한 나머지 확률의 문제라는 걸 잊고 빅 데이터의 예측 시스템 안에 인간을 얽매여 놓진 않을까? 우린 이런 빅 데이터의 어두운 면을 어떻게 걷어낼 수 있을까?

 

이 책 '빅 데이터가 만드는 세상'은 이런 빅 데이터의 이중성을, 다양한 사례들과 통찰력 있는 분석을 통해 물 흐르듯이 풀어낸다. 그리하여 빅 데이터를 보다 가치있게 이용할 수 있도록 우리를 안내해 준다. 이 책을 읽으면 어떤 이들이 빅 데이터 시대에 가치를 드러내게 될런지 감을 잡아볼 수도 있다.  이 책과 더불어 이 책을 기준으로 연결한 영화, 다큐, 책 들을 따라가다 보면 어느 새 빅 데이터라는 단어가 낯설지 않게 느껴질 것이다.

 

 http://book.naver.com/bookdb/book_detail.nhn?bid=7208679

 

 

 

※ 책이란 매체가 익숙하지 않다면 연결된 다큐와 영화를 먼저 봐도 된다. 그런 후에 빅 데이터에 대해 높아진 관심을 동력으로 해서 책을 읽어본다면, 책도 어렵지 않게 읽을 수 있으리라 본다. 먼저 'KBS 글로벌 다큐멘터리 빅 데이터'를 보고 이 후에 다큐 '괴짜 경제학', 영화 '머니볼' 그리고 이후에 구글 관련 다큐 두편과  영화'마이너리티 리포트'와 '위 약관에 동의 합니다'를 이어서 보면 빅 데이터의 명과 암에 대해 대략 감을 잡을 수 있을 것이다. 나머지 콘텐츠들은 책을 읽고 관심을 확장하는 측면에서 보면 좋을 듯하다.

 

 

 

 

 

1. 빅데이터란?


KBS 글로벌 다큐멘터리. 마래 경쟁력의 핵심 빅 데이터

 


일전에 제주올레 다큐지도에서 연결을 이야기하며 다룬 적이 있던 이 다큐는 빅데이터의 효용성에 관해서만 일단 다룬다. 사법분야, 경제분야, 인터넷 서비스 분야, 의학 분야, 우주 분야 등에서 빅데이터가 새로운 길을 어떻게 열어줬는지를 설명한다. 그러면서 빅 데이터의 제대로된 활용을 위해선 기존의 영역을 넘어선 협업이 중요하다는 점도 주지시킨다. 가장 중요한 건 데이터를 분석하는 사람의 통찰력이다.

 

BBC 호라이즌 시리즈의 다큐다.

  

 http://blog.naver.com/wiztree75/90194564787

 

 

 

2. 빅 데이터가 여는 세상

이제 본격적으로 빅데이터의 효용성에 대해 좀 더 들어가 보자.

 

 

괴짜 경제학.

 

 

 

 

이 다큐의 원저인 '괴짜 경제학'의 저자 스티븐 레빗은 단도직입적으로 이렇게 이야기 한다. "데이터는 거짓말을 하지 않는다" 라고. 그러면서 데이터 분석을 통해 세상을 다시 들여다 보며 갖가지 편견을 깨버린다. 

 

'부동산업자는 과연 고객을 위한 최상의 거래를 하는가?' '부모가 아이를 위해 하는 행동은 정말로 아이 미래에 도움이 될까?' '사람의 이름은 어떻게 지어질까 그리고 이름과 운명은 어떤 상관관계를 가질까?' '스모는 정말로 정정당당한 혼의 스포츠인가?' '뉴욕의 범죄는 정말로 왜 줄었는가?' '인센티브(보상)은 사람의 행동에 어떤 영향을 미치는가?' 등의 질문을 던지며 그 답을 데이터 분석으로 구해본다.

 

처음 이 다큐를 봤을때 가진 느낌은 '신선하다' 였다. 특히 경기 승패의 패턴 분석을 통해 스모 경기의 부조리함을 발견하고(이 부분이 빅데이터 책에도 인용된다), 낙태허용과 뉴욕의 범죄율 하락을 연결시켜 이야기 하는 부분은 정말로 인상이 깊었다4. 빅 데이터라는 개념을 접했을 때 이 괴짜경제학을 떠올렸었는데, 아니나 다를까 빅 데이터 책에서 바로 인용이 되었다.

 

빅 데이터는 세상을 있는 그대로 보게 만들어 주는 도구가 될 수 있음을 이 다큐를 통해 느껴볼 수 있다. 세상을 있는 그대로 보지 못하면 그 만큼 오판의 확률도 높아질 수 밖에 없지 않은가. 복잡한 이론을 무겁게 이야기하는 다큐가 아니다. 그냥 재미로 봐도 흥미롭게 볼 수 있다. 

 

 

 

 

[책] 괴짜 경제학

 

 

 

 

괴짜 경제학 다큐는 이 괴짜 경제학 책을 기반으로 만들어 졌다. 스테디 셀러로서 현재에도 계속 읽혀지는 책이다. 다큐에 나온 이야기들이 구체적인 데이터들과 함께 언급되어 있다. 다큐에 나오지 않은 주제도 몇 개 있는데, '마약 판매상은 왜 어머니와 함께 사는 걸까?'라는 주제는 마약 경제가 어떻게 돌아가는지 그 허와 실을 들여다 본다. 물론 데이터로. 그 밖에 KKK단에 관한 이야기도 흥미롭다.

 

이 책의 진정한 효용은 그저 우리가 모르던 사실 몇개를 알 수 있다는게 아니다. 이 책의 저자는 그저 '세상에 대해 남이 얘기하는 걸 그대로 받아들이지 말고 스스로 질문해 보라' 라고 말한다. 그런 후에 각종 데이터들을 바탕으로 그 답을 탐구하는 과정에서 세상에 대한 놀라운 사실들을 알게 될 수 있다면서 말이다. 

 

"이 모든 연구 주제의 기저에는 적절한 관점을 발견하기만 한다면 아무리 복잡한 현상이라도 이해할 수 있다는 믿음이 깔려있다' 라는 이 책에 대한 한 외국 언론의 평가는 고개를 절로 끄덕이게 만든다. 빅 데이터 세계에서 가장 필요한 자세는 습관적인 편견에서 벗어나 데이터들을 있는 그대로 바라보는 것이다.

 

 

 

 

[영화] 머니볼

 

 

 

 

야구를 좋아하는 이라면 아마도 이 영화를 봤으리라 생각한다. 

 

기본적인 몇몇 기록들과 코칭 스태프들의 경험과 직감만으로 선수들의 능력을 판단하고 경기를 운영해 왔던 메이저리그. 빌리 빈이라는 인물은 추락하는 팀의 단장으로서 반전을 꾀하고자 그런 메이저리그의 관행에 반기를 든다. 그리고 단지 다양한 데이터 분석을 통해 선수들을 분류하고 역할을 부여해, 저평가된 선수들의 새로운 가치를 이끌어 낸다. 그의 참모는 야구선수 경험도 없는 통계분석가였다. 빌리 빈은 바로 빅 데이터를 통해 야구계에 새로운 운영 흐름을 만들어 냈던 것이다.

 

빅데이터 책에서 저자는 사회의 많은 영역들에서 그 분야의 전문가 보다 통계분석가들이 우위에 서고 있음을 이야기 하며 빌리 빈의 사례를 예로 들고 있다. 해당 분야에 연고가 없다는게 오히려 선입견이 없이 사실을 있는 그대로 바라볼 수 있는 능력이 될 수 있다고  저자는 말한다. 많은 영역의 빅데이터들이 개방될 수록 이런 데이터 능력자들이 부상할 수 밖에 없다.

 

단순한 야구계 인물 이야기를 넘어 사회변화를 조망해 볼 수 있는 영화다.

 

 

 

 

[책] 아웃라이어

 

 

 

 

이 책을 대하는 느낌은 괴짜경제학을 대하는 느낌과 비슷하다.5 이 책의 저자 말콤 글래드웰 또한 다양한 데이터들을 근거로 편견과 무지의 늪에서 우리를 건져올린다. 특히 성공의 문제를 개인의 의지 문제가 아니라 한 개인을 둘러싼 갖가지 환경의 영향의 문제로 이야기 한다. 즉 개인과 환경의 상관성을 각종 데이터들을 통해 집중 탐구해보는 책이라 하겠다. 

 

어린 스포츠 선수들에게 있어 같은 나이라도 1월에 태어난 아이들과 12월에 태어난 아이들의 신체적인 차이가, 성적의 상당한 차이를 만들어내는 원인이 되고 있다는걸 통계적 분석을 통해 밝혀낸 것은 빅데이터 분석을 통한 새로운 발견의 단적인 예다. 그런 숫자로 된 정형화된 데이터 분석 말고도 저자는 자기만의 통찰력을 통해 각종 비정형화된 데이터6들을 분석해 사람의 성공에 관한 편견들을 깨고 있다. 특히 문화적 환경의 영향을 이야기하는 부분에 등장하는 우리나라 대한항공의 괌추락사고의 원인에 대한 분석7은 우리나라 사람으로서 너무나도 인상적으로 다가온 부분이었다. 

 

이 책은 빅 데이터 책에 직접적으로 언급은 되지 않지만 개인적으로 연결선이 보여서 연결책으로서 기재해 봤다. 이 책이나 괴짜경제학이나 빅 데이터 책이나 모두 쉽고 간결하게 쓰여진 공통점이 있다. 이야기를 풀어가는 방식도 조금 비슷하다. 그렇기에 이 세책중 어느 한가지라도 재미있게 읽었다면 나머지도 즐겁게 읽을 수 있으리라 본다.

 

 

 

 

 

[책] 자살론

 

 

 

 

빅 데이터 책에서 빅 데이터 연구의 선구자들을 이야기하는 부분이 있다. 별 운동을 하루하루 세밀히 기록해 그 기록을 바탕으로 천체 운동의 패턴을 발견한 티코 브라헤나, 배들의 항해기록을 분석해 최적의 항로를 도출해낸 모리선장 등의 이야기가 그 예들이다.

 

이런 이야기들을 봤을 때 개인적으로 떠오른 책이 하나 있었다. 바로 에밀 뒤르켐의 자살론이다. 이 책은 1897년에 쓰여졌는데, 자살 문제를 철저히 통계적으로 분석하여 자살에 관련된 갖가지 편견들을 넘어 자살의 원인을 합리적으로 규명해 냈다. 그는 자살의 여러 이유중에 특히 현대사회에서 가장 문제가 되는 이유로 변화가 일상화된 현대사회에서 개인들이 혼란을 겪으며 고립되고 방치되고 있다는 점을 꼽고 있다.

 

아직 완독을 한 것은 아니나 1897년에 어떻게 그런 분석을 해낼 수 있었는지 곳곳에 인용되는 표들을 보면 혀를 내두를 정도다. 자본주의가 융성해 가던 시점의 그런 체계적이고도 탁월한 분석은 오늘날의 자살 문제를 바라보는 데 있어서도 많은 영감을 준다. 아직도 자살 기사에 '자살할 용기로 열심히 살지ㅉㅉ'라는 식의 막연한 댓글을 다는 사람이 있다면 이 책을 꼭 읽어보기 바란다.

 

빅 데이터가 사회적 문제를 해결하는데 일조할 수 있음을 깨닫는 사례로서 아주 적절하다고 본다.

 

 

※ 이 책의 요약 정보는 여기를 참고 : http://terms.naver.com/entry.nhn?docId=892611&cid=269&categoryId=1090

 

 

 

 

3. 빅 데이터의 강자 구글의 빛과 어둠 

 

NGC 냇지오 인사이드. 신의 직장, 구글

 

 

 

 

빅 데이터 시대에 강자는 단연 구글이다. 구글은 빅 데이터를 방대하게 수집하고 있을 뿐만 아니라, 그것을 체계적으로 축적하고 분석할 수 있는 기술도 가지고 있으며, 데이터들의 가치를 이끌어 낼 수 있는 통찰력을 지닌 인재들도 있다. 그 만큼 빅데이터 책에서도 구글의 예를 많이 언급하고 있다. 긍정적인 부분 뿐 아니라 사생활 침해 문제나 데이터의 독점, 관료제화와 같은 어두운 부분도 같이 다룬다.

 

이 다큐는 구글을 이해하는데 있어 기본적인 정보를 제공한다. 구글의 역사, 세르게이 브린과 래리 페이지를 비롯한 내부 인물들, 운영방식 등을 이야기하며 구글을 개괄해 보는 다큐라 할 수 있겠다. 이 다큐에서도 역시 구글의 막대한 권력을 이야기 하며 구글의 사회적 책임을 강조하는 걸 잊지 않는다. 구글의 미래는 결국 그런 책임에 대한 신뢰를 어떻게  유지하느냐에 달려 있다면서.

 

아주 깊이 있는 다큐는 아니지만 빅데이터 책과 연결지어 보면 여러모로 이해에 도움이 되는 다큐다.

 

 

 

 

EBS EIDF 2013 구글 북스, 라이브러리 프로젝트.

 

 

 

 

일전에 저작권 이야기를 하면서 언급했던 다큐다. 구글의 여러 빅 데이터 관련 서비스 중에 구글 북스는 그 규모와 영향력에 있어서 특히나 방대하다. 때문에 구글 북스에 있어서도 구글의 권력과 책임을 이야기 하지 않을 수 없다. 

 

세계의 모든 책을 온라인을 통해 한 곳에서 열람할 수 있다면 그 보다 좋은 서비스가 또 어디 있겠는가. 하지만 책을 관리하는 문지기인 구글이 공명정대하지 못한 길로 빠진다면 어떻게 될까. 책에 대한 정당한 대가 지불없이 자기들만 이익을 누린다면, 또 책에 대한 접근에 있어서 권력을 휘두른 다면 어떻게 될까. 독점 권력은 부패하기 마련이라는 말이 있지 않은가. 거대화된 구글이 어떻게 "don't be evil"이라는 사훈을 지켜갈 수 있을지 관심있게 지켜보는데 도움을 주는 다큐다.

 

 

 

 

4. 빅 데이터의 어둠

이제 빅 데이터의 어두운 면에 대해  좀 더 깊이 이야기 해보자.

 

빅 데이터는 여느 과학 기술과 다를바 없다. 올바르게 사용하면 인류에게 많은 혜택을 안겨줄 수 있지만 불순한 의도로 사용한다면 인류를 파멸로 몰아갈 수도 있다. 빅 데이터 책에서 지적한 빅 데이터의 어두우면은 크게 세가지다. 사생활 침해, 데이터의 독점을 통한 권력의 독점, 데이터에 대한 맹신으로 인한 오판과 남용의 문제가 그것이다.

 

 

포그 오브 워

 

 

 

 

이 다큐는 베트남 전쟁 당시 미국의 국방부 장관을 역임했던 로버트 맥나마라를 조명한 다큐다. 맥나마라가 자신의 인생을 통해 얻은 교훈을 인터뷰 형식으로 이야기 한다.

 

빅 데이터 책에서 저자는 빅 데이터의 어두운 면을 이야기하며 이 맥나마라를 자주 인용하고 있다. 맥나라마 라는 인물은 포드 자동차 회장을 하다가 국방부 장관이 된 특이한 경력의 인물이다. 하지만 그리 특이한 건 아니다. 이는 머니볼에서 야구선수 경험이 없는 통계분석가가 야구단 운영에 영향력을 발휘했던 사례와 일맥 상통하기 때문이다. 맥나마라는 숫자와 통계 전문가였다. 포드 자동차 이전에 2차대전 당시에도 그는 폭격에 관련된 통계적 분석을 통해 전쟁에 기여(?)했다. 포드 자동차에서도 현장보다는 데이터에 기초해 회사를 운영했다. 그리고 성공을 거두었다. 하지만 국방장관으로서 그는 성공하지 못했다. 어디까지나 확률에 불과한 데이터에 대한 맹신은 결국 오판을 불렀고 베트남 전을 빠져나올 수 없는 늪으로 몰아넣었다. 특히 그 판단의 기준이 되는 전쟁에 관련된 데이터들이 관료주의의 병폐로 인해 왜곡되면서 문제는 더 커질 수 밖에 없었다.

 

이 다큐의 내용과 빅 데이터 책에서 맥나마라에 대해 비판하는 내용이 묘하게 매치된다. 빅 데이터 책에서 비판한 바와 같이, 맥나마라는 과거로 부터 배울 것을 이야기 하지만 정작 자기 자신의 잘못에 대해서는 얼버무린다.

 

개인적으로 즐겨찾기를 해두는 에롤 모리스 라는 감독의 작품이기도 하다. 또 한 '포그 오브 워'는 2004년 아카데미상 장편다큐멘터리 부문 수상작이다.

 

 

 

 

[영화] 마이너리티 리포트

 

 

 

 

빅 데이터는 기본적으로 과거와 현재의 데이터를 통해 미래를 예측하는 개념이다. 그러나 이 예측은 100%가 아니며 어디까지나 확률에 기초한 상관관계에 불과하다. 확률이라는 걸 잊어버리고 데이터를 맹신한다면, 부작용이 발생할 수 밖에 없다. 'KBS 글로벌 다큐멘터리. 빅 데이터'에서도 봤듯이 빅 데이터로 사람들의 행동 패턴을 분석해 범죄예방에 이용하기도 하는데 이것이 정도를 넘어서면 마이너리티 리포트와 같은 상황이 되는 것이다. 단순히 영화라고 치부해 버릴 수 없는 이유다.

 

빅 데이터 책의 저자는 미래에 대한 불안과 데이터에 대한 맹신으로 예측의 덫에 걸려든 상황에 대한 묘사를 이 영화를 통해 설명한다. 그러면서 저자는 인간에게는 자유의지가 있으며 결국 그 자유의지로부터 빅 데이터를 분석하는 통찰력이 나오는 것임을 잊지 말라고 말한다. 빅 데이터 위의 빅 데이터는 인간 자신이라고 하면서.  

 

 

 

 

위 약관에 동의합니다.

 

 

 

 

개인 생활에 관련된 모든 것이 저장되며 빅 데이터화 되가는 시대. 과연 데이터화 된 개인 정보들은 어떻게 관리되고 있을까? 이 다큐는 빅 데이터의 가장 큰 문제로 지적되고 있는 사생활에 대한 위협 문제를 다루고 있다. 특히 우리가 각종 사이트에 가입할 때 별 생각없이 동의를 하곤 하는 약관의 내용을 분석해 인터넷 기업(특히 구글과 페이스북)들의 숨은 의도를 파헤쳐본다. 거기에 개인정보들을 탐내는 또 다른 세력인 국가정보기관들이 어떻게 개인정보를 수집하고 활용하는지도 알아본다.

 

개인정보 노출이 너무나 일상화된 나머지 우리는 개인정보 노출에 갈수록 무감각해지고 있다. 하지만 그렇게 쌓이거나 유출된 정보들이 어떻게 이용되고 있는지를 안다면 경각심을 다시 일깨울 수 있으리라 본다. 이 다큐는 빅 데이터 책에서 다룬 개인정보 관리 문제, 그리고 데이터를 바탕으로 한 통제 문제와 연결해서 볼 수 있다. 개인정보를 통해 개인의 행동을 예측하고 통제하는 국가정보기관들의 모습은 마이너리티 리포트와도 연결된다.

 

"몇 년 동안 대중을 몰래 감시한 저희로서는 수많은 사람들이 자발적으로 자신들의 거주지와 종교적, 정치적 견해, 순서대로 정리한 친구 목록, 이메일 주소, 전화번호, 자신이 찍힌 수백 장의 사진, 현재 하고 있는 활동 정보를 공개하니 놀랍기 그지 없습니다. CIA로서는 꿈에 그리던 일이죠" 라는 다큐 속 CIA 부국장의 말이 기억에 남는다. 인터넷 기업들의 책임있는 자세가 무엇보다도 중요하다는 걸 새삼 깨닫게 해주는 말이다.

 

 

 

 

 

 

5.빅 데이터 앞에선 선입견이 없어야 한다.

 

앤디해밀턴의 사탄을 찾아서

 

 

 

 

빅 데이터를 대할 때 많이 나오는 말이 '데이터가 스스로 말하게 하라'는 말이다. 그런데 데이터를 바라보는 이가 편협하거나 미신스러운 선입견을 가지고 있다면 데이터가 말하는 바를 제대로 들을 수 있을까? 바로 이런 관점에서 이 다큐가 영감을 주는 듯하여 연결해 봤다.

 

이 사탄을 찾아서 라는 다큐는 인간 내부에 깊숙히 박혀 있는 관습화된 선입견을 추적해 본다. 바로 "악마" 이라는 개념이다. 사회에 문제가 생겼을때 보통 그 문제의 원인을 개인에게서 찾는 경우가 많다. 극단적인 사건의 경우에는 한 개인을 '악마 같은 인간' 이라고 부르며, 그 개인에 대한 처벌에만 집중한다. 하지만 정말 개인만의 문제인가? 그 '악마같은 인간'을 제거하면 사회는 평화로와 지고 모든 문제가 자연스레 풀리는가? 아니다. 문제를 따라올라가다 보면 결국 드러나는 건 사회 구조와 시스템의 문제다. 이 다큐는 이렇게 "악마"라는 개념의 허상을 파헤쳐본다.

 

옛날 만화영화엔 주인공이 악마를 물리치면 어둠으로 둘러쌓인 마을이 일순간에 빛을 회복하면서 평화로운 마을로 바로 탈타꿈 하는 장면이 종종 나온다. 어릴 적에 이런 만화를 많이 봐서 그런지 아직도 어떤 문제가 터지면 종교인이 아니더라도 '우리 중에 악마가 있다. 그 악마가 누구냐? 찾아라!' 라는 식의 대응을 하는 사람들이 많다. 하지만 문제의 근원은 개인이 아니라 구조다. 사회구조가 제대로 구축되지 못한 상태에선 부조리들이 계속 발생할 수 밖에 없다. 

 

앞서 봤듯이 빅 데이터는 사회문제를 해결하는 데에도 도움을 준다. 특히나 빅 데이터를 기반으로 생겨나는건 어떤 단품이 아니라 체계와 시스템이기 때문에, 우리는 빅 데이터들을 더 잘 들여다 볼 필요가 있다. 선입견 없이 있는 그대로. 글을 쓰다 문득 생각난건데 이런 "악마"에 대한 선입견이 빅 데이터와 만나면 결국 마이너리티 리포트와 같은 사회가 탄생하는게 아닐까?  

 

아, 그리고 정말 재치있게 잘 만들었다. 이 다큐는 재미면에서 최고 점수를 주고싶다.

 

 

 

 

6.빅 데이터는 순간의 유행인가?

 

[책]소유의 종말.

 

 

 

 

자 또 이 책이 등장했다. 이 쯤되면 내가 제러미 리프킨의 빠가 아니냐는 의심도 할지 모르겠다.8 그렇지는 않다. 철저히 내용에 기반해 이 책을 다시 빼들었다. 빅 데이터를 보다 보면 너무나 광범위한 영향력을 이야기하는 것에 '그냥 한 시대의 유행이 아닌가?' 라는 생각을 가질 수 있을 것이다. 어떤 이론이나 개념이 한 순간의 유행인가 아닌가를 판단하는 방법으로는 흐름속에서 연결지어 생각하는 방법이 좋은 방법이 될 수 있다.

 

소유의 종말은 2000년도에 쓰여진 책이고 '빅데이터가 만드는 세상'은 2013년에 쓰여진 책이다. 그런데 두 책을 비교해 보면 수많은 연결고리들이 보인다. 즉 소유의 종말이 이야기한 사회의 경향이 빅 데이터 책이 말하는 오늘날의 사회에서 더 뚜렷해 졌다는 말이다. 소유의 종말에서 말한 '물질 소유보단 네트워크 접속 가능성과 빈도가 가치를 더 부른다' 라는 말은 빅 데이터로 더욱 강화된 네트워크가 힘을 발휘하는 지금의 시대에 큰 설득력을 얻는다.

 

"모든 것에 대한 시각을 바꿔놓는 책은 10년에 한 두권 나온다" 라는 말은 로렌스 레식이  '빅 데이터로 만드는 세상' 을 언급하며 한 말인데, 두 책간의 시간차를 봤을 때 더 인상깊게 다가온다.

 

 

 

 

 

p.s. 빅데이터를 말하는 우리나라 다큐로서 'KBS 시사기획 창. 빅 데이터, 비지니스를 바꾸다' 라는 시사다큐가 있다. 여기 지도에 그려넣지 않은 이유는 전체적으로 짜집기식으로 보이는 데다가, 결정적으로 마지막 부분에서 실소마저 터저 나오는 내용이 있어서다. 그러나 들어볼 만한 내용도 있으므로 참고삼아 언급해 본다.

 

 

 

 

 

 

 

이상으로 빅 데이터의 세계를 들여다 봤다. 나름 완성도 있게 만들어 본다는 욕심에 시간이 좀 걸렸다. 앞으로 이 지도는 다큐나 책 뿐만 아니라 새로운 자료가 나오면 계속 첨부되며 갱신될 것이다. 빅 데이터를 말하는 빅 데이터로서 자리 잡을 수 있기를 희망해 본다.

 

빅 데이터 이야기를 위해 자료를 찾으면서도 느낀 점이지만, 우리나라의 빅 데이터 환경은 아직도 만들어가야 할 게 너무 많은 듯하다. 특히 데이터들을 일목요연하게 보여주는 체계가 아쉽다. 많은 데이터들이 그저 모래알 같이 흩어져 있기만 하다. 개인이 일일히 정리해서 보는데 너무 많은 에너지를 소비할 수 밖에 없다. 빅 데이터 책에서도 이야기 하는 부분이지만, 빅  데이터의 가치를 이끌어 낼 수 있는 이들의 상당수는 아무것도 소유하지 않았기에 선입견 없이 빅데이터들을 넓게 바라볼 수 있는 이들이다. 앞으로 빅 데이터들이 더 많이 '체계적'으로 개방된다면 이런 숨은 인재들이 자기만의 방향성으로 갖가지 콘텐츠와 시스템들을 쏟아 낼 수 있다는 말이다. 체계적이지 못한 빅 데이터 환경이 아쉬울 수 밖에 없다.

 

다큐와 관련하여 지식입문 체계를 만들어 가려고 하는 내 입장에서도 빅 데이터는 많은 영감을 준다. 다큐 라는 영역 자체가 빅 데이터 이기 때문이다. 다큐의 수는 정말로 헤아리기 어려울 정도다. 하지만 우리나라에서 이 다큐 빅 데이터를 제대로 이용하기 위해 기초적으로 활용할 수 있는 체계는 전무하다 시피 하다. 유튜브나 imdb 같은 체계를 보면 그저 부러울 수 밖에 없다. 특히 다큐 콘텐츠 자체도 3~4년 정도가 지나면 시야에서 사라진다. 어딘가 존재는 하지만 그 존재 자체를 알 수 가 없다. 빅 데이터로 축적되긴 커녕 결국 모두 버려진다. 


데이터들을 단지 많이 흩뿌려 놓는다고해서 그 가치가 드러나는 것은 아니다. 과거의 정보들을 축적하고 활용할 수 있는 체계와 동시대의 많은 데이터들이 연결될 수 있는 체계 그리고 사람과 사람, 사람과 데이터가 연결될 수 있는 체계들이 우선 구축되어야 한다. 그래야만 빅 테이터의 가치를 제대로 이끌어 낼 수 있고, 그 연결된 체계를 통해 데이터 독점과 오남용으로 인한 폐해도 줄일 수 있다. 늘 말하지만 개인이나 기업, 서비스들도 그런 연결 속에서 자신을 더 잘 드러낼 수 있다. 

 

 

 

 

 

 

1.왜 연결인가? : 제주올레 가 반영하는 시대상

 

 

 

 

 

 

1.빅 데이터 개념 정리 : http://terms.naver.com/entry.nhn?docId=1691553&cid=3619&categoryId=3623 (목차의 제목들을 클릭)

 

2.관련 위키항목 : 빅 데이터  / big data

 

3.빅데이터 분석가 : 클릭

 

 

 

 

 

 


 

  1. 빅 데이터에 대한 관심의 증가세는 여기를 참고하시라.
    http://www.google.com/trends/explore#q=big%20data
  2. 아마존에서 책에 대한 반응을 볼 수 있다.
    http://www.amazon.com/Big-Data-Revolution-Transform-Think-ebook/dp/B009N08NKW/ref=sr_1_1?ie=UTF8&qid=1399029335&sr=8-1&keywords=big+data
  3. 예를들어 구글 검색에서 어느 특정 지역에서 독감 증세에 대한 검색이 갑자기 는다면 왜인지는 몰라도 현재 그 지역에서 독감이 퍼지고 있다는 걸 바로 예측할 수 있다. 그렇기에 빠르게 대처할 수 있다.
    월마트에선 기존의 데이터를 가지고 날씨변화에 따라 계산대 앞에 쌓아 놓는 소형 상품들의 배치를 바꾼다. 왜 날씨에 따라 소비 패턴이 틀려지는지는 알 필요가 없다. 일단 데이터가 말하는 대로 하기만 하면 된다.
    이들은 빅데이터로 부터 얻을 수 있는 효용의 단순한 예에 불과하다.
  4. 뉴욕의 범죄율 하락의 경우 그 원인으로 "깨진 유리창의 법칙"이 많이 이야기 된다.
    스티븐 레빗은 깨진 유리창의 법칙 자체를 부정하는 것은 아니다. 다만 여러 데이터를 종합해 봤을 때 '낙태 허용으로 인한 불우한 시절을 보낸 이들의 감소'가 그 원인이라고 말하고 있다.
    물론 범죄율 감소를 위해 낙태를 이용해야한다는 말은 절대 아니며 다만 그 상관관계만을 말하고 있다.
  5. 스티븐 레빗은 괴짜 경제학에서 이 아웃라이어를 언급하진 않지만, 호감어린 말투로 말콤 글래드웰을 직접적으로 언급한다.
  6. 비정형 데이터(unstructured data)란 일정한 규격이나 형태를 지닌 숫자 데이터(numeric data)와 달리 그림이나 영상, 문서처럼 형태와 구조가 다른 구조화 되지 않은 데이터를 말한다.
    자세한 내용은 아래 참고.
    http://terms.naver.com/entry.nhn?docId=1691558&cid=3619&categoryId=3623
  7. 블랙박스 분석을 통해 기장과 부기장간의 우리나라 특유의 권위적인 위계질서가, 추락당시 부기장이 의견을 제대로 내지 못하게 하는 장벽으로 기능했음이 밝혀졌다.
  8. 절대 아니라능

    [출처] 빅 데이터의 세계|작성자 나무

+ Recent posts