▶ Info/[스크랩]

[스크랩] 빅 데이터, 세상을 바꾸다

호랑가시 2013. 3. 30. 15:21

 

지금 당장 포털 사이트에 "빅 데이터"를 입력해 보세요. 29일 현재 네이버(naver.com)에서는 1만6849건의 뉴스가 검색됩니다. "빅 데이터 시대 카운트다운" "빅 데이터로 본 강남", "삼성전자, 빅 데이터 본격 행보", "빅 데이터가 '빅 브라더' 된다면…'데이터 사이언티스트' 육성 절실", "민심의 보고 '빅 데이터'" 등의 제목이 눈에 띕니다. 구글(google.com)에 영어로 "Big Data"를 입력하면 결과는 더 극적입니다. 무려 문서 22억7000만 건이 검색됩니다.

 

 

 

빅 데이터, '인공 지능'을 꿈꾸다!

 

"빅데이터란 기존의 방식으로는 관리와 분석이 매우 어려운 데이터 집합, 그리고 이를 관리, 분석하고자 필요한 인력과 조직 및 관련 기술까지 포괄하는 용어이다." (<빅 데이터, 경영을 바꾸다>, 37쪽)


구글 번역 서비스에서 한국어를 영어로 번역을 하면 그 결과가 신통치 않아요. 그런데 한국어를 문법 구조가 비슷한 일본어로 번역을 하면 꽤 그럴듯하거든요. 그런데 이 일본어를 다시 영어로 번역하면 애초 한국어 문장에 상응하는 상당히 정확한 영어 문장이 나옵니다.

 

도대체 왜일까요? 일본 야동(야한 동영상)의 힘이죠. (웃음) 영어권의 사용자들이 일본에서 생산된 야동, 애니메이션, 만화 등의 대사를 자꾸 번역을 하다 보니, 일본어를 영어로 번역한 데이터가 쌓이고, 그 결과 일본어를 영어로 번역하면 그럴듯한 문장이 나오게 된 겁니다.

의외의 곳에서 방금 지적한 빅 데이터의 효과가 나타난 거예요.

 

'빅 데이터'는 '큰 데이터'가 아니다


빅 데이터는 이른바 '3V'로 통칭되는 다음 세 가지 특징을 염두에 두고 정의를 내려야 합니다. 3V는 '규모(Volume)', '다양성(Variety)', '속도(Velocity)'인데요. 명실상부한 빅 데이터로 불리려면 이 세 가지 특징을 어느 정도 만족해야 합니다. 우선 규모부터 살펴볼까요.

 

엄밀한 정의는 없지만, 대략적으로 수 테라바이트에서 많게는 수 페타바이트 정도 크기의 데이터를 빅 데이터로 간주합니다.

비유를 해보죠. 요즘에는 가장 작은 USB 메모리의 용량도 수 기가바이트를 넘습니다. 1기가바이트(10억 바이트)를 생수통 절반을 채울 정도의 모래로 비유해 볼게요. 그렇다면, 1테라바이트(1조 바이트)는 85제곱미터(약 25평) 아파트에 10센티미터 깊이로 모래를 채울 정도의 양입니다. 1페타바이트(1000테라바이트)는 해운대 백사장의 모래 정도고요.

 

그런데 이 정도의 빅 데이터가 드물지 않아요. 스위스 제네바 근처의 유럽입자물리연구소(CERN·세른)에는 100미터 지하에 전체 길이 27킬로미터의 LHC(Large Hadron Collider, 대형 강입자 충돌기)가 있어요. 이 LHC에서 2010년 한 해에만 무려 13페타바이트의 데이터가 쏟아져 나왔습니다.

과학뿐만이 아니에요. 세계 최대의 유통 업체 월마트는 전 세계 15개국에 8500곳이 넘는 매장을 가지고 있어요. 월마트에서 관리하는 각종 거래 데이터만 벌써 2500테라바이트를 넘어섰어요. 데이터 웨어하우징 인스티튜트(TDWI)의 조사 결과를 보면, 미국 기업의 약 37퍼센트가 이미 10테라바이트 이상의 데이터를 갖고 있다고 합니다.

.

.

 

[출처] 프레시안닷컴

http://www.pressian.com/article/article.asp?article_num=50130329131236&Section=02

 

빅브라더에서 창조자로 변신하는 통신사/ 빅데이터로 창조적 파괴 이뤄

http://news.inews24.com/php/news_view.php?g_serial=734097&g_menu=020300