por Hector Russo | http://geeksroom.com
Cuando hablamos de Big Data en general hablamos de grandes volúmenes de data semi estructurada o sin estructurar, que produce una empresa y que es casi imposible cargar en una base de datos relacional para su análisis. No es que no se pueda, pero cuesta mucho dinero y tiempo para hacerlo.
Cuando hablo de volumen, en realidad no hay una especificación clara ni una cantidad que define los que es considerado Big Data, pero para que tengan una idea de Big Data, son cantidades de datos que podemos medir en petabytes, exabytes o zettabytes.
Para manejar estos volúmenes de datos las empresas y administraciones públicas necesitan de una tecnología diferente a las usadas con cantidades de datos mucho menores. Necesitan una tecnología capaz de almacenar, procesar y analizar los datos en forma rápida y eficiente.
Esta tecnología es Apache Hadoop, plataforma desarrollada en Java por Doug Cutting e inspirada en los documentos Google MapReduce y Google File System (GFS). Fue implementada por primera vez por Yahoo! Sigue leyendo














