Todos formamos parte de ese gran
crecimiento de datosTerabyte = 1012 = 1,000,000,000,000
Petabyte = 1015 = 1,000,000,000,000,000
Exabyte = 1018 = 1,000,000,000,000,000,000
¿Qué tipos de datos debo explorar?
Debido al gran avance que existe día
con día en las tecnologías de información, las organizaciones se han
tenido que enfrentar a nuevos desafíos que les permitan analizar, descubrir y
entender más allá de lo que sus herramientas tradicionales reportan sobre su
información, al mismo tiempo que durante los últimos años el gran crecimiento
de las aplicaciones disponibles en internet (geo-referenciamiento,
redes sociales, etc.) han sido parte importante en las decisiones de negocio de
las empresas. El presente artículo tiene como propósito introducir al lector en
el concepto de Big Data y describir algunas características de los
componentes principales que constituyen una solución de este tipo.
El primer cuestionamiento que posiblemente llegue
a su mente en este momento es ¿Qué es Big Data y porqué se ha vuelto
tan importante? pues bien, en términos generales podríamos referirnos como a la
tendencia en el avance de la tecnología que ha abierto las puertas hacia un
nuevo enfoque de entendimiento y toma de decisiones, la cual es utilizada para
describir enormes cantidades de datos (estructurados, no estructurados y semi
estructurados) que tomaría demasiado tiempo y sería muy costoso cargarlos a un
base de datos relacional para su análisis. De tal manera que, el concepto de Big Data
aplica para toda aquella información que no puede ser procesada o analizada
utilizando procesos o herramientas tradicionales. Sin embargo, Big Data
no se refiere a alguna cantidad en específico, ya que es usualmente utilizado
cuando se habla en términos de petabytes y exabytes de
datos. Entonces ¿Cuánto es demasiada información de manera que sea elegible
para ser procesada y analizada utilizando Big Data? Analicemos
primeramente en términos de bytes:
Gigabyte = 109 =
1,000,000,000
Además del gran volumen de
información, esta existe en una gran variedad de datos que pueden ser representados de
diversas maneras en todo el mundo, por ejemplo de dispositivos móviles, audio, video,
sistemas GPS, incontables sensores digitales en equipos industriales,
automóviles, medidores eléctricos, veletas, anemómetros, etc., los cuales
pueden medir y comunicar el posicionamiento, movimiento, vibración,
temperatura, humedad y hasta los cambios químicos que sufre el aire, de tal
forma que las aplicaciones que analizan estos datos requieren que la velocidad de
respuesta sea lo demasiado rápida para lograr obtener la información correcta
en el momento preciso. Estas son las características principales de una oportunidad
para Big Data.
Es importante entender que las bases
de datos convencionales son una parte importante y relevante para una
solución analítica. De hecho, se vuelve mucho más vital cuando se usa en
conjunto con la plataforma de Big Data. Pensemos en nuestras manos
izquierda y derecha, cada una ofrece fortalezas individuales para
cada tarea en específico. Por ejemplo, un beisbolista sabe que una de
sus manos es mejor para lanzar la pelota y la otra para atraparla; puede ser
que cada mano intente hacer la actividad de la otra, mas sin embargo, el
resultado no será el más óptimo.
Muchas organizaciones se
enfrentan a la pregunta sobre ¿qué información es la que se debe analizar?, sin
embargo, el cuestionamiento debería estar enfocado hacia ¿qué
problema es el que se está tratando de resolver?
Si bien sabemos que existe una amplia
variedad de tipos de datos a analizar, una buena clasificación nos
ayudaría a entender mejor su representación, aunque es muy probable que
estas categorías puedan extenderse con el avance tecnológico.
Figura 1. Tipos de datos de Big Data[2]
1.- Web and Social
Media: Incluye contenido web e información que es obtenida de las
redes sociales como Facebook, Twitter, LinkedIn, etc, blogs.
2.- Machine-to-Machine (M2M):
M2M se refiere a las tecnologías que permiten conectarse a otros dispositivos.
M2M utiliza dispositivos como sensores o medidores que capturan algún evento en
particular (velocidad, temperatura, presión, variables meteorológicas,
variables químicas como la salinidad, etc.) los cuales transmiten a través de
redes alámbricas, inalámbricas o híbridas a otras aplicaciones que
traducen estos eventos en información significativa.
3.- Big Transaction Data:
Incluye registros de facturación, en telecomunicaciones registros detallados de
las llamadas (CDR), etc. Estos datos transaccionales están disponibles en
formatos tanto semiestructurados como no estructurados.
4.- Biometrics: Información biométrica en
la que se incluye huellas digitales, escaneo de la retina,
reconocimiento facial, genética, etc. En el área de seguridad e inteligencia,
los datos biométricos han sido información importante para las
agencias de investigación.
5.- Human Generated: Las
personas generamos diversas cantidades de datos como la información que guarda
un call center al establecer una llamada telefónica, notas de
voz, correos electrónicos, documentos electrónicos, estudios médicos, etc.
PUBLICADO POR: VENICE AQUINO MORALES
No hay comentarios:
Publicar un comentario