Referencias Tecnológicas

¿Qué es el Big Data?

Fondo negro con número binarios digitales azules mostrando qué es el Big Data.

¿Te has dado cuenta de la cantidad de datos que una persona genera en la actualidad? De acuerdo con un estudio publicado por la revista Science, que pretendía cuantificar la cantidad de información generada y almacenada en el mundo, la humanidad había producido, en toda su historia y hasta principios del nuevo milenio, una cantidad equivalente a cinco millones de billones de bytes.

Hoy en día, esta misma información se genera ¡En tan solo 48 horas!

Gracias al crecimiento y acceso exponencial que tenemos a tecnologías como teléfonos inteligentes, dispositivos de geolocalización, redes sociales, etcétera, las personas hemos pasado a convertirnos en “fuentes de información” que producen y comparten un descomunal tráfico de datos en todo momento.

Ahora bien, si trasladamos esto a organizaciones y empresas que implementan TI para sus operaciones, analizar esa cantidad de información de forma rápida y concisa es crucial, y el gran reto es hacerlo más allá de lo que las herramientas y procedimientos normales que reportan las compañías.

Ahí entra el concepto de Big Data.

¿Qué es el Big Data?

También denominados macrodatos o datos masivos, Big Data se refiere a la cantidad de información que suele ser tan grande que no puede ser procesada por un software “de manera normal” para devolver la información en tiempos «razonables».

Como ejemplo tenemos las consultas directas que no pueden devolver, de manera rápida y sobre demanda, información de una base de datos que contiene información compleja y en grandes cantidades.

¿En qué sectores se aplica el Big Data?

Big Data ha abierto una nueva carrera competitiva para las empresas, mientras que los sectores que adoptan este concepto se ven beneficiados con grandes hallazgos a la hora de formular decisiones de negocios o tratar de resolver problemas complejos relacionados con descubrimientos científicos, temas de salud, educación, seguridad, entre otros.

¿Cómo se dimensiona el Big Data?

Hablar de Big Data no se refiere a una cantidad de datos específica, sino que aplica para cantidades cuyo tamaño se expresa por encima de los Terabytes (un billón de bytes), como los Petabytes (mil billones de bytes) o los Exabytes (un millón de billones de bytes).

Esta información puede provenir de diferentes fuentes (teléfonos inteligentes, sensores, creación de documentos, cámaras digitales, etcétera) y puede ser representada de distintas maneras (desde videos e imágenes hasta información de geolocalización, etcétera), no obstante, se requiere de una respuesta rápida y precisa de esta información (como puede ser el caso de una aplicación de redes sociales o transacciones bancarias).

¿Cómo se clasifica el Big Data?

Los datos que se pueden analizar mediante Big Data los podemos clasificar de la siguiente manera:

  • Web y Social Media: como el nombre lo describe, son datos obtenidos de la web y redes sociales, como Twitter o Facebook.
  • Machine-to-machine: son los datos que son generados por instrumentos, como sensores o medidores, y son enviados a través de cualquier tipo de conexión a uno o varios dispositivos que, a su vez, traducen los en información significativa, palpable, aprehensible y entendible para el ser humano.
  • Big Transaction Data: son datos generados por algún tipo de transacción, como facturaciones, interacciones bancarias, adquisición de bienes, etcétera.
  • Biometrics: son datos que incluyen información biométrica, como huellas digitales, escaneos de retina, reconocimiento facial, etcétera.
  • Human Generated: son datos que las personas generan, como documentos, correos electrónicos, imágenes, videos, audios, etcétera.

¿Cuáles son las tareas del Big Data?

Una plataforma de Big Data se puede componer básicamente de dos principales tareas: mapear (mapper) y reducir (reducer), con los cuales se pueden manipular los datos y distribuirlos en nodos de un clúster para lograr un gran paralelismo en el procesamiento de datos.

¿Por qué es importante el Big Data?

Para los científicos de datos, Big Data es uno de sus insumos esenciales. En la ciencia de datos, la cual es un campo interdisciplinario en el que los investigadores obtienen el conocimento o información acerca de los datos en varias formas, los expertos se apoyan de sistemas y procesos que involucran ecuaciones, modelos, algoritmos e interpretación de datos para el mejor entendimiento de volúmenes grandes de información.


Relacionado: De Obama a Trump – Ocho ejemplos reales del uso del Big Data


¿Qué beneficios trae el Big Data?

Al hacer uso de la información capturada por Big Data, se prevé que un proveedor minorista pueda hacer crecer su margen de rendimiento en un 60 por ciento; también servicios que hacen uso de la información personal y de localización de sus clientes pueden percibir alrededor de 600 mil millones de dólares en excedentes económicos.

¿Cuál es el futuro del Big Data?

El Big Data enfrenta una gran carencia: la falta de especialistas y de talento por parte de las empresas y organizaciones para que se pueda tomar ventaja de ello.

Para el 2018 en los Estados Unidos se prevé una escasez de entre 140 mil y 190 mil personas con capacidad de análisis profundo sobre grandes cantidades de datos y alrededor de 1.5 millones de administradores y managers con la preparación necesaria para utilizar este análisis en tomas de decisiones efectivas.

Por ello, carreras de análisis y ciencias de datos van a presentar mucha demanda en los años que vienen, así las organizaciones y empresas pretenden prepararse para las nuevas competencias que se vivirán en el mercado en un futuro muy próximo.

unlimit your possibilities

Karina Puga

Veinte años de trayectoria en icorp, actualmente Gerente de Shared Field Services, especialista en manejo de equipos de trabajo, administración de tiempos y cumplimiento de indicadores. Busca siempre ser mejor persona e impulsar el brillo de los demás.