¿Qué es el Big Data?

Hoy en día y debido a los grandes avances en tecnología y la gran cantidad de personas que hacemos uso de ella, es una realidad que generamos una cantidad infinita de información que debe ser almacenada en algún lugar para poder hacer uso de ella.

Este nuevo concepto aparece cuando tenemos un volumen de datos de un petabyte, es decir, un millón de gigabytes de información, sin embargo, para que estos datos sean útiles y nos aporten conocimiento, es necesario analizarlos y darles el tratamiento adecuado para que sean útiles y el objetivo principal, sea fácil acceder a ellos en el momento que sea necesario.

 

 

Lo que vuelve interesante el concepto es la explotación que le podemos dar a la información ya que el análisis del big data puede proporcionar oportunidades a sectores tradicionales como el transporte, la salud o la fabricación, y puede mejorar la investigación y acelerar la innovación, además de influir en la productividad.

 

Existen 5 tipos de big data que son clasificados así debido al uso de la información:

 

  • Contenido Web y Social: En este apartado se encuentra toda la información que es obtenida de redes sociales, como: Facebook, Twitter, LinkedIn, etc.

     

  • Dispositivo a dispositivo: Se refiere a las tecnologías que permiten conectarse a otros dispositivos como sensores, medidores, etc., que traducen los eventos que captan en información significativa.

     

     

  • Datos de transacciones: Incluye los registros de facturación, de llamadas, etc.

     

  • Biométricos: Se refiere a toda la información biométrica en la que se incluyen huellas digitales, reconocimiento facial y genético, etc.

     

     

  • Datos generados por los humanos: Aquí se incluye toda la información personal, correos electrónicos, historiales médicos, documentos electrónicos, etc.

 

A continuación mostramos una lista de decisiones a tomar en cuenta para la aplicación de una solución de big data:

 

  • Análisis: Distinguir si la información se analizará en tiempo real o se organiza de tal manera que pueda analizarse posteriormente, es muy importante esta decisión, ya que afecta a otras como hardware, software, frecuencia de datos esperada, etc.

     

  • Metodologías de procesamiento: La elección de esta metodología ayuda a identificar las herramientas y técnicas apropiadas para nuestra solución.

     

  • Frecuencia y tamaño de los datos: La cantidad de información que se espera y con qué frecuencia llega, así como el tamaño de la misma, lo que nos ayudará a determinar el mecanismo y formato de almacenamiento.

     

  • Formato de la información: No será lo mismo planear nuestra arquitectura de big data para una tienda de música que para manejo de historiales clínicos.

     

  • Origen de datos: Identificar los orígenes de datos ayudará a determinar el ámbito desde una perspectiva empresarial

 

  • Consumidores de datos: Identificar a los consumidores nos da la ventaja de anticiparnos a detalles técnicos en nuestra arquitectura.

 

  • Hardware: Es una de los análisis más complicados y el que no se puede determinar si no tenemos claros los puntos anteriores, aquí se definen las limitaciones y el alcance que tendrá nuestra solución.

     

 

Share: