Pablo Marshall, profesor de la Universidad Católica y Director de Desarrollo Docente de la Escuela de Administración UC, explica qué es big data. “Es un concepto que se encuentra de moda actualmente. Si observamos el nombre textual serían muchos datos acumulados o gran cantidad de datos. El big data ha evolucionado y ha tenido un crecimiento exponencial con el desarrollo de Internet. Hoy día tenemos más datos, más documentos digitalizados y más información que antes. Eso es una realidad”.
“La web 1.0 es el inicio del Internet, donde se usaba esta plataforma para hacer negocios online y básicamente los usuarios eran pasivos. En 2005 aparece la web 2.0 con las redes sociales. El consumidor se vuelve activo, hay una nueva forma de relacionarse y hay una nueva forma de interactuar entre las personas. Después viene la web 3.0 con el Internet de las Cosas, donde los dispositivos electrónicos están conectados entre sí. Las cosas están conectadas. Por ejemplo, los automóviles están conectados entre sí. Expertos anticipan el auge de la web 4.0 que será una mejor forma de usar los datos que ya tenemos actualmente”, señala.
El big data se define a través de lo que los expertos han denominado las 5V: volumen, variedad, velocidad, veracidad y valor.
La primera característica es el volumen. La cantidad de información hoy en día es de un orden de magnitud muy superior a lo que hemos estado acostumbrados a almacenar y procesar. Estimaciones de expertos aseguran que en los últimos años se han generado más datos que en toda la historia previa de la humanidad. Pero, según Marshall, una de los atributos más significativos no es el volumen, sino la variedad.
Mientras los datos tradicionales tienen una forma estructurada y usualmente numérica, la revolución de big data contiene información no numérica y no estructurada: mensajes de texto, fotos, vídeos, audios, ubicaciones geográficas, lecturas de sensores e imágenes.
Las bases de datos tradicionales no están diseñadas para manejar este tipo de datos no estructurados. Por lo tanto se requieren de adaptaciones. Mucho se ha avanzado en el análisis de texto o text mining para análisis de concepto y sentimiento.
La velocidad es otra de las características principales de big data. En muchas aplicaciones los datos solo tienen sentido si pueden procesarse en tiempo real. Marshall ejemplifica con los casos de Netflix, Waze, Uber, Amazon. Cuando usted termina de ver una película o una serie, Netflix le ofrece una nueva alternativa para mirar en la plataforma online.
La veracidad de los datos se refiere a que antes de usar y poder hacer predicciones a partir de big data se requiere determinar su validez y calidad. Este concepto se relaciona con qué los datos sean confiables porque el big data requiere de creatividad en los negocios. Marshall ejemplifica con las aplicaciones de taxi online como Uber y Easy Taxi. “Antes salíamos a la calle, levantábamos la mano y pedíamos un taxi. Con la aparición de estas aplicaciones se cambió la forma de usar el taxi y se cambió la forma de hacer negocios en el mundo. El big data mejoró los procesos entre los taxistas y los pasajeros”, dice el académico de la UC.
El valor de big data para personas y organizaciones se deriva de nuevos y mejores productos y servicios, mayor productividad, menores costos, mejores formas de comunicación y mayor transparencia. Las empresas deben hacer un cambio cultural dentro de la organización.
Desafíos de big data en la alta gerencia
Los desafíos más significativos del big data se relacionan con la alta gerencia, el liderazgo en los negocios, el data scientist, el almacenamiento, la visualización y el análisis granular.
Marshall dice que la alta gerencia se debe convencer de la importancia del big data y deben empujar en una nueva forma de hacer negocios con un liderazgo creativo.
En almacenamiento, las bases de datos tradicionales no son eficientes para manipular grandes conjuntos de datos y no están acondicionadas para manejar datos no estructurados como son los que se generan en proyectos de big data.
Con respecto a la visualización, a los seres humanos nos gusta ver las cosas. El big data requiere llevar los grandes volúmenes de datos a escala humana para poder visualizar la información, hacer insight y desarrollar hipótesis para el análisis posterior.
Los partidos de la NBA, desde hace varios años son grabados con varias cámaras que capturan todos los detalles mientras se desarrolla el juego. Profesores de la Universidad de Harvard han procesado estos datos en bruto para analizar los intentos de gol de jugadores y equipos.
Un data scientist es un experto que resuelve problemas complejos de diferentes disciplinas, entre ellas finanzas, marketing, ciencias e industrias. Es una persona con curiosidad y capacidad analítica que tenga formación en las herramientas necesarias para crear significado y valor sobre los datos.
“General Electrics, líder mundial de motores, incorporó en los proceso de producción de su empresa sensores y big data. Los sensores permitieron anticipar fallas en los sistemas internos. Por este motivo, no requería de ingenieros eléctricos, sino de analistas de datos que usaron la información de mejor forma para entregar un mejor servicio al cliente”, explica Marshall.
Foto: Datafloq