Aunque la meta es clara, la ejecución es compleja, porque nos golpea una verdad: tener datos no significa estar listo para hacer análisis de big data. De hecho, antes de poder usar big data, tenemos que asegurarnos de que tenemos la infraestructura de información necesaria para poder capturar y almacenar los datos que eventualmente servirán para realizar el tipo de análisis que va a informar nuestras decisiones. En lo que sigue, explicaremos cómo se llega a poder hacer análisis de big data.
1. ¿Cuál es la diferencia entre big data y el análisis estadístico común?
Antes de comenzar, debemos responder a la pregunta, ¿cuál es la diferencia entre big data y el análisis estadístico que hacen la mayoría de empresas? El corazón de big data es el análisis estadístico, pero la diferencia tiene que ver con el volumen, la velocidad y la variedad de datos que se analizan. El análisis estadístico común se puede realizar con muestras pequeñas de datos en un programa tan simple como Excel. Big Data, en cambio, depende de herramientas más robustas para poder consumir, transformar y analizar datos de forma masiva y en tiempo real, y depende de lenguajes de programación propios como R para poder gestionar la complejidad de análisis requerido. Aunque es difícil proponer una definición firme, la diferencia principal es el volumen y complejidad de datos que estamos analizando.
2. ¿Por qué hacer análisis de big data?
El análisis de big data promete contar historias con respaldo analítico que nos ayudan a ser más rentables y eficientes. Mientras que con una encuesta asumimos que la población se comporta igual que una pequeña muestra, con big data podemos analizar el comportamiento de todos nuestros usuarios, tanto a nivel global como individual. El tener una visión completa del comportamiento del cliente ayuda a tomar decisiones más acertadas de ventas, marketing, inventario, etc. que mejoran la relación empresa-cliente y el ROI. Según un estudio de McKinsey&Company, las empresas que usan big data para Customer Lifecycle Management y específicamente para enfocar mejor sus esfuerzos de marketing, aumentan su rentabilidad en 20% o más. De cierta manera, usamos big data para reemplazar la intuición del gerente. El gerente todavía tiene que aplicar su juicio, pero en lugar de sobre-debatir el mérito de ideas, usamos datos para informar las decisiones que tomamos.
3. ¿Cómo se empieza con el uso de big data?
El comienzo del uso de big data es una pregunta: ¿qué problema podríamos resolver con más datos? Sin una pregunta específica, tener análisis de big data es como tener una página web: la infraestructura en sí no vale mucho sin el contenido que pretende presentar. Una vez que tengamos la pregunta, pasamos a la fase de infraestructura, con otra pregunta:
4. ¿Cuáles son nuestras fuentes de datos? (Data Sources)
¿Cuáles son las fuentes de datos que tenemos disponibles para contar historias sobre nuestra empresa? Puede que tengamos QuickBooks para manejar proveedores y facturas; un ERP como SAP u Oracle para gestionar inventario; datos transaccionales en una base de datos SQL; un CRM, etc. En el caso de marketing, tenemos herramientas como Google Analytics, AdWords y Facebook que son fuentes distintas que no necesariamente interactúan bien entre sí. Antes de poder entender qué hacer con big data, debemos primero entender cuáles fuentes tenemos disponibles y cuán accesibles son.
5. ¿Cómo es la infraestructura de big data?
Según Google, para poder hacer análisis de datos hay que pasar por cuatro fases: coleccionar, transformar, analizar, y visualizar. Para coleccionar, debemos enviar los datos a un almacenamiento colectivo para tener todas las fuentes integradas en un solo lugar. Luego debemos limpiar esos datos (el proceso de transformar) para que nos sean útiles. La limpieza de datos implica asegurar que todos los datos carecen de los tipos de errores que podrían desviar el análisis.
Una vez que los datos estén limpios, empieza el proceso de analizar. Analizar datos implica tener software con la capacidad suficiente para procesar grandes cantidades de datos y luego producir resultados. Otra vez aquí vemos una diferencia clave con el análisis estadístico común: Excel suele auto-cerrarse cuando le exiges mucho. Software como Google Bigquery tienen la capacidad analítica y de procesamiento para realizar ese tipo de análisis sin quebrarse.
Finalmente tenemos visualización, que nos permite reproducir los datos de una forma visual y amigable. Algunos programas de visualización también permiten que usuarios sin formación en estadística o programación manipulen la presentación de los datos para sacar sus propias conclusiones.
6. ¿Cómo sabes que necesitas big data?
Armar la infraestructura para hacer análisis de big data es costoso, y a veces el análisis estadístico resulta suficiente para una empresa. En Céntrico Digital, sabemos que un gerente está listo para big data cuando empieza a pedir reportes detallados, correlaciones y atribución en marketing para entender mejor su operación y ROI. El problema principal es que mucha gente quiere pasar de fuentes de datos dispersas como AdWords, Analytics y Facebook, directamente a la visualización, pero los programas de visualización no tienen la capacidad de procesamiento para hacer más que representar datos ya procesados. Si queremos hacer big data de verdad, debemos armar la infraestructura del futuro.
7. ¿Por qué big data es importante para tu empresa?
En la edad de información resistir la toma de decisiones con datos es ponerse en una desventaja estratégica. El futuro de cualquier industria depende no de trabajar más, pero de trabajar más inteligentemente. Big data es el futuro porque es la puerta hacia una nueva forma de tomar decisiones. Por suerte, la mayoría de la infraestructura de big data se puede armar en la nube, evitando costos altos de inversión en comprar y gestionar servidores y permitiendo la portabilidad de los datos entre plataformas.
Conclusión
¿Será 2018 el año en que tu empresa tome ese paso hacia el mundo analítico? Si crees que es el caso, empecemos una conversación sobre cómo big data puede transformar tu negocio, tu empresa, y a ti también.