image22

“La Ciencia de Datos es la combinación de personas, datos, herramientas y procesos para transformar, mediante algoritmos, datos en bruto en conocimiento nuevo; inteligencia que se puede utilizar para definir estrategias accionables y facilitar la toma de decisiones.”

BLOG DATALAB

Análisis de datos que genera inteligencia en su organización

Para sobrevivir y tener éxito en la era de Big Data, es importante tomar decisiones inteligentes...

 Decisiones inteligentes basadas en hechos. Para ello, los datos de una organización son la materia prima que nos permite entender comportamientos de mercado, de clientes, de zonas geográficas, de productos y servicios. Convertir los datos y la analítica en el centro de la Organización requiere una cultura de habilitación de datos que penetre todas y cada una de las capas de la empresa. Una cultura en la que los datos y la analítica informen e impulsen los objetivos estratégicos, la eficiencia y la innovación.


En DataLab ponemos a tu disposición las mejores herramientas en manos de expertos para analizar a fondo los Datos, e ir más allá de los mismos, obteniendo información inteligente y de utilidad con posibilidades tan infinitas como los números...

image23

El "Framework" de la Ciencia de Datos: Cómo funciona

Data Science

La ciencia de datos es un campo que comprende todo lo relacionado con la limpieza, preparación y análisis de datos. Para este último, utiliza una combinación de modelos estadísticos y programación para la resolución de problemas y análisis de datos de formas ingeniosas.

Raw Data

image24

 Raw data es el cúmulo de información que se origina por los distintos canales de una organización y a través de distintos medios (clientes, proveedores, almacenes, sucursales, redes sociales, operación de la organización, documentos, correo electrónico, imágenes, sonidos, llamadas telefónicas, transacciones, visitas a páginas de internet, etc.) datos estructurados o NO, esta información vive en 2 dimensiones “tiempo y espacio”, son datos que aún no han sido procesados para su uso, pero que tienen el potencial de convertirse en información al ser organizados y analizados.

Data Management

image25

 El proceso de Data Management es muy amplio y considera la normalización de la información para su utilización y explotación de manera estructurada. Durante este proceso se realiza la unificación de los datos en un repositorio único. Incluye el análisis de sistemas fuentes, generación de reglas de negocio, limpieza de datos y el soporte a la carga de datos. Finalmente, la migración de datos al DataLake para ponerlos a disposición del usuario final.

En DataLab 3.60 apoyamos a las organizaciones con los siguientes servicios:

  • Data Governance (Gobierno de Datos)
  • Data Quality Assurance
  • Migración de Datos
  • Enmascaramiento de Datos

Data Lake

image26

 Colección organizada de datos dividida en campos los cuales nos proporcionan datos detallados e individuales de un universo de datos. Un DataLake tiene una estructura lógica de manera de tabla compuesta por columnas y filas en donde el usuario final puede comenzar la explotación de los datos.

Analytics

image27

 El análisis de datos es una parte de la Ciencia de Datos que extrae, organiza y analiza grandes cantidades de datos en una forma aceptable y útil para obtener información y conocimiento nuevo. Para ello se vale del uso de cuadros y gráficos, así como, la implementación de algoritmos y técnicas estadísticas que ayudan a obtener conclusiones sobre la hipótesis planteada.

Machine Learning

image28

 Es una parte de la Ciencia de Datos que se refiere a algoritmos que pueden hacer predicciones a través del reconocimiento de patrones. Por medio de ellos, es posible crear modelos que nos sirvan para pronosticar tendencias futuras o predecir la variable en nuevos datos aprendiendo de la nueva información generada.

Business Intelligence

image29

La inteligencia de negocio es la habilidad para plantear las hipótesis de negocio adecuadas y aplicar los modelos estadísticos correctos para transformar los datos en conocimiento nuevo para la empresa, generando mayores ingresos (nuevos clientes/mercados) o menores costos (eficiencia operativa) y además ayuda a optimizar el proceso de toma de decisiones.

Evolución de la Ciencia de Datos

IR MÁS ALLA DE LA INFORMACIÓN Y LOS DATOS, AL CONOCIMIENTO

image30

Porque los datos tienen algo que decir

NUESTRA METODOLOGÍA

 

Todas las diferentes partes del proceso de Ciencia de Datos, desde la recolección y limpieza de datos hasta los modelos estadísticos finales, contribuyen a un mejor entendimiento de un caso en particular o pregunta específica que se quiera responder.

Arquitectura del DataLake

image31

  • Disponibilidad de la información
  • Dimensionalidad del DataLake:
  •     Desagregación de los datos
  •     Definir periodo de tiempo
  • Limpieza de datos
  • Definir nuevas variables 
  • Unión de bases de datos (DataLake)

Analítica Descriptiva

image32

  • Ratios
  • KPI’s
  • Tendencias y Estacionalidad
  • Comparaciones anuales
  • Cambios porcentuales

Analítica Perscriptiva

image33

  • Análisis de Regresión
  • Pareamiento / Clustering
  • Análisis de Series de Tiempo
  • Modelos Predictivos
  • Evaluación de Impacto
  • Modelos de ecuaciones estructuradas

Lo que hacemos: Convertir DATOS en RESPUESTAS

Algunas de las aplicaciones de la Ciencia de Datos que podemos desarrollar:

  • Estrategias de penetración de productos y servicios
  • Evaluación de impacto de programas regulatorios ó campañas de marketing
  • Evaluación de impacto de nuevos modelos de negocio
  • Análisis para determinar tendencias y estacionalidad de variables de negocio.
  • Mejorar la eficiencia operativa
  • Análisis de retención de clientes (Churn Prevention)
  • Desarrollar nuevos productos para clientes que tradicionalmente no generan valor
  • Análisis de la competencia en diferentes perspectivas
  • Descubrir patrones de compra y uso de productos
  • Venta cruzada en base a una segmentación dinámica de clientes
  • Evaluación de riesgo y prevención de fraudes
  • Calcular el valor de vida de un cliente para segmentar por alto y bajo valor

           entre otros

image34