Diferencias entre análisis descriptivo (big data) y análisis predictivo (IA)
La escalera de la inteligencia artificial, como se muestra en la Figura 1, se divide en 4 fases que permiten transformar los datos en conocimiento. Las dos primeras etapas (recolección y organización) se corresponden con la dimensión descriptiva de la información donde se pueden hacer analíticas.
Sin embargo, con el análisis descriptivo ya no se puede desarrollar la fase 3 (análisis) donde se responde a la pregunta ¿por qué ha ocurrido?, puesto que para ello se necesita modelar la relación entre variables, algo que solo es posible mediante el uso de aprendizaje automático.
Por último, la fase 4 (conocimiento) se corresponde con la dimensión predictiva (¿Qué va a ocurrir?) y prescriptiva (¿Qué puedo hacer para alcanzar el objetivo deseado?), y consiste en la aplicación de los modelos de inteligencia artificial para optimizar los procesos de una organización (club).
Análisis descriptivo:
- Pasado
- Descontextualizado
- Máxima incertidumbre
- Visualización
Análisis predictivo:
- Rendimiento futuro contextualizado
- Mínima incertidumbre
- Validación científica
Los modelos de inteligencia artificial utilizados en Olocip se validan científicamente utilizando procedimientos estándar en aprendizaje automático.
Para ello, los datos se separan en sets de entrenamiento, desarrollo y test (Figura 4). Se aprenden los modelos candidatos a partir de los datos de entrenamiento, se selecciona el mejor candidato de acuerdo a los datos de desarrollo y se evalúa su capacidad de generalizar sobre los datos de test.
En la imagen adjunta (Figura 5) se puede ver la diferencia entre la información pasada (big data) y la predictiva contextualizada (IA). Son ejemplos reales de esta temporada 2019/2020 extraídos de nuestro modelo predictivo desarrollado con machine learning con una reducción del error cuadrático medio respecto al enfoque descriptivo en un 48% en los datos de test.
Por lo tanto, si la pregunta es: ¿cómo rendirá un jugador si lo fichamos?, y miramos al pasado, la información que tendremos será deficiente. Además, comparar el rendimiento de jugadores en contextos diferentes es inútil. Es básico contextualizar antes de comparar y solo la inteligencia artificial es capaz de hacerlo.
Es importante asegurarse de que se responde a la pregunta que nos hacemos y no a otra. No todo lo que se muestra como inteligencia artificial lo es. Para asegurarse, es necesario pedir referencias y validaciones científicas. La predicción de rendimiento se puede y se debe hacer si se quiere tener una ventaja competitiva.
Más información en info@olocip.com