Las técnicas de análisis estadístico se desarrollan con la finalidad de identificar, cuantificar y explicar los efectos sistemáticos que algunos factores tienen sobre el comportamiento de un determinado fenómeno. Esta finalidad es diferente a la de las técnicas de Inteligencia Artificial y Aprendizaje Computerizado, en las que se prima la clasificación / estimación / predicción de determinados fenómenos sin que sea muy importante la explicación de cómo se llega a tal clasificación / estimación / predicción.
En cualquier caso, una vez que se obtiene una explicación de las relaciones entre un conjunto de variables a través de las técnicas estadísticas, tal explicación puede emplearse para clasificar y/o predecir el fenómeno objeto de estudio. De ahí que haya una cierta sustituibilidad entre los métodos estadísticos clásicos y la I.A. a la hora de predecir o clasificar. A pesar de esta sustituibilidad, conviene no confundir la Estadística con la Inteligencia Artificial. La correcta comprensión de los objetivos, alcance y métodos estadísticos es un ingrediente fundamental de la Ciencia de Datos.
Nuestras píldoras estadísticas, como su nombre indica, están orientadas a explicar e ilustrar los principales conceptos de la metodología estadística. Comencemos aquí con uno fundamental: la forma en como medimos/observamos condiciona las conclusiones que podemos extraer de los datos.
Esta idea es familiar a cualquiera que se inicia en los estudios de lógica y se ilustra perfectamente a través del siguiente acertijo: nos dan una balanza con sus dos platillos equilibrados y 7 lingotes de oro. Sabemos que uno de los lingotes es falso y que pesa menos que los restantes, cuyo peso es exactamente el mismo. Podemos usar la balanza solamente dos veces. El misterio a resolver es hallar un procedimiento/método que nos permita, bajo las condiciones enunciadas, determinar cuál es el lingote falso.
No vamos a dar aquí la respuesta, sólo asegurar que tiene solución, pero sí vamos a advertir que será imposible encontrarla sin entender cómo funciona la balanza de platillos.
Pues bien, en la estadística sucede algo análogo: lo primero que se hace al realizar un estudio es observar, pero para decidir cómo y para qué observar hay que entender primero los métodos de análisis estadístico. Esto resulta paradójico, pues impone la necesidad de dejar el estudio de los llamados métodos de diseño de experimentos para las etapas finales del aprendizaje, de forma que su conocimiento e importancia son frecuentemente subestimadas.
Lo anterior no quiere decir que los métodos estadísticos no sean de aplicación a datos retrospectivos o donde la observación no respondió al objeto de análisis en consideración. Por supuesto que también son susceptibles de análisis estadístico, pero limitando el alcance de las conclusiones.
Por su parte los métodos de I.A. y aprendizaje computerizado actuales, están relacionados con los grandes volúmenes de datos resultantes de la transformación digital, siendo en su mayoría datos retrospectivos, sin que ello tampoco excluya algún diseño de experimentos con el objetivo de aislar los fenómenos que se pretenden cuantificar.