La tecnología avanza a pasos agigantados en todos y cada uno de los aspectos de nuestra vida cotidiana; y, por supuesto, también en el de almacenamiento de datos en forma digital. El volumen de datos que manejan a día de hoy las empresas, poco o nada que ver tiene que ver con el de hace apenas cinco o diez años. Actualmente, las bases de datos son gigantes, con miles de millones de gigas de datos entre los cuales se encuentra información realmente valiosa para que las compañías puedan tomar las mejores decisiones.
Esta necesidad por parte de las empresas de extraer la información de grandes masas de datos ha despertado un gran interés por llevar a cabo técnicas tanto estadísticas como de inteligencia artificial. Todas las disciplinas que persiguen, desde distintos puntos de vista, estos objetivos, se engloban en lo que podemos denominar “Data Mining” o “Aprendizaje estadístico”.
Aprendizaje Estadístico
¿Qué es?
Se conocen como tal al conjunto de métodos estadísticos que van desde simples cálculos de modas y medianas hasta la construcción de modelos de inferencia complejos. De esta manera, para construir el sistema de aprendizaje estadístico, la primera fase es acceder a un conjunto de datos para, a continuación, generar un modelo con capacidad para generalizar y que, de esta manera, se puedan predecir nuevos fenómenos en relación al mismo.
El aprendizaje estadístico es una de las disciplinas más complejas debido a la dificultad de construir los sistemas por principalmente dos factores. Por un lado, el elevado número de variables de las que se dispone; además, en la mayoría de las ocasiones se trata de variables cualitativas, las cuales son difíciles de cuantificar. Y por otro lado, las muestras suelen ser escasas, estar dispersas y, además, no son 100% exactas.
¿Dónde se aplica?
Su aplicación en diferentes ramas avanza de manera exponencial: Informática, ingeniería, neurobiología, psicología, física… Actualmente, es una de las áreas de investigación más activas. Los avances desarrollados hasta el día de hoy han permitido que sea posible aprender prácticamente cualquier modelo para el que se posible aplicar la inferencia exacta.
Data Mining
¿Qué es?
El Data Mining, también conocido como “Minería de Datos” es un conjunto de técnicas destinadas a explorar bases de datos con miles de millones de datos, bien de manera automática o semiautomática. El principal objetivo que persigue esta disciplina no es otro que el de encontrar tendencias que expliquen el comportamiento de dichos datos en un determinados contextos; para ello se vale de métodos estadísticos.
Para entenderlo, en reglas generales, los datos son la materia prima con la que trabajan los profesionales del Data Mining. Una vez éstos se encargan de darles un significado especial se convierten en información. Y, por último, cuando, a través de las diferentes técnicas que se aplican en la Minería de Datos, los expertos construyen un modelo predictivo, entonces es cuando nos referimos a conocimiento.