Podemos definir Data Science como la disciplina que estudia la extracción de información a partir de un conjunto de datos estructurados, semiestructurados y/o desestructurados. Se basa en la obtención de información de gran valor y se está haciendo cada vez más popular en el ámbito empresarial debido a la necesidad de trabajar con conjuntos cada vez mayores de datos generados por la red y los dispositivos electrónicos.
Hay que tener en cuenta los datos son, como afirman muchos expertos, el petróleo del Siglo XXI; analizarlos en profundidad y extraer de ellos información con la que tomar decisiones racionales en el corto y largo plazo es el gran reto al que se enfrentan cada vez un mayor número de empresas. Si bien es cierto que la gestión de grandes volúmenes de datos no es un concepto nuevo, lo que sí ha dado un giro radical en los últimos años es la cantidad y la velocidad con la que éstos se generan; por lo tanto, la Ciencia de Datos se hace imprescindible para analizarlos.
Para hacernos una idea del volumen de datos que se genera actualmente, se estima que en torno al 90% de los datos que se manejan actualmente han sido creados en los dos últimos años.
5 Características que definen el Data Science
- Trabaja en la mayoría de las ocasiones con datos desestructurados
- Los datos que llegan desde distintas fuentes es habitual que estén incompletos
- Analiza los datos con el objetivo de obtener información y conocimiento
- La Ciencia de Datos permite tomar decisiones sobre procesos empresariales externos e internos
- Trabaja con cantidades masivas de datos cuya gestión y análisis suponen un gran desafío
¿Para qué sirve la Ciencia de Datos?
El Data Science permite a las compañías analizar un volumen masivo de datos que llegan desde distintas fuentes, con el objetivo de convertirlos en información organizada y jerarquizada. Una vez se le da un sentido la información en el proceso de toma de decisiones estratégicas, esta se convierte en conocimiento.
Por lo tanto, la persona encargada de la Ciencia de Datos debe estar especializada en un amplio abanico de disciplinas tales como programación, estadística, análisis y matemáticas. Éste tipo de profesionales son cada vez más demandados por las empresas; compañías de la talla de BBVA o General Electric han creado en los últimos años nuevos puestos como el de chief data officer.
¿Hacia dónde va el Data Science?
Actualmente, la Ciencia de Datos se enfrenta a varios retos que debe poder superar en los próximos años. En primer lugar, el Data Science debe ser capaz de analizar, gestionar e interpretar los resultados de un problema específico, así como saber explicarlos con el objetivo de aportar una visión objetiva de todos los procesos de una determinada empresa. En segundo lugar, debe sentar las bases a fin de establecer unos criterios rigurosos acerca de cómo extraer valor de los datos obtenidos. Y, por último, la Ciencia de Datos debe alcanzar una simbiosis óptima con el Cloud Computing.