Podemos definir Data Science como la disciplina que estudia la extracción de información a partir de un conjunto de datos estructurados, semiestructurados y/o desestructurados. Se basa en la obtención de información de gran valor y se está haciendo cada vez más popular en el ámbito empresarial debido a la necesidad de trabajar con conjuntos cada […]
Data Science
Podemos definir Data Science como la ciencia que estudia la obtención de conocimiento a partir de un conjunto de datos. Se conoce como tal al procedimiento mediante el cual se obtiene información valiosa de dichos datos, los cuales pueden ser estructurados, semiestructurados o desestructurados; y que proceden de los dispositivos electrónicos y las plataformas web.
El experto en la Ciencia de Datos es por tanto un profesional capaz de resolver un amplio abanico de problemas complejos en distintos ámbitos utilizando para ello el análisis de datos con la ayuda de distintas herramientas estadísticas e informáticas.
Todavía son muchas las personas que no distinguen a un Analista de Datos con un Data Scientist; pero lo cierto es que son dos profesiones bien diferentes. Mientras que el primero únicamente analiza los datos que provienen de una única fuente, el segundo debe estudiar los datos de múltiples fuentes desde diferentes puntos de vista con el objetivo de encontrar patrones previamente ocultos; en la mayoría de los casos estas referencias están incompletas y desordenadas. Por lo tanto, el Data Scientists es la evolución del Analista de Datos.
Inicios de la Ciencia de Datos
La primera vez que se utilizó el término “Data Science” fue en la década de los 70 de la mano de Peter Naur, quien lo utilizó para referirse al procedimiento de proceso de datos. El científico publicó el libro “Concise Survey of Computer Methods”, en el que explicó ampliamente este concepto.
En 1993, Peter Drucker, en su libro “La Sociedad Postcapitalista” advertía de que el conocimiento se colocaría en el centro de la producción de la riqueza. Además, hizo especial hincapié en que lo realmente importante no era la cantidad de conocimiento, sino la productividad que las empresas fuesen capaces de generar en función de la misma. En definitiva, lo que Drucker predecía a principios de los 90 es que la información se convertiría muy pronto en un recurso básico.
No obstante, no fue hasta el año 2008 cuando se hizo uso de la Data Science; lo hicieron Jeff Hammerbacher y DJ Patil para definir sus trabajos realizados en Facebook y Linkedin.
Data Science, un valor fundamental en las empresas
Algunos de los mayores problemas a los que se enfrentan las empresas actualmente están relacionados con que muchas de ellas no saben utilizar los datos, tanto internos como externos, de una manera efectiva. De esta manera, están perdiendo oportunidades y desaprovechando fortalezas: Nuevas tendencias en el sector, nuevas necesidades en el mercado… La Ciencia de Datos se encarga de recopilar toda la información para, posteriormente, transformarla en un mensaje entendible que ayude a las compañías a alcanzar sus objetivos.
El proceso de Data Science se divide en cuatro pasos:
-
Mining Data: Recopilación y formateado de los datos disponibles.
-
Statistics: Análisis de la información.
-
Interpret: Visualización de los datos en imágenes y gráficos.
-
Leverage: Aplicación de los datos.