Aunque la definición general de dato se refiere a una información concreta sobre algo o alguien, generalmente en informática el dato tiene un significado ligeramente distinto.
Los datos son una palabra de esas que se emplean tan a menudo, que pocas veces nos paramos a mirar su significado, puesto que se da por sentado. Cuando damos un dato, estamos aportando una información concreta sobre algún asunto. No vamos a entrar en peliagudas definiciones, sin embargo, pues no es este el sitio para ello. Baste saber que en informática esta definición común continúa siendo bastante correcta, si bien con algunas puntualizaciones.
Cuando hablamos de datos para un ordenador, estos pueden ser muy variados: desde un bit, pasando por una palabra, hasta conjuntos realmente grandes. Es la unidad mínima de información, aunque, de hecho, un dato por si mismo no tiene ningún significado, sino que debe ser interpretado por un programa informático para darle sentido. Los datos son introducidos generalmente por un agente externo al ordenador, y será este quien los procese para luego dar una información al usuario final. En general los datos deben ser introducidos siguiendo una estructura determinada, en lo que se llama estructura de datos, para que el ordenador pueda procesarlos de manera adecuada.
Dada su complejidad, existen muchos tipos de datos. Entre ellos, podemos destacar por su importancia, varios:
- Binarios: son datos que solo pueden tener dos respuestas posibles (ej: si/no, 1/0). Son el lenguaje básico de los ordenadores, que trabajan con grandes cadenas lineales de datos, y de ahí su importancia.
- Numéricos: como su nombre indica, son datos formados por números. Un caso especial son los caracteres alfanuméricos, que siguen siendo números, pero en vez de emplear el código decimal usan el código hexadecimal para ser representados.
- Metadatos: son datos que permiten describir a otros datos. Se emplean mucho en páginas web y en buscadores.
- Caracteres: compuestos por letras
- Estadísticos: son datos (en general números), que pueden ser comparados entre ellos con diferentes algoritmos con el fin de analizar los resultados y llegar a conclusiones.
El conjunto de los datos reunidos se denomina base de datos. Las bases de datos son grandes cantidades de datos organizados según su tipo, y guardados para ser empleados cuando se desee, a modo de archivo. Una vez procesados, los datos dan la información correspondiente.
Gracias a la informática, hoy en día se pueden gestionar enormes bases de datos con muchísima información de manera simple y rápida. En la actualidad esas bases de datos estáticas están siendo substituidas por bases de datos dinámicas, que cambian y se actualizan constantemente y en tiempo real. Estos avances han permitido el desarrollo de las archiconocidas redes sociales, por ejemplo, pero también el desarrollo de otras disciplinas como la estadística, las matemáticas, la propia informática…
De hecho el principal problema que existe hoy en día en la red es como manejar y gestionar la llamada big data, las megabases de datos, evitando la generación de miles de millones de datos basura.
Pingback: Estadística básica | Blog de Big Data
Pingback: Empresas de Big Data en España | Blog de Big Data