Portal Función Pública
Gestión del Conocimiento
Metodología
Recoger
En esta parte del proceso se recolectan los datos, ya sea por medio de registros administrativos manuales o por sistemas de información que sean utilizados para hacer la gestión de los procesos misionales. Es importante contar con sistemas que permitan la recolección de información de forma estructurada, consistente, oportuna y confiable.
Limpiar
Luego, los datos recogidos deben ser depurados, en este paso se descarta toda la información inconsistente, como aquella que tiene valores extremos o errores que puedan haberse generado en la toma de los registros. Entre mejor definidos estén los procesos de registro de información, se tendrán menos errores.
Validar
La validación de los datos consiste en tomar valores aleatorios y probar a través de métodos estadísticos que la información allí registrada refleje la realidad de la operación, de no ser así, debe hacerse otra vez el proceso de limpieza de los registros hasta que el error esté en niveles mínimos.
Analizar / Visualizar
Al tener la información validada, se procede a plantear preguntas sobre las cuales se pueda inferir respuestas con base en esta información. Este proceso comienza inicialmente por medio de visualizaciones, a través de aplicaciones mencionadas en otros apartados de este sitio web, que permiten inferir relaciones entre variables, comportamientos históricos, tendencias, entre otros.
Inferir / Visualizar
Posteriormente se procede a utilizar modelos matemáticos que permitan inferir o plantear respuestas hipotéticas a las preguntas planteadas. Unos de los más conocidos en materia técnica son los modelos econométricos (inferencia estadística). Sin embargo, existen otros tipos de modelos que usan los datos como materia prima, ejemplo de estos son los modelos de simulación de agentes o simulación de eventos discretos. Estos procesos de inferencia ayudan a entender comportamientos en las entidades y aportan información útil para la toma de decisiones.
Luego de hacer los análisis, estos deben ser validados a través de pruebas estadísticas o de sensibilidad, dependiendo de la aproximación utilizada. Esto permite darles mayor confiabilidad a los resultados obtenidos de los modelos.
Existen una gran cantidad de herramientas en el mercado para analizar datos, a continuación, clasificamos algunas de ellas:
- Un paquete estadístico: es un programa que se utiliza para hacer modelos matemáticos con datos basados en estadística. Estos sirven para efectuar aproximaciones técnicas ampliamente aceptadas en distintas disciplinas como: Medicina, economía, sociología, entre otros, hay paquetes gratuitos y otros paquetes que tienen costo.
- Catálogos de visualización de datos: es una página de internet donde se catalogan una gran cantidad de herramientas para visualizar datos de distintas maneras.
- Paquetes de modelamiento matemático: son programas que permiten plantear, a través de la programación de código, modelos matemáticos genéricos, no sólo estadísticos, para simular a través de diferentes aproximaciones toda serie de fenómenos aptos de serlo.
Estos son algunos paquetes de visualización de datos y analítica que hay en el mercado.
Visualización de datos
Paquetes estadísticos
Modelamiento matemático