PORTAL DE MICRODATOS

¿Qué es?

El portal de microdatos es un portal donde se dispone la información estructurada que ha llegado a la Comisión de la Verdad; allí se organizan los conjuntos de datos (bases de datos o dataset) que han sido aportados por diferentes organizaciones del país (privadas, públicas y organizaciones sociales). Este portal ha sido implementado a través del software de código abierto CKAN, por tanto, puede ser considerado como un repositorio de datos abiertos. Toda la información contenida en el portal de microdatos es información estructurada; es decir, todo lo que se ha migrado al portal de microdatos es información estadística y/o bases de datos (anonimizadas -públicas- o sin anonimizar -privadas-) en función de diferentes temáticas. Las entidades que más información ha aportado son: Agencia Nacional de Tierras, Fiscalía General de la Nación, Unidad de Restitución de Tierras y la Unidad para las Víctimas.

¿Cuál es su historia?

El portal de microdatos surge como una apuesta para dejarle a la ciudadanía un repositorio robusto que centralice las bases de datos sobre violencia y violación de derechos humanos que existen en el país. Adicionalmente, el portal se construye con el fin de entregar una fuente de consulta que permita corroborar lo establecido en el Informe Final, documento que cita varias de las bases de datos resguardadas en el repositorio.

La escogencia de CKAN apunta a uno de los principios de la Comisión de la Verdad: utilizar herramientas de código abierto para reducir los costos de licenciamiento que un software propietario puede conllevar para este tipo de proyectos. Ahora bien, en un principio se usó la versión CKAN Andino, que es una mejora realizada por el gobierno de Argentina al software CKAN; no obstante, el tema de la seguridad y la carga de dataset de grandes tamaños se volvieron limitantes importantes dentro de esta versión, por lo que se optó por adaptar otra rama del CKAN para dar respuesta a estos y otros requerimientos puntuales de la Comisión de la Verdad.

La más utilizada, a pesar de todo, es CKAN, porque es una herramienta que no va a requerir un gasto grande en licencias. De hecho, la que teníamos antes de pasar a esta versión se llamaba CKAN Andino; fue, justamente, una modificación que hicieron en el gobierno de Argentina para el portal de datos del gobierno de Argentina... a lo que voy es a la importancia que tiene CKAN en el mundo, que es una de las herramientas más utilizadas para la publicación de datos; y sigue siendo la más utilizada... ya existen otras de pago, pero muy rara vez vas a encontrar una persona o empresa que adquiera una herramienta de pago para publicar datos...

Como repositorio que centraliza las bases de datos sobre violencia y violación de derechos humanos del país, CKAN es el primer catálogo de microdatos sobre el conflicto armado colombiano.

Last updated