Requerimientos

Limitaciones y alcances

Existen bases de datos muy pesadas. Por ejemplo, el Registro Único de Víctimas cuenta con aproximadamente 9 millones de registros, y eso dificulta abrir el archivo; para solucionar la limitación, el procedimiento que se sigue es dividir la información entre las diferentes hojas de Excel, con el fin de que cualquier persona la pueda consultar y utilizar el recurso desde este formato; de lo contrario, son bases de datos que deben ser descargadas en formatos TXT o CSV. Para el caso específico de la Comisión de la Verdad, las bases de datos que cuentan este proceso son: RUV, SPOA y Sistema de Información de Justicia y Paz de la Fiscalía.

La visualización de los datos en el portal de microdatos depende 100% de cuántos registros tenga el archivo. No es posible visualizar, dentro del portal, una base de datos con un número significativo de registros.

Lo que se realiza para suplir estas limitantes es definir unas tablas dinámicas que permiten interpretar la base de datos de manera más sencilla; no obstante, este ejercicio depende del proceso de investigación y de la base de datos. En otras palabras, es un proceso que se hace solo cuando es solicitado desde los equipos de investigación, ya que implica alterar las tablas originales (se quitan datos o se hace un proceso de depuración); en este sentido, dentro de los dataset no se encuentran tablas dinámicas, ya que es un alternativa para el ejercicio de investigación y no un recurso del dataset.

Las bases de datos que tienen el campo geoespacial, se disponen en el geoportal de la Comisión de la Verdad (ver documentación de geoportal).

Recomendaciones para la interacción con el código fuente CKAN

La documentación de CKAN es poca y sencilla, lo que dificulta articularse con el código. Según el equipo de ingenieros, la documentación no habla de la estructura del código, sino de algunas capas: el núcleo donde se hacen las consultas, la capa donde se procesan los datos y finalmente la interfaz donde se visualizan.

Por lo general las herramientas de software libre no entregan una gran documentación del código. Esto implica un trabajo adicional para el ingeniero desarrollador, el cual tiene que hacer un estudio de ese código que puede demandarle una importante inversión de tiempo.

Last updated