Crowdsourcing para proyectos culturales

El año pasado tuve la ocasión de participar en un proyecto para recuperar la memoria del circo a través de la colaboración ciudadana mediante una herramienta de crowdsourcing. Este proyecto (lamemoriadelcirco.es) me permitió conocer de cerca la potencialidad que tiene el crowdsourcing en el ámbito cultural. Para lamemoriadelcirco.es utilizamos Pybossa de Scifabric, una de las herramientas más sólidas de crowdsourcing tanto por su usabilidad como por la estadística que garantiza la validez de los datos obtenidos. Pero, vayamos por orden.

¿Qué es el crowdsourcing?

Cito a wikipedia:

(…) siendo Jeff Howe el primero en (…)  acuñar el término. Este autor lo definió como

“Externalización, por parte de una empresa o institución, de una función realizada por un empleado, a un grupo indefinido (y normalmente grande) de personas, mediante una convocatoria abierta. Esta externalización puede tomar la forma de una producción-de-iguales (peer-production) cuando el trabajo se realiza de forma colaborativa, pero también puede llevarse a cabo de forma individual”.

Es decir: muchas personas resolviendo las mismas tareas. La filosofía que hay detrás es que muchas personas resolviendo la misma tarea pueden obtener los mismos resultados que un experto haciendo esa misma tarea (maravillas de la estadística). Para obtener unos resultados fiables eso, la estadística que hay por detrás de la herramienta que usemos para hacer crowdsourcing, es una de las cosas más importantes: queremos obtener datos lo más fiables posibles. El crowdsourcing se suele utilizar cuando tenemos un gran volumen de tareas por resolver.

Hay diversas herramientas para hacer crowdsourcing, algunas de pago, otras de software libre. Cada una tiene sus ventajas pero como la que más conozco y uso es Pybossa, y es la pionera en proyectos vinculados a la cultura, será esa en la que me centre. Pybossa es open source y la empresa que la ha desarrollado, Scifabric, ofrece servicios para crear los proyectos, instalarlos en el servidor e implementar el análisis estadístico de los datos que garantiza resultados científicamente válidos.

Pybossa ha sido utilizada en proyectos científicos (como este sobre antimateria o este otro que investiga sobre la contaminación lumínica desde el espacio) y proyectos vinculados al ámbito de la salud (como este de células cancerígenas o este para combatir la malaria). Han hecho también proyectos vinculados al periodismo, sociales (como este para Greenpeace España)… Pero una de las grandes innovaciones que ha introducido Scifabric es utilizar el crowdsourcing para proyectos del ámbito cultural: bibliotecas, archivos, galerías y museos. Y es en esto donde me voy a entretener un poco más.

Imaginemos una gran biblioteca nacional. O un gran archivo histórico nacional (en España tenemos 7 que son de los mayores de Europa porque no sufrieron la Segunda Guerra Mundial y el tamaño que ocupa la información que en ellos hay es sobrecogedor). O el sótano de un museo. ¿Qué se nos viene a la cabeza? Cajas y cajas de papeles, de documentos, de fotos… Aunque mucho del material se haya digitalizado ya, nos encontramos aún dos problemas: quedan kilómetros y kilómetros de archivos por digitalizar, es una misión imposible en el corto-medio plazo, y parte de lo que ya se digitalizó está en formatos solo legibles/procesables por el ojo humano (por ejemplo, esos documentos de texto que por alguna razón están en formato imagen y no se pueden hacer cosas tan elementales como buscar palabras… ). Así que nos encontramos que parte de la memoria de la humanidad está en cajas a las que no podemos acceder. Y ese conocimiento, que nos pertenece, se pierde.

Pero si todas esas cajas se escanean o esas imágenes que están solo escaneadas se pusiesen en una plataforma digital y le pidiésemos a la comunidad que nos ayudara a saber qué hay en los documentos (que transcriba, que describa, que geolocalice, que marque minutos de inicio y de fin, que clasifique, que identifique…) proponiéndoles resolver tareas con campos cerrados e instrucciones precisas (con un tutorial inicial si es necesario), y si además toda esa base de datos que se genera por el trabajo de la comunidad pasa por un tratamiento de datos que asegure validez científica, podríamos obtener, en poco tiempo, el conocimiento que hasta ese momento se perdía en el olvido. Eso es el crowdsourcing. Y es así cómo Scifabric ha implementado Pybossa en las industrias creativas y culturales. Por supuesto, esto no busca en ningún momento quitar puestos de trabajo. Por planificación y estrategia hay mucha información que ni siquiera entra en la fila de “cosas a digitalizar” porque no es prioritaria. O porque sí lo es, pero hay otras cosas aún más prioritarias. Y por supuesto los expertos y expertas son los que tienen el conocimiento específico para resolver tareas de gran complejidad. Pero el crowdsourcing en estos casos está a medio camino entre no saber lo que hay en las cajas y la excelencia del trabajo hecho por expertos (medio camino más cerca de la excelencia que del desconocimiento, btw).

Todo se entiende mejor con ejemplos.

En el British Museum tenían un problema: la edad de bronce. Estaban todas las fichas de las excavaciones en cajas y aunque se digitalizasen, no iba a servir de casi nada: eran 100 años de fichas de excavaciones en los que cada arqueólogo había anotado de una forma y con una herramienta distinta (lápiz, pluma, boli). A veces una ficha podía tener anotaciones en varias direcciones de texto. Y tachones. Y borrones. Y, además, dibujos. Y, además también, coordenadas. Todavía no le podemos pedir tanto a las IA: esas fichas necesitaban ayuda humana.

Se montó un proyecto en Pybossa donde se colgaron todas estas fichas arqueológicas. Y se le pidió a la comunidad (aficionados a la arqueología, familiares de los antiguos arqueólogos que habían estado en las excavaciones, amigos del Museo) su colaboración para ‘desencriptar’ aquellas fichas escaneadas (no digitalizadas). Los voluntarios y voluntarias tenían que hacer tres tipos de tareas: transcribir las fichas, meter la geologalización y repasar con el ratón el dibujo de la pieza encontrada que aparecía en la ficha arqueológica. Cada ficha le sale a muchos voluntarios, para que la estadística, por detrás, pueda hacer su trabajo de corregir errores. El fruto de este proyecto se convirtió en una enorme base de datos relacionada con la edad de bronce que permitió, además, completar los conocimientos que se tenían de diversos arqueólogos, que permitió crear un mapa correctamente geologalizado de las excavaciones y, además, una base de datos de imágenes en 3D de las piezas halladas (y hábilmente repasadas con el ratón por los voluntarios) disponibles para descarga gratuita y para que podamos imprimir en casa, si queremos, una mini hacha de la edad de bronce, por ejemplo. Toda la información sobre este proyecto en este enlace. El éxito de ese primer proyecto ha transformado la plataforma de crowdsourcing del British Museum en algo más grande, con más épocas y más tareas que realizar. Puedes visitarla (y contribuir) aquí: Micropasts. 

Otra tarea gigantesca que llevaría años hacer solo con el personal del centro es la geologalización de los archivos del cine grabado en Gran Bretaña. Pero nada es imposible si se hace entre todos, y ese es el objetivo de esta proyecto basado en la tecnología de crowdsourcing liderado por el British Film Institute. Esta es la plataforma contribute.bfi.org.uk y aquí hay un vídeo explicativo:

El objetivo en este proyecto es delimitar temporalmente los distintos escenarios donde se grabaron las películas y añadir los datos de geologalización. De forma que al colocar el ratón por el mapa de Gran Bretaña se vayan abriendo ventanas con las escenas grabadas justo en esa zona. Una de las ventajas de Pybossa frente a otras plataformas es que los datos obtenidos se van visualizando en tiempo real, así que no hay que esperar a que haya el 100% de las contribuciones necesarias para que los datos sean “correctos” para visualizarlos (eso sí, los datos que se visualizan van mejorando a medida que los voluntarios y voluntarias van contribuyendo).

La Memoria del Circo

El proyecto “La Memoria del Circo” nace del entusiasmo de de María Folguera, directora Artística del Teatro Circo Price, que ha contagiado a distintas personas e instituciones, como a Belén Palacios y el resto del equipo de la BNE (que presentó los fondos documentales sobre William Parish) y a mí misma. La historia del Teatro Circo Price es preciosa y trágica y la ciudad de Madrid la ignora y vive de espaldas a una institución de la que deberíamos sentirnos orgullosos y orgullosas. Uno de los objetivos de la dirección artística de María Folguera es recuperar esa historia y ponerla a disposición de la ciudadanía. Y para contar la historia, hay que preguntar a los que la vivieron, a aquellos a los que se la contaron, buscar en hemerotecas, archivos, colecciones públicas y privadas, estandarizar esa información, digitalizarla y ponerla a disposición de investigadores y de historiadores para que puedan reconstruirla y contárnosla sin perder ni un detalle. Pero recuperar toda esa información y digitalizarla es lento (ya hablé más arriba de que quedan cantidades ingentes de archivos por digitalizar) y hay que buscar alternativas. En esa fase entramos desde Factoría con una propuesta: vamos a pedirle a la ciudadanía que nos ayude en esta tarea. Vamos a crear una plataforma de crowdsourcing donde se irán publicando los materiales que se vayan digitalizando y le vamos a pedir a los voluntarios y voluntarias que describan, clasifiquen, enumeren, transcriban o etiqueten las imágenes o los documentos que hay en esa plataforma. Cuando se trabaja con archivos o bibliotecas estatales surge una cuestión particular: la normativa para clasificar archivos es estricta (y debe serlo) y muy técnica y una persona sin formación en este campo no va a poder hacer la tarea con el mismo nivel de excelencia que un experto o experta. Aunque la estadística detrás de Pybossa corrige errores permitiendo obtener datos confirmados con un porcentaje muy alto de acierto, decidimos llegar a un acuerdo de mínimos y se definió a tres bandas (Price, BNE y Factoría + Scifabric) los campos que deberían rellenar los voluntarios y voluntarias, que permitirían hacer una clasificación válida para las entidades no estatales y una primera aproximación para la BNE. Lamemoriadelcirco.es nació en 2018 con un archivo de fotografías donadas al Teatro Circo Price de la última función en su anterior enclave en la Plaza del Rey. El proyecto irá creciendo con la aportación de los fondos documentales de las entidades e instituciones implicadas y también se habilitará la posibilidad de que usuarios particulares suban material propio que permita reconstruir la historia esta arte escénica. En el caso del Circo, la memoria está en las familias de tradición circense: en la memoria de las personas o en archivos y colecciones particulares. Uno de los grandes retos de este proyecto es involucrar a las familias en la recuperación de la memoria: con sus recuerdos, sus conocimientos y también con sus archivos.

En este vídeo, Daniel Lombraña, de SCIFABRIC y yo misma presentamos el proyecto en el Teatro Circo Price.

Hacer partícipe a la ciudadanía de la responsabilidad de ser garantes de la memoria de la humanidad es uno de los usos más particulares que se puede hacer con el crowdsourcing. Y es que siempre hay maneras de incorporar las tecnologías emergentes a los lugares más dispares.

Daniel Lombraña y Henar León
Daniel Lombraña y Henar León
Anuncios

Un comentario en “Crowdsourcing para proyectos culturales

Los comentarios están cerrados.