La organización Internet Archive está creando una base de datos formada por dibujos y fotos históricos libres de derechos, que estarán disponibles a través de Flickr, la web de intercambio de imágenes.
Según informó BBC News, las imágenes proceden de 600 millones de páginas de libros que han sido escaneadas y podrán ser utilizadas gratuitamente.
Se trata de fotos y dibujos que corresponden a publicaciones de 1500 a 1922, cuando aún no existían los derechos de autor. Muchos de estos documentos sólo están disponibles a través de libros, ya que se trata de trabajos cuyos originales se perdieron hace mucho tiempo.
Son un total de 2.6 millones de fotografías históricas las que ya se han descargado y se espera finalizar la base con 12 millones. El académico estadounidense Kalev Leetaru fue el encargado de colgar las fotografías al servicio de Yahoo!, la empresa dueña de Flickr.
“Por todos estos años las bibliotecas fueron digitalizando los libros pero los colgaron como PDFs”, comentó a la BBC.
Para poder identificar y analizar cada página que fue digitalizada, desde Internet Archive utilizaron un software de reconocimiento óptico de caracteres.
Como parte de este proceso, el programa reconocía qué partes eran imágenes y cuáles, texto. A partir de estos datos, Leetaru guardó cada parte que el sistema ignoró como texto como un archivo .JPEG separado.
De hecho, según sostuvo Leetaru, la mayoría de las imágenes que subió no se encuentran en las galerías de arte de ninguna parte del mundo, ya que las copias originales desaparecieron “tiempo atrás”.