El Proyecto Gutenberg (en inglés Project Gutenberg , también conocido por las siglas PG ) es una iniciativa puesta en marcha por el científico informático Michael Hart en 1971 [1] con el objetivo de establecer una biblioteca de versiones electrónicas de libros impresos libremente reproducibles , hoy llamada e -libros . El proyecto Gutenberg es la iniciativa más antigua de la industria. Los textos disponibles en esta biblioteca gratuita son en su mayor parte de dominio público , o como nunca están cubiertos por derechos de autor o derechos de autor., o cuando estas restricciones hayan caducado según la ley de EE. UU. (es decir, 95 años después de la publicación). Algunos textos protegidos por derechos de autor también están disponibles pero han obtenido el permiso de los autores para la nueva forma de publicación. El proyecto lleva el nombre del pionero alemán de la imprenta de tipos móviles del siglo XV, Johannes Gutenberg . En los últimos años, el Proyecto ha podido hacer uso de Internet y continúa creciendo, en marzo de 2020 contaba con más de 60.000 libros electrónicos en su colección, en comparación con los 40.000 en 2012 [2] .
El proyecto Gutenberg solo está parcialmente disponible en Alemania.
El Proyecto Gutenberg se centra principalmente en las obras literarias y de referencia históricamente más significativas e importantes. El lema del proyecto es “romper las barreras de la ignorancia y el analfabetismo ”; Su elección quiere mostrar que el proyecto pretende continuar con la labor de difusión pública de la alfabetización y de puesta en valor del patrimonio literario que las bibliotecas públicas realizaron en la primera parte del siglo XX y continúan realizando en la actualidad. Siempre que sea posible, Gutenberg pone a disposición los textos en formato de texto ASCII sin formato (sin formato) . Los textos en otros formatos también están disponibles cuando son propuestos por voluntarios.
Durante años se ha debatido sobre el uso de algún tipo de lenguaje XML , pero el progreso es lento en esta dirección. Los formatos propietarios que no son fáciles de editar, como PDF , generalmente no se consideran en total armonía con los objetivos del Proyecto Gutenberg, incluso si algunos de estos archivos se han incluido en la colección.
La mayoría de los textos publicados por el Proyecto Gutenberg están en inglés, pero ahora hay subcolecciones significativas en alemán , francés , italiano , español , holandés , finlandés y chino ; pocos otros se refieren a otros idiomas. Todos los textos del Proyecto Gutenberg se pueden obtener y redistribuir de forma gratuita: la única restricción es que el texto permanezca inalterado y que incluya el encabezado del Proyecto Gutenberg; cuando se redistribuye el texto editado , no debe etiquetarse como texto de Gutenberg.
El proyecto sigue activo y el trabajo de publicación lo realizan casi en su totalidad voluntarios. Cualquiera puede convertirse en corrector firmando el sitio web Distributed Proofreaders ; la actividad voluntaria se lleva a cabo examinando una página a la vez.
En 1971 , Michael Hart asistía a la Universidad de Illinois . Hart tuvo acceso a un mainframe Xerox Sigma V , en el laboratorio de Investigación de Materiales, gracias a su amistad con algunos operadores. Se le asignó un usuario con tiempo de uso de CPU virtualmente ilimitado ; de este usuario, se ha estimado, el poder de cómputo fue explotado por un valor variable entre 100.000 y 100.000.000 euros [3] Hart nunca habría podido usar tanto poder de cómputo, por lo que quería "pagar" por este regalo, y pensó en algo que podría valer tanto.
Dio la casualidad de que esa computadora en particular era uno de los 15 nodos de red que luego se convirtieron en Internet . Hart creía que algún día las computadoras serían accesibles para el público en general y decidió hacer que las obras literarias estuvieran disponibles en formato electrónico. En ese momento tenía una copia de la Declaración de Independencia de los Estados Unidos en su mochila, que se convirtió en el primer libro electrónico del Proyecto Gutenberg .
Cuando la Universidad de Illinois dejó de albergar el Proyecto Gutenberg a mediados de la década de 1990 , Hart lo trasladó a Benedictine College en Illinois. Más tarde consiguió un trato similar con la Universidad Carnegie Mellon , que accedió a gestionar los aspectos financieros del proyecto. Faltará hasta el año 2000 para que el Proyecto Gutenberg se convierta en una entidad organizada y legalmente reconocida y hoy es una organización sin fines de lucro, registrada en el estado de Mississippi , con un acuerdo con las autoridades fiscales de los EE. UU. para hacer que las donaciones sean deducibles. [4] Desde el comienzo del Proyecto, el tiempo requerido para digitalizar un libro se ha reducido drásticamente. Por lo general, los libros no se escriben a máquina, sino que se convierten a formato digital con la ayuda del software de reconocimiento óptico de caracteres , OCR. [5] Sin embargo, incluso con estos avances, los textos obtenidos aún deben someterse a cuidadosas revisiones y reediciones antes de que puedan incluirse en la colección.
Pietro Di Miceli, un voluntario italiano, desarrolló y administró el primer sitio web del proyecto y comenzó el desarrollo del catálogo de textos en línea. En los diez años de gestión (1994-2004) el sitio ha ganado numerosos premios que han contribuido a aumentar su popularidad. [6]
El sitio web del Proyecto Gutenberg ya no es accesible en Alemania desde marzo de 2020, [7] ya que la editorial Fisher ha descubierto que las obras de Heinrich Mann , Thomas Mann y Alfred Döblin , incluidas en el catálogo del Proyecto, todavía están protegidas por la ley europea de derechos de autor. ley, a pesar de ser de dominio público en los Estados Unidos. [8] Una medida similar se aplicó en Italia a partir del 11 de mayo del mismo año, tras una denuncia de Fieg y Agcom . [9] [10]
En octubre de 2021, las autoridades alemanas y la Fundación del Archivo Literario del Proyecto Gutenberg llegaron a un acuerdo para restaurar el acceso parcial al sitio, que sigue sin estar disponible en Italia. [11]
El Proyecto Gutenberg de Australia es un proyecto hermano oficial de PG. Si bien el sitio principal de Gutenberg hace referencia a la ley de derechos de autor de EE. UU. y especialmente a la Ley de Extensión del Plazo de Copyright de Sonny Bono, que en algunos casos extendió retroactivamente el plazo de los derechos de autor a 95 años, PG Australia produce textos electrónicos de acuerdo con la ley de derechos de autor australiana , que difiere de La ley estadounidense en la definición de obras que caen en el dominio público. Por lo tanto, PG Australia puede producir y poner a disposición textos electrónicos que serían ilegales para el Proyecto Gutenberg en los EE . UU ., mientras que algunos textos que se incluyen en el PG de EE. UU. no pueden aceptarse en el PG de Australia. PG Australia también se enfoca en escribir material australiano. Sin embargo, luego de las negociaciones para un acuerdo de libre comercio renovado entre EE. UU. y Australia, la disponibilidad de textos de dominio público solo para PG Australia no podrá continuar debido a los cambios de derechos de autor incluidos en el acuerdo.
PG-EU es un nuevo proyecto hermano que opera de conformidad con la ley de derechos de autor de la Unión Europea . Uno de sus objetivos es incluir tantos idiomas como sea posible en el proyecto. Se basa en Unicode para garantizar que todos los alfabetos se puedan representar de manera fácil y correcta.
Aozora Bunko es un proyecto similar iniciado en Japón; su objetivo es digitalizar textos sin derechos de autor bajo la ley de derechos de autor japonesa y distribuirlos de forma gratuita. La mayoría de los textos disponibles son parte de la literatura japonesa o son traducciones de obras de la literatura inglesa .
Project Runeberg es un proyecto similar para textos en lenguas nórdicas que comenzó en 1992 .
El Proyecto Ben-Yehuda trae textos hebreos de dominio público a Internet, se inspiró en el Proyecto Gutenberg y comenzó en 1999 . Un proyecto del National Yiddish Book Center de Amherst (Massachusetts) está intentando producir versiones digitales de toda la colección de libros en yiddish .
En 2000 , Charles Franks fundó Distributed Proofreaders , una organización que trabaja para permitir la revisión de textos escaneados como una actividad distribuida entre muchos voluntarios a través de Internet . Para que esto sea posible, los voluntarios escanean los libros y aplican procedimientos de OCR, reconocimiento óptico de caracteres; luego colocan sus resultados en un sitio web para que otros voluntarios de revisión los revisen. Cada libro pasa por dos actividades de revisión. Con miles de voluntarios, cada uno de los cuales puede operar en unas pocas o muchas páginas, un libro de tamaño razonable puede revisarse en horas. Otros voluntarios procesan posteriormente los libros y los publican en el sitio web del Proyecto Gutenberg. El portal de correctores italianos, llamado DP-IT , está activo desde 2011 .
El Million Book Project tiene como objetivo digitalizar un millón de libros de dominio público para 2005. Para poder procesar un conjunto tan grande de libros en tan poco tiempo, generalmente evita el largo proceso de transcripción y grabación. archivos
Wikisource es el proyecto de Wikimedia que se ocupa de la digitalización y transcripción de documentos, textos y libros de dominio público. Nació en 2003 con el nombre de Proyecto Sourceberg , justo en analogía con el Proyecto Gutenberg. A la fecha cuenta con cerca de 100.000 textos en varios idiomas.
Un subproyecto del Proyecto Gutenberg trabaja en la digitalización de partituras musicales .
El proyecto Mutopía intenta hacer por la música lo que el Proyecto Gutenberg hace por las obras literarias.
En Italia una iniciativa similar está llevando a cabo la asociación Liber Liber con el Proyecto Manuzio (dedicado al tipógrafo y editor Aldo Manuzio ).