En una primera fase, les aconseguien a Internet de forma gratuïta. Després, quan ja van assumir els textos que necessitaven, van continuar amb les biblioteques pirata en línia, cosa que va acabar amb demandes per violació de drets d'autor. Aleshores va sorgir la necessitat de buscar una nova font d'alimentació, que no van trigar a trobar: els llibres físics. Aquests tenien un avantatge respecte als recursos anteriors, i és que la seva qualitat estava garantida, atès que han hagut de passar per un procés editorial i de correcció abans de publicar-se. Això sí, per evitar al màxim noves demandes, no serveix un llibre qualsevol. Les compres són sempre exemplars de segona mà que, majoritàriament, porten temps en un magatzem gairebé sense circulació i és més fàcil que estiguin lliures de drets.
"El problema no és la compra actual de llibres, sinó el tsunami que ve. El patrimoni es perd", diu Marçal Font
Gust més o menys que aquests llibres comprats es destinin a entrenar una IA –qüestions ètiques de banda–, el veritable problema arriba després: aquests llibres es destrueixen. Per què? Perquè, per escanejar-los millor (i de forma més ràpida, cal no oblidar que el temps és or), s'acaben partint els seus lloms, cosa que els converteix en no aptes per a la seva difusió posterior. Una investigació de The Washington Post va revelar a principis d'any un projecte secret de l'startup Anthropic, que opera l'eina d'IA Claude, per escanejar i destruir tots els llibres del món, segons assenyalava un informe intern de la companyia. Una operació, coneguda com a Projecte Panamà, de la qual ells mateixos admetien que preferien que fos “secreta”.
"El problema de tot això no és la compra actual de llibres, sinó el tsunami que ve. El patrimoni bibliogràfic es perd", adverteix el llibreter Marçal Font, al capdavant de la Llibreria Fènix de Badalona, durant una conversa amb La Vanguardia. Va ser ell un dels que va donar la veu d'alarma que aquesta realitat ja havia arribat a Catalunya després de rebre una sèrie de comandes “una cosa estranya” entre el 30 d'abril i el 8 de maig. Tots a una mateixa seu dels Estats Units per a una empresa radicada a Canadà, Zoom Books.
S'interessaven per manuals tècnics de producció de vi, actes de congressos dels anys 80, dietaris de la Guerra Civil… “Llibres que compten amb pocs centenars d'exemplars, que són carn de desafecció de biblioteca pública i difícils de trobar a qualsevol altre lloc”, assenyala a la plataforma de newsletters Substack, on ha publicat una investigació realitzada. empresa tecnològica que desenvolupa solucions de IA.
Se sap del cert que Zoom Books és una d'aquelles empreses intermediàries que treballen per a Silicon Valley? No, però, segons apunta Vinaixa, "pels patrons irracionals de compres i despeses d'enviaments elevats, tot encaixa amb aquesta indústria súper dopa de diners. És evident que no els compren per vendre". Els llibres no viatgen mai a oficines de tecnologia, sinó a l'atenció de PrepFort, un proveïdor privat de logística per a tercers, situat a Illinois.
Si bé Zoom Books assegura no estar relacionada amb el Projecte Panamà, ja que diuen ser una empresa que recull, compra, dona i recicla llibres usats, hi ha qui va tenir temps de fer cops de pantalla d'un post de la seva web, que explicava que s'oferien a laboratoris d'IA com a antídot a la manca de dades i com a aconseguidors de factures. Sobre aquest darrer punt, esmentaven el judici de Bartz contra Anthropic, que va crear un precedent, ja que el jutge va dictaminar que entrenar IA amb llibres adquirits legalment (és a dir, comprats i amb una factura) és una cosa legítima. Una informació que ha estat esborrada, però que es pot arribar a rescatar si es pregunta a les mateixes IAs. La Vanguardia ha intentat contactar amb l'entitat però no ha obtingut resposta.
De tota manera, la urgència davant d'aquest escenari és trobar solucions. Font i Vinaixa insisteixen que això és el més primordial. Pel que fa a Catalunya es refereix –però que es podia ampliar a qualsevol part del món–, Vinaixa és partidari de "cobrar aquestes empreses pel que volen (les dades) i quedar-nos amb el patrimoni. Fer negoci nosaltres i no un intermediari". Planteja "un consorci català que ofereixi fons documental de domini públic amb metadades netes, contracte únic, atribució i auditoria d'ús" i aprofita aquest reportatge per presentar projectes com ara Cedulari.cat. “D'una banda és una base de dades amb focus al corpus pre-ISBN”, és a dir, que no està catalogat ni consta enlloc. "I de l'altra és un conjunt d'eines per a grans models de llenguatge que els ofereix allò que falta a la IA generalista: procedència, traçabilitat i fonts verificables".
Vinaixa planteja “cobrar aquestes empreses per les dades i quedar-nos amb el patrimoni”, sense intermediaris
Des de la Conselleria de Cultura, escolten les propostes però recomanen que no s'estengui el pànic, ja que, des del punt de vista patrimonial, “a Catalunya difícilment es pot parlar d'un risc de desaparició de llibres editats”. Recorden que hi ha la figura del dipòsit legal, que obliga editors a lliurar exemplars de les seves publicacions per garantir-ne la conservació permanent. Diversos exemplars queden preservats en institucions públiques, com la Biblioteca Nacional d'Espanya, la Biblioteca de Catalunya i les biblioteques públiques provincials. Igual que els llibreters, també asseguren no compartir la “destrucció innecessària de llibres”, i també opten per utilitzar “sistemes de digitalització no destructiva”.
Ara bé, afegeixen que "no cal confondre la destrucció d'alguns exemplars comercials amb la destrucció del patrimoni bibliogràfic" i conclouen que a Catalunya "hi ha mecanismes de preservació pública que garanteixen la conservació d'obres a llarg termini". Insisteixen en la necessitat de “trobar un equilibri entre la protecció dels drets dels creadors, la preservació del patrimoni cultural i la necessitat que llengües com el català tinguin una presència significativa a les tecnologies que configuraran el futur”.
Experiència prèvia en escaneig de codis de barres o documents, habilitats de mecanografia ràpides i precises (es prefereix més de 60 paraules per minut o més de 10.000 pulsacions per hora) i capacitat per romandre dret durant un torn complet de vuit hores. Aquests són alguns dels requisits que demana PrepFort per ser un escanejador. Cosa que no deixa de cridar l'atenció ja que en teoria aquesta empresa es dedica només a rebre milions de paquets globals i enviar-los cap a la destinació final. El que és un proveïdor privat de logística per a tercers. Els llibres que compra Zoom Books s'envien a aquest destí. L'oferta de treball, pública a internet, està caducada, segurament perquè ja s'ha contractat algú, però afegia alguna clàusula més que, si bé no era obligatòria, era “desitjable”, com tenir capacitat per ajupir-se i aixecar fins a 18 kg amb regularitat (piles de llibres?) o experiència en processament de llibres, sistemes de biblioteques i gestió de comandes. Lara Gómez Ruiz - SBD 13.6.26

