En els darrers cinc anys la intel·ligència artificial ha passat de les universitats als nostres mòbils sense solució de continuïtat. Si és una tecnologia arcana a convertir-se en un fenomen cultural pop. Passa perquè ha “après” a escriure i tothom escriu. Les tècniques d'aprenentatge automàtic han permès als ordinadors destil·lar els mecanismes dels llenguatges humans i de programació.  - Josep Maria Ganyet.

Avui, les màquines poden reproduir correus electrònics, informes corporatius, interaccions en xarxes socials i programes a Python per què han processat milions de correus electrònics, informes corporatius, interaccions en xarxes socials i programes a Python que hem escrit els humans. I ens funciona tan bé que ho fem servir constantment quan hem de redactar textos, que acabem compartint a la xarxa. Un estudi d'Amazon Web Services demostra que un 57% de tot el text de la web, o bé ha estat generat per IA o traduït per un algorisme d'IA, generalment de l'anglès. El consum d'aquests textos influeix de manera inexorable en la manera com escrivim i parlem. En interactuar constantment amb textos generats per IA, els usuaris adoptem inconscientment els patrons lingüístics. I això que per si mateix no ens hauria d'importar gaire –al cap ia la fi han après de com escrivim nosaltres– pot comportar una uniformització del llenguatge i una reducció de la diversitat expressiva. Enlloc que la IA parli com nosaltres, que siguem nosaltres els qui parlem com ella.

Un procés que els experts anomenen “aplanament del llenguatge” i que ja hem viscut amb l'adopció de tecnologies com ara el llibre, la ràdio, la tele o la pròpia web, que podria estar en perill per l'excés de contingut generat. L'aplanament ja és prou manifest perquè els seus efectes siguin mesurables. Andrew Gray, bibliotecari de l'University College de Londres va estudiar l'aparició de determinades paraules en estudis científics de l'any 2023 i ho va comparar amb estudis publicats previs a l'aparició de ChatGPT, el 2022. Va detectar un increment del 137% en l'ús de “meticulosament”, un 117% en “encomiable” als seus originals en anglès. Alguns d'aquests termes han esdevingut marques estilístiques que delaten els textos generats per IA.

El cas més paradigmàtic és potser la popularització a l'últim any del terme aprofundir, delve (aprofundir) en anglès. Una anàlisi meticulosa ens porta per un camí intricat fins a la feina més encomiable de la IA: la dels anotadors. Aprofundim en el tema. Jeremy Nguyen, de la Universitat de Tecnologia de Swinburne, a Melbourne, es va adonar de la tendència de ChatGPT a generar el terme “aprofundir” en les respostes. Va comprovar com el seu ús s'havia multiplicat per 100 el 2024 en textos científics publicats a PubMed. També els passava a “palanquejament” i “tapisseria”. Per què aquests termes i no altres?

Doncs resulta que malgrat la naturalesa estadística dels algorismes predictius de la IA generativa, aquest fenomen no té res d'aleatori: delve, igual que leverage o tapestry, són més utilitzades en algunes varietats dialectals de l'anglès global que no pas en l'anglès britànic o nord-americà. Les paraules que ens ocupen són utilitzades particularment a l'anglès empresarial africà. És molt probable que el seu ús s'hagi filtrat als sistemes a través de milers d'hores de treball de moderació i entrenament subcontractades a països com Kenya o Nigèria. Avui aquests termes ja formen part de l'anglès científic i dels treballs de tots els estudiants del món que han de lliurar un text en anglès.

Si l'arquitectura física condiciona el nostre caràcter, com va dir Churchill, l'arquitectura de la IA condiciona la nostra ment.

Pot pensar que canviar un terme per un altre no té la transcendència més gran i que fins i tot té un punt romàntic que la comunitat científica global acabi utilitzant la terminologia dels més febles (recordem que els anotadors de països pobres que moderen les respostes dels LLM, cobren un o dos dòlars l'hora). Però això portat a l'extrem és letal, en sentit virtualment literal.

La IA podria estar suïcidant-se i matant la web alhora. Si la major part del contingut que trobem a internet són textos generats per IA, el sistema entra en un bucle d'autoreferència en utilitzar-los com a font d'aprenentatge. Aquest fenomen, conegut com a col·lapse del model, condueix inevitablement a una progressiva degradació dels resultats generats. Si la IA beu cada cop més de si mateixa i menys de fonts humanes genuïnes, deixa de ser útil.

Aquesta retroalimentació tòxica no només empobreix la diversitat lingüística, sinó que posa en perill el futur mateix de la comunicació digital. Les llengües minoritàries són especialment vulnerables a aquest procés, tot i que totes estan exposades, també l'anglès. Si la generació automàtica no reflecteix les variants culturals, sinó només una versió reduïda i normativitzada, qui dictarà el futur de la llengua no en serem els usuaris, ni l'IEC, en el cas del català, sinó que ho farà ChatGPT. L'hegemonia algorísmica pot convertir un corpus digital ric i plural en una pobra cotorra estocàstica.

No està tot perdut. Si nosaltres, amb els nostres textos, t'estimo truita, som els que hem fet la IA, també som els que la podem desfer –o almenys enriquir–. L'humorista britànic Ken Cheng demostra, per reducció a l'absurd, que la IA mai no podrà, entre micos a la cara, escriure com ell. Al seu LinkedIn publica un text on diu que el millor, tinc una bèstia dins meu, contra l'aplanament del llenguatge és precisament la imprevisibilitat humana. Si la IA aprèn del que escrivim, podem, homes i dones de cap alçat, resistir la seva estandardització: sembrant soroll, poesia, contradicció, disbarat. Cheng ho fa intercalant absurditats en el seu text, 'eau de toilette'. Una forma de sabotatge subtil i autodefensa cultural.

Cedir el control del llenguatge mai no ha acabat bé pels cagamiques. Hauríem de tenir-ho present si no és que vulguem acabar sent nosaltres els qui un dia parlem com a màquines en un sunny day.