Imatges d'un anunci d'El Piponazo, de Grefusa, generat amb IA.

A mitjans de febrer, la marca de snacks i fruits secs Grefusa va penjar a les seves xarxes socials un vídeo publicitari creat amb intel·ligència artificial, acompanyat del text següent: “La IA pot resoldre l'equació més complexa del món, però no és capaç de menjar-se una pipa”. Deixant de banda el debat de si és més o menys qüestionable utilitzar aquesta eina en treballs creatius —encara que, en aquest cas, es tracti d'una burla sobre la pròpia IA—, des del punt de vista gastronòmic, aquest anunci posa sobre la taula un assumpte que té la seva molla: per què la intel·ligència artificial té problemes per generar imatges de certs aliments i gestos relacionats? I més concretament, per què no sap menjar pipes?

Recorrem a dues expertes per donar una mica de llum sobre el tema: Nerea Luis, doctora en ciències de la computació, especialitzada en intel·ligència artificial, i Mariia Chizhikova, enginyera de Models de Llenguatge, també especialitzada en IA, que divulga sobre això al seu compte a Instagram @mariia.en.ia.

El cas de les pipes és una mena de tempesta perfecta. A la dificultat que té la intel·ligència artificial per bregar amb objectes de comportament caòtic, s'hi afegeix el fet que els prompts (les instruccions amb què interactuem amb els sistemes d'IA) han estat entrenats majoritàriament amb dades anglosaxons. I, tal com ens han demostrat les xarxes socials al llarg dels anys, els anglosaxons no entenen gaire bé què és “menjar pipes”. Cada cert temps, apareix un vídeo en què algú aliè a aquest costum tan nostre els engoleix amb closca o es pregunta si menjar pipes en un banc és part de la cultura espanyola (la resposta, és clar, és “sí”).

Com que la IA aprèn de dades ja existents, podem deduir que, en el cas de les pipes, el que li manquen són aquestes dades. “Com més vídeos hi hagi a internet d'una acció concreta, millor l'haurà pogut aprendre el model”, indica Mariia. Per això, aquells aliments que tinguin més presència en mitjans i xarxes socials, estaran més ben representats i seran més fàcils de generar per a la IA.

"En anglès no existeix un verb equivalent a 'menjar pipes' com a concepte cultural propi. Es diria 'eating sunflower seeds', que descriu el producte, però no l'acció tal com la vivim aquí. Ara bé, aquests models són multilingües i Espanya no és l'únic país on es mengen pipes: a Rússia, per exemple, és un costum igual d'arrai, Maria. Nerea afegeix que, en anglès, sunflower seeds s'associa més amb menjar per a ocells o amb un topping per a amanides.

La vall inquietant del menjar fet amb IA - Un estudi pilot publicat el 2025 a la revista científica Appetite va concloure que les imatges de menjar creades amb intel·ligència artificial poden caure a la “vall inquietant”. La teoria de la vall inquietant descriu com reaccionem emocionalment davant de robots, avatars o figures artificials que s'assemblen molt als humans, però no prou per resultar completament naturals. Quan aquesta semblança és alta però imperfecta, la nostra resposta passa de la simpatia a la incomoditat o rebuig, creant una “vall” emocional. 

"El nostre cervell detecta una cosa que gairebé és real, però no del tot, i això genera una incomoditat difusa. En el cas del menjar, solem processar aquestes imatges amb una capa addicional d'expectativa sensorial -l'olor, la textura, el sabor imaginat- i qualsevol inconsistència a l'aparença interfereix amb aquesta experiència", assenyala. "Ara mateix, el problema més freqüent no és que les imatges siguin dolentes, sinó que tendeixen a ser massa perfectes: textures massa uniformes, brillantors massa simètriques, composicions que semblen tretes d'un manual de disseny gràfic més que d'una cuina real. I paradoxalment, això és el que les delata i el que les fa menys desitjables".

Segons l'estudi, aquestes imatges poden desencadenar una reacció de neofòbia alimentària (por de tastar aliments nous o desconeguts). És a dir, que en veure menjar generat per IA, el nostre cervell no el percep com allò que intenta representar, sinó com un aliment que no coneix i que, per tant, podria suposar una amenaça per a nosaltres.

Ara que les imatges de menjar generades amb intel·ligència artificial semblen anar guanyant terreny a la publicitat i fins i tot als menús d'alguns restaurants i empreses de menjar a domicili, no cal tenir en compte aquests estudis abans de reemplaçar una foto autèntica d'un plat per una que no ho és. Aquestes imatges, a més, podrien fer que el consumidor se senti enganyat, per no entrar en el problema ètic que planteja que els models que les generen hagin estat entrenats amb imatges reals creades per persones que difícilment poden reclamar que s'hagin fet servir sense el seu permís.

Arribarà algun dia la IA a generar imatges de menjar que sí que ens resultin apetitoses? I si això passa, no continuarem preferint la imatge real abans que l'artificial? "El menjar fotogènic de veritat té imperfeccions, petits accidents que el fan humà. Per això crec que el camí no és substituir la fotografia de menjar real amb IA, sinó fer-lo servir com a eina de suport quan té sentit. Ja he vist plataformes de delivery que comencen a utilitzar imatges generades per representar els seus plats, i crec que és un error, no només tècnic, sinó en estratègia en comunicació en l'estratègia. importa“, conclou Mariia. Maria Arranz al País