}

'HER' CADA COP MÉS A PROP


El model GPT4o és molt ràpid en respondre, entona les expressions i pot cantar. Mira Murati, directora de tecnologia d'OpenAI, amb dos enginyers, prova les habilitats del nou model de llenguatge. 'Her', és  cada cop més a prop: OpenAI llança una IA que interactua amb la veu com un humà - Francesc Bracero a la vanguardia.


Cada vegada estem més a prop d'una IA que es comporti amb la soltesa de què protagonitza la pel·lícula Her –està a Filmin i Prime Video–. OpenAI va presentar ahir a la nit un nou model de llenguatge, GPT-4o que interactua a partir d'imatge i veu i respon a l'instant, amb la velocitat d'un humà, d'una manera aparentment indistingible d'una persona.
OpenAI defineix el nou model com a “un pas endavant cap a una interacció molt més natural entre l'ésser humà i l'ordinador”. A GPT-4o se li pot demanar que interactuï a partir de qualsevol combinació de text, àudio i imatge i, com a resposta, genera alhora qualsevol combinació de text, àudio i imatge. El més sorprenent és la velocitat. Respon preguntes en només 232 mil·lisegons, com una persona, per la qual cosa manté converses de manera natural.
Mitjançant l'app de ChatGPT, la IA pot accedir a imatge per la càmera del mòbil o una captura de pantalla, i també a la veu de l'usuari pel micròfon. El mateix es pot fer amb la pantalla de l'ordinador, on se li pot mostrar, per exemple, un fragment de codi de programació perquè descobreixi, de viva veu, on són els errors. GPT-4o pot fer de traductor simultani en 50 idiomes, és capaç de fer servir tons de veu diferents i fins i tot cantar. La directora de tecnologia d'OpenAI, Mira Murati, i dos enginyers de programació de la companyia van mostrar diversos exemples de les capacitats.
Un d'ells va mostrar la cara amb la càmera i li va demanar a ChatGPT que intentés dir-li quines emocions estava sentint. “Sembla que et sents força feliç i alegre, amb un gran somriure i potser, fins i tot, un toc d'excitació. Sigui el que sigui que estiguis passant, sembla que ets de molt bon humor. Comparteix la font d'aquestes bones vibracions”, va respondre. “La raó per la qual estic de molt bon humor –va dir l'enginyer– és perquè estàvem fent una presentació mostrant com ets d'útil”. “Oh, para. M'estàs fent enrojolar”, li va contestar la IA. OpenAI va començar a desplegar a partir d'ahir les funcions de text i imatge de GPT-4o a  ChatGPT. La IA estarà disponible al nivell gratuït, encara que els usuaris de pagament disposaran d'un límit de missatges fins a cinc vegades superior. La companyia va anunciar que en les properes setmanes, llançarà una nova versió preliminar de la manera de veu amb GPT-4o a ChatGPT Plus. De moment 'HER' no funciona amb la veu de Scarlett Johansson.

 

16 Comentaris

Més recent Anterior