31.3 C
València
Dimarts, 26 agost, 2025

Un estudi de la UPV i Cambridge detecta carències en ChatGPT i altres LLM per ignorar el context

Un treball conjunt de la Universitat Politècnica de València (UPV) i la Universitat de Cambridge advertix de limitacions en models d’intel·ligència artificial com ChatGPT quan les consultes s’avaluen sense tindre en compte el context. Segons els seus autors, eixa falta de matís conduïx a un excés de seguretat: respostes denegades o massa genèriques fins i tot davant usos legítims, la qual cosa reduïx la utilitat pràctica d’estes ferramentes.

L’equip, amb participació de l’Institut Universitari Valencià d’Investigació en Intel·ligència Artificial (VRAIN) i del centre ENGINY de CSIC-UPV, ha desenrotllat CASE-Bench, un banc de proves que integra el context en les avaluacions de seguretat de grans models de llenguatge. A diferència d’enfocaments basats en la votació majoritària, la seua anàlisi amb diversos models d’aprenentatge a distància mostra una influència substancial i significativa del context en els juís humans, i conclou que eixe factor ha d’incorporar-se de manera explícita als test de seguretat. Els resultats es van presentar al juliol en la conferència ICML 2025, al Canadà.

- Advertisement -Telegram València Diari

Un banc de proves amb context

L’estudi subratlla que una mateixa pregunta pot ser segura o no segons qui la fa i per a què. No és el mateix demanar instruccions per a robar una peça de museu en un exercici de ficció que fer-lo amb intenció delictiva. Sense senyals de context, el model aplica la mateixa regla als dos casos i tendix a bloquejar qualsevol eixida. La conseqüència directa és que professionals i creadors reben negatives injustificades i han d’invertir més temps a reformular peticions o buscar alternatives menys eficients.

CASE-Bench avalua com canvien les decisions de seguretat davant consultes idèntiques acompanyades de diferents marcs situacionals, com a rol de l’usuari o propòsit declarat. Amb això, els autors evidencien que els juís humans varien de manera consistent quan el context és present, i que els models han de reflectir eixa sensibilitat si es vol equilibrar utilitat i protecció. El treball qüestiona la fiabilitat d’avaluacions que ignoren estos senyals i suggerix incorporar escenaris condicionats en processos d’entrenament i validació.

Seguretat tradicional i valors humans

A més de mesurar l’efecte del context, els investigadors defenen alinear els models amb valors humans per a calibrar millor les respostes. Esta alineació es planteja com a condició per a una implantació segura i una adopció àmplia, en permetre distingir usos legítims d’intents d’abús sense caure en negatives indiscriminades.

L’estudi recomana, així mateix, reforçar els sistemes que usen LLM amb mecanismes de seguretat tradicionals. Proposa verificar la informació contextual mitjançant autenticació i control d’accés basat en rols abans de transferir-la al model. En cas contrari, avisen de riscos afegits com el jailbreaking, és a dir, eliminar restriccions per a obtindre privilegis i forçar conductes no previstes, alguna cosa que pot derivar en bypass de salvaguardes i respostes perilloses.

El treball s’emmarca en l’activitat de VRAIN, institut de la UPV que reunix huit grups amb més de tres dècades d’experiència en intel·ligència artificial. La seua creació va arrancar en 2019 amb la unió de sis equips; en 2020 es va integrar el centre PROS i en 2021 va obtindre el reconeixement com a institut universitari. Actualment compta amb més de 178 investigadors organitzats en nou àrees i amb desenrotllaments aplicats en sectors com a salut, mobilitat, ciutats intel·ligents, educació, privacitat i seguretat, agricultura, indústria, energia i sostenibilitat ambiental, entre altres.

Últimes notícies

La Diputació d’Alacant millora el camí entre La Vall d’Ebo i L’Atzúbia per a previndre incendis

La Diputació d'Alacant condiciona 8,16 km entre La Vall d'Ebo i L'Atzúbia amb 740.000 euros per a facilitar evacuacions i extinció, i reforçar la seguretat viària.

Lleu terratrémol de magnitud 2,2 a Hondón de los Frailes, sentit en L’Horta i Abanilla

Un tremolor amb epicentre a Hondón de los Frailes va registrar una magnitud 2,2 i es va produir a les 23.31 del dilluns. Va ser sentit de manera lleu en L'Horta i Abanilla.

El Consell demanarà suspendre qualsevol norma del Govern sobre el repartiment de menors

El Consell anuncia que sol·licitarà la suspensió cautelar de qualsevol norma estatal sobre el repartiment de menors migrants no acompanyats per falta d'informació i per la saturació del sistema valencià.

Detingut el gerent d’un local d’oci a Santa Pola per la mort d’un client després d’un empujon

El responsable del local va ser arrestat després d'espentar a un client durant una discusion a les portes de l'establiment. Queda en llibertat amb càrrecs a l'espera de l'autòpsia.

El Govern aprova l’últim decret per a derivar menors migrants a les comunitats

El Consell de Ministres fixa una capacitat ordinària de 32 places per cada 100.000 habitants i activa el mecanisme de derivació. Diverses autonomies ho rebutgen i ho porten als tribunals.

Alacant implantarà un sistema intel·ligent al castell de Santa Bàrbara per a ordenar el flux de visitants

Alacant adjudica un sistema intel·ligent per a analitzar aforaments i usos al castell de Santa Bàrbara i ordenar el flux de visitants. En 2024 va sumar més de 950.000 visites, un 17% més.

La Policia deté a Dénia a un fugitiu polonés buscat per homicidi i narcotràfic

La Policia Nacional arresta a Dénia a un 'high value target' d'Europol reclamat per homicidi, narcotràfic i pertinença a organització criminal. L'operació es connecta amb la captura prèvia d'un altre líder en Benahavís.

Pedro Martinez alerta d’una pretemporada atipica que deixa al València Basket en quadre

Pedro Martinez reconeix que la pretemporada estara marcada per l'absència de molts internacionals i un grup curt. Cinc del primer equip i la pedrera sostenen els primers entrenaments.