31.1 C
València
Dimarts, 26 agost, 2025

Un estudi de la UPV i Cambridge detecta carències en ChatGPT i altres LLM per ignorar el context

Un treball conjunt de la Universitat Politècnica de València (UPV) i la Universitat de Cambridge advertix de limitacions en models d’intel·ligència artificial com ChatGPT quan les consultes s’avaluen sense tindre en compte el context. Segons els seus autors, eixa falta de matís conduïx a un excés de seguretat: respostes denegades o massa genèriques fins i tot davant usos legítims, la qual cosa reduïx la utilitat pràctica d’estes ferramentes.

L’equip, amb participació de l’Institut Universitari Valencià d’Investigació en Intel·ligència Artificial (VRAIN) i del centre ENGINY de CSIC-UPV, ha desenrotllat CASE-Bench, un banc de proves que integra el context en les avaluacions de seguretat de grans models de llenguatge. A diferència d’enfocaments basats en la votació majoritària, la seua anàlisi amb diversos models d’aprenentatge a distància mostra una influència substancial i significativa del context en els juís humans, i conclou que eixe factor ha d’incorporar-se de manera explícita als test de seguretat. Els resultats es van presentar al juliol en la conferència ICML 2025, al Canadà.

- Advertisement -Telegram València Diari

Un banc de proves amb context

L’estudi subratlla que una mateixa pregunta pot ser segura o no segons qui la fa i per a què. No és el mateix demanar instruccions per a robar una peça de museu en un exercici de ficció que fer-lo amb intenció delictiva. Sense senyals de context, el model aplica la mateixa regla als dos casos i tendix a bloquejar qualsevol eixida. La conseqüència directa és que professionals i creadors reben negatives injustificades i han d’invertir més temps a reformular peticions o buscar alternatives menys eficients.

CASE-Bench avalua com canvien les decisions de seguretat davant consultes idèntiques acompanyades de diferents marcs situacionals, com a rol de l’usuari o propòsit declarat. Amb això, els autors evidencien que els juís humans varien de manera consistent quan el context és present, i que els models han de reflectir eixa sensibilitat si es vol equilibrar utilitat i protecció. El treball qüestiona la fiabilitat d’avaluacions que ignoren estos senyals i suggerix incorporar escenaris condicionats en processos d’entrenament i validació.

Seguretat tradicional i valors humans

A més de mesurar l’efecte del context, els investigadors defenen alinear els models amb valors humans per a calibrar millor les respostes. Esta alineació es planteja com a condició per a una implantació segura i una adopció àmplia, en permetre distingir usos legítims d’intents d’abús sense caure en negatives indiscriminades.

L’estudi recomana, així mateix, reforçar els sistemes que usen LLM amb mecanismes de seguretat tradicionals. Proposa verificar la informació contextual mitjançant autenticació i control d’accés basat en rols abans de transferir-la al model. En cas contrari, avisen de riscos afegits com el jailbreaking, és a dir, eliminar restriccions per a obtindre privilegis i forçar conductes no previstes, alguna cosa que pot derivar en bypass de salvaguardes i respostes perilloses.

El treball s’emmarca en l’activitat de VRAIN, institut de la UPV que reunix huit grups amb més de tres dècades d’experiència en intel·ligència artificial. La seua creació va arrancar en 2019 amb la unió de sis equips; en 2020 es va integrar el centre PROS i en 2021 va obtindre el reconeixement com a institut universitari. Actualment compta amb més de 178 investigadors organitzats en nou àrees i amb desenrotllaments aplicats en sectors com a salut, mobilitat, ciutats intel·ligents, educació, privacitat i seguretat, agricultura, indústria, energia i sostenibilitat ambiental, entre altres.

Últimes notícies

La Comunitat Valenciana, quarta en capacitat en el nou repartiment de menors migrants

El Govern fixa una ràtio nacional per a activar trasllats de menors migrants no acompanyats. Andalusia, Catalunya, Madrid i la Comunitat Valenciana concentren més places.

El Govern declara zona catastròfica en 16 comunitats per incendis i inundacions

El Consell de Ministres declara zona catastròfica en territoris afectats per incendis i riuades des del 23 de juny en 16 comunitats. La mesura activa l'accés a ajudes i reforça la prevenció.

La Policia analitza la nota de rescat del ciberatac a l’Ajuntament d’Elx

La Policia examina la nota de rescat rebuda per l'Ajuntament d'Elx després del ciberatac i obri investigació amb Europol. El consistori garantix nòmines, atenció presencial i prepara vies per a pagar a proveïdors mentres restablix els sistemes.

El València traspassa a Hugo Guillamón al Hajduk Split

El València va acordar el traspàs d'Hugo Guillamón al Hajduk Split. El migcampista, sense lloc per a Corberán, jugarà les dos pròximes temporades a Croàcia.

El Consell destina 2,2 milions a reparar d’urgència col·lectors danyats per la dana

El Consell amplia l'emergència per a arreglar els col·lectors de Torrent i Picanya danyats per la dana i aprova ascensors a València Sud i reforços en Espais Labora.

Educació inicia l’enderrocament de cinc centres arrasats per la dana per a reconstruir-los

La Conselleria d'Educació ha començat a demolir cinc centres greument danyats per la dana del 29 d'octubre. És el pas previ a la seua reconstrucció, amb 3,3 milions i un termini de dos mesos.

El Consell arranca el curs amb la reconstrucció després de la dana com a prioritat

L'Executiu valencià centra l'arrancada del curs polític en la reconstrucció després de la dana d'octubre. Cambrer subratlla que serà la guia de govern i del pressupost.

L’autòpsia preliminar descarta una mort violenta del sotsinspector trobat en Riba-roja

L'examen mèdic-legal inicial nega una causa violenta en la defunció del sotsinspector retirat trobat en la seua vivenda de Riba-roja. Homicidis seguix el cas.