Anthropic acaba de publicar un estudi sobre com els models d’IA poden millorar-se a si mateixos sense intervencció humana. No és una novetat teòrica, és el que està passant ja ara, i explica per què el creixement exponencial de la demanda de GPU pot arribar a ser insostenible.
Quan la IA comença a optimitzar la IA
El comunicat d’Anthropic sobre la millora recursiva es centra en un tema molt concret: els models moderns ja són prou sofisticats per generar millores en arquitectures o processos de training que després s’apliquen a versions posteriors. No és que la IA es reprogami a si mateixa, és que els enginyers humans ara usen la IA per fer el treball que feien ells abans.
Això accelera el cicle de desenvolupament. Sense intervencció manual constant, el temps entre versions es redueix dràsticament. Un enginyer que tardava sis mesos a explorar 50 arquitectures candidates, ara tarda quatre setmanes. Els models fan la feina de cerca, prova, avaluació i proposició de les millores.
El problema és evident: la demanda de còmput es duplica cada cicle. Google ja paga 920 milions mensuals a SpaceX per 110.000 GPUs. Si cada versió de Claude o GPT reclama el doble de capacitat que l’anterior, i el cicle de release passa de sis mesos a dos, arribarà un punt on la xarxa elèctrica no podrà seguir el ritme.
Andrew Bailey, governador del Banc d’Anglaterra, ja ha dit que la IA podria necessitar ser racionada per restricció energètica. No és especulació, és física: no es pot tenir creixement exponencial amb infraestructura lineal.
La carrera s’accelera, però el sostre es veu cada vegada més a prop
OpenAI planeja refundar ChatGPT com una superapp d’agents autònoms. Google inverteix milers de milions en còmput. Musk es consolida com a principal proveïdor d’infraestructura. I al centre d’aquest quadrant, els models s’usen per entrenar models més potents que es trenen més ràpid amb més recursos.
Això crea una dinàmica perversa: qui té més GPU, entrena més ràpid i guanya més avantatge. Qui té més avantatge pot invertir més en còmput, és un peix que es mossega la cua.
Però hi ha una trampa: el ressò. Quan els models es fan responsables del seu propi desenvolupament, els errors es propaguen més ràpid. Un biaix en la metodologia de millora recursiva no es corregeix al cicle següent. Es multiplica, i els humans estan cada vegada més lluny de controlar-ho.
Els enginyers de IA ja no entrenen models. Models entrenen models.
Anthropic presenta això com un avanç. I tecnològicament ho és. Però operacionalment és un canvi d´època. Els enginyers humans han deixat de ser els constructors de la IA, són els supervisors d’un procés que ja no saben del tot com funciona.
Això explica també per què la seguretat es va deteriorant. ChatGPT acaba de llançar Lockdown Mode per protegir dades contra injecció de prompts. Però la injecció de prompts és un problema sense resoldre precisament perquè els humans no entenen completament com els models interpreten els prompts!
Què en fem, d’això?
Per a les pimes, el missatge és aquest: l’adopció de models d’IA no és una decisió que es pugui posposar indefinidament, perquè el ritme de canvi s’accelera exponencialment i les dinàmiques de mercat es cristal·litzaran cada sis mesos.
Si sou a sectors regulats o treballeu amb dades sensibles (bàncàries, sanitàries, LOPD), la finestra de seguretat s’està tancant. Quan els models es milloren a si mateixos, la garantia que ofereix el proveïdor es debilita. I van sortint petits pegats, com Lockdown Mode de ChatGPT però no son la solució.
El consell pràctic: identificar quins processos són candidats a automatització amb IA i quins necesitaran quedar fora de sistemes connectats en els propers sis messos. Perquè potser s’acosten temps on la IA començarà a ser racionada, per pura física.
Qui decideixi ara quins casos d’ús són crítics tindrà accés. Els altres quedaran a la cua.