Durant mesos hem parlat molt de textos, imatges, àudio… però sabíem que tard o d’hora el vídeo seria el següent gran pas. I aquest moment ha arribat. La publicació de Veo 3, el nou generador de vídeo de Google DeepMind, marca un punt d’inflexió que justifica començar a mirar el vídeo generat per IA com una eina real, no només una promesa de futur.
Ja no estem parlant de vídeos borrosos de 2 segons amb formes deformades. Ara comencem a veure vídeos fluids, amb càmera en moviment, amb coherència d’escenes i estètica cinematogràfica. I això obre una nova etapa per a creadors, empreses i qualsevol persona que vulgui explicar una història… sense càmera. Però com sempre, cal separar el que és realment usable del que encara està en fase beta. Fem un repàs clar i pràctic del que pot fer (i què no) la IA de vídeo .
Què podem fer amb Veo 3 i altres eines?
Veo 3 és el model de vídeo més avançat que ha mostrat Google fins ara. Permet generar clips de fins a un minut de durada, amb resolució 1080p, múltiples estils (cinema, time-lapse, animació, etc.) i una fluïdesa sorprenent. Però no és l’únic. Altres plataformes com Runway Gen-3, Pika Labs o Luma Dream Machine també estan mostrant un salt qualitatiu notable.
Aquestes eines permeten:
- Generar vídeos a partir de text (“una ciutat futurista enmig d’un bosc tropical”).
- Transformar imatges estàtiques en seqüències animades.
- Fer estilitzacions o interpolacions entre fotogrames.
- Ampliar vídeos reals amb efectes o continuacions.
És a dir, començar a construir vídeo com si fos disseny gràfic. Amb paraules, idees, estils. I això comença a ser un canvi radical. Tot i així estem “en construcció” i hi ha coses que comencen a tenir sentit i d’altres que encara cal millorar.
Què funciona bé avui?
Quines són les funcionalitats “acceptables” i que si les encarreguem a aquestes eines no ens decebran? Veiem uns exemples.
- Clips curts i visuals: vídeos de 5 a 15 segons amb una estètica cuidada, fons atractius, moviments de càmera realistes i bon control de la llum.
- Estils artístics o abstractes: quan no cal una fidelitat realista, la creativitat visual vola. Veo, Runway o Pika permeten crear vídeos tipus animació, collage o “moodboard” molt impactants.
- Vídeo com a suport de contingut: per il·lustrar idees en vídeos de presentació, storytelling digital, xarxes socials o música, aquests clips són un recurs ràpid i barat.
- Complementar produccions reals: es poden generar fons, transicions o elements decoratius per combinar amb vídeo gravat.
Què encara no funciona (massa) bé?
Però, com deia el poeta, tot està per fer i tot és possible, així que hi ha sol·licituds que encara no estan prou treballades per donar un resultat coherent:
- Narrativa complexa: costa fer vídeos amb estructura narrativa. Els personatges no mantenen coherència, ni l’estètica, ni les accions entre escenes. És més fàcil fer un tràiler que una història.
- Expressions humanes realistes: les cares, gestos i detalls encara cauen en la zona incòmoda del “quasi, però no prou”. Algunes vegades és fascinant, altres una mica inquietant.
- Control de moviments i transicions: tot i que millora, encara és difícil aconseguir seqüències controlades: comença amb una escena i acaba en una altra totalment diferent, sense avís.
- Relació cost/eficiència: els models més avançats encara són privats o cars, i generar vídeos amb resolució alta i coherència pot portar minuts (o hores) i molts recursos.
Tot això ho comento mentre escric aquest article, però potser la setmana vinent, he de començar a esborrar temes de la llista, perquè els nous models aviat (si no ja) em faran quedar malament…
Llavors… ja puc fer servir vídeo per a la meva empresa o projecte?
Depèn. Però la resposta curta és: sí, si saps què vols i què esperar. Per exemple:
- Si vols fer vídeos per xarxes socials, reels, tiktoks o presentacions visuals, aquestes eines són perfectes per crear escenes d’impacte ràpidament.
- Si ets una agència o freelance creatiu, pots començar a oferir serveis visuals nous sense càmeres ni rodatges.
- Si tens una idea per a un vídeo i no tens pressupost, pots fer prototips visuals que transmetin el to o l’estil.
- Si ets educador, formador o divulgador, pots enriquir els teus materials amb visualitzacions úniques.
El que no pots fer (encara) és confiar-hi per produccions llargues, vídeos d’empresa corporatius o documentals. L’aparició de Veo 3 i la millora general de les eines de vídeo per IA ens diuen una cosa clara: ja ha començat la nova era de la creació audiovisual assistida per IA. No substituirà la producció professional, però pot canviar completament com pensem el contingut visual, com el generem i com el distribuïm. Com tot canvi profund, no és immediat ni màgic, però és inevitable.
I potser, d’aquí molt poc, fer un vídeo serà tan senzill com escriure un paràgraf, mes o menys llarg, però un paràgraf!