Vamos paso a paso, desde la chispa creativa hasta el vídeo final, usando ChatGPT, Gemini, Midjourney, ElevenLabs, Kling y sí, también nanobanana, que suena a startup pero existe.
No es magia. Es un proceso. Y un poco de caos controlado.
🧠 1. La idea creativa (o cómo fingir que tienes una)
Todo empieza con una idea. O con algo peor: “quiero un vídeo guay”. Aquí entra ChatGPT como terapeuta creativo.
Le dices:
“Quiero un vídeo corto sobre X, tono Y, público Z. Dame 5 conceptos.”
ChatGPT hace lluvia de ideas sin juzgarte (no quiere que quedes mal). Tú eliges una. O mezclas tres. O te arrepientes. Normal.
Resultado:
– concepto
– mensaje central
– tono
– duración aproximada
Todavía no hay imágenes. Solo intención. Esto es importante, aunque suene a frase de coach.
✍️ 2. El guion (cuando el vídeo empieza a hablar)
Con la idea clara, le pides el guion. Aquí ChatGPT se luce.
Pídele:
– guion técnico o narrativo
– versión corta (30–60s)
– texto pensado para locución
Tip realista: dile que escriba para ser escuchado, no leído. Si no, suena a manifiesto.
Aquí ya tienes:
– estructura
– ritmo
– texto de voz
El vídeo ya existe. Solo que nadie puede verlo todavía.
🖼️ 3. El storyboard (dibujos sin dibujar)
Storyboard = cada escena descrita como si supieras de cine.
ChatGPT o Gemini pueden hacer esto:
– escena 1: plano, acción, emoción
– escena 2: cambio de ritmo
– escena 3: cierre
No hay dibujos. Hay descripciones visuales. Y eso es oro para la siguiente fase.
🧩 4. Prompts para imágenes (el idioma secreto)
Aquí suele morir la gente. Tú no. Aqui usamos mucho ロMidjourneyロ -- MJ Prompt Generator (V6). Un GPT de ChatGPT especializado en currase los prompts. Si te fijas es una versión antigua, pero funciona mejor que la moderna.
Puedes usar ChatGPT como “traductor mental” para Midjourney:
La idea es que convierta cada descripción de este storyboard en prompts detallados para Midjourney, estilo cinematográfico, con variedad en las escenas. Con distintos estilos. (Ya veremos el porqué).
Obtienes prompts con:
– estilo visual
– iluminación
– encuadre
– atmósfera
– detalles técnicos de especialista en fotografía
Esto ahorra horas y crisis existenciales. Aunque nada te quita de probar, probar y probar.
🎨 5. Las imágenes (Midjourney hace su magia)
En Midjourney generas:
– una imagen por escena
– varias versiones
– seleccionas las buenas
Consejo no romántico: guarda los prompts finales. Son más valiosos que las imágenes.
Aquí ya tienes los “fotogramas” del vídeo.
🎞️ 6. Animación y vídeo (las imágenes cobran vida)
Ahora podrían entrar Kling o nanobanana.
Puedes subir las imágenes y les dices:
– duración
– tipo de movimiento
– suavidad
– estilo (realista, slow, épico, minimal)
El resultado no es Pixar. Pero tampoco PowerPoint. Es algo nuevo. Y funciona.
Sin embargo nosotros hemos utilizado de nuevo a Midjourney, con frame de inicio en una imagen, y frame de final en otra. Y nos hemos trabajado el prompt de la transición. Porque lo hace muy bien.
🎙️ 7. Locución (voces que no existen)
Con ElevenLabs:
– eliges voz
– ajustas emoción
– subes el guion
– generas audio
Suena demasiado bien. Ese es el problema y la ventaja.
Tip ético: no imites a personas reales. El karma es lento, pero llega.
En nuestro caso, esta es una voz 100% sintética, definida y diseñada por nosotros. Ojo, todavía pensamos que se puede llegar más lejos. Un buen locutor humano podría haberlo hecho mejor.
🧪 8. Montaje final (donde todo encaja)
Juntas:
– vídeo animado
– locución
– música (también IA si quieres)
Puedes usar editores clásicos o flujos automáticos. Aquí ya no es IA pura. Es criterio humano. En cualquier caso, es algo pendiente en el mundo IA. Sus montajes tienen menos alma que un guijarro. Pero algo tendremos que hacer nosotros hasta que creemos el primer agente con gusto y estética.
El resultado: un vídeo que hace un año necesitaba un equipo entero.
Ahora lo hiciste tú, en pijama.
🤔 Lo importante no es la herramienta, es el flujo
ChatGPT no “hace vídeos”.
Midjourney no “entiende historias”.
Kling no “piensa”.
Pero juntos, bien orquestados, hacen algo inquietantemente eficaz.
Esto no elimina la creatividad. La desplaza. Ahora tu trabajo es decidir, no ejecutar.
Y sí, a veces da vértigo.
❓ FAQ rápida
¿Necesito saber diseño o vídeo?
No. Necesitas saber pedir cosas.
¿Cuánto tiempo lleva?
De horas a días. Antes eran semanas.
¿Es barato?
Más barato que un equipo humano. Más caro que no hacer nada.
¿Sirve para marcas y educación?
Sí. Especialmente ahí.
¿Esto reemplaza a profesionales?
No. Cambia lo que hacen. Y eso incomoda.















