🚀 Vídeo: Houston, ya no tenemos problemas

El uso creativo de la Inteligencia Artificial Generativa ha dado un nuevo salto con las últimas actualizaciones de las herramientas más populares.

IA Para Todos

dic 07, 2025

Como ya sabéis, en ParaTodosIA intentamos hacerlo todo con IA. Uno de los ámbitos más apasionantes es el desarrollo creativo desde la conceptualización hasta la pieza final, en este caso un vídeo.

💡Cómo está hecho

Lo primero es la idea. Ni siquiera el guion, la idea. Una de las maneras más útiles de empezar a trabajar es con un LLM de un razonamiento ya avanzado, no recuerdo si Gemini 3 o ChatGPT 5. Lo que hacemos es pelotear con el chat a partir del planteamiento de cómo mostrar la utilidad del incremento de productividad con IA en distintos ámbitos profesionales. Como el que trabaja con un ayudante que te va dando feedback e ideas, el control del proceso es completamente humano, pero ese ir y venir de ideas sirve para combatir el folio en blanco y ahondar en los elementos que nuestra intuición puede considerar más válidos.

Una vez identificado el ámbito profesional (unos astronautas con una lista interminable de tareas), el siguiente paso es crear un guion, todavía en el mismo hilo del LLM. En el guion ya se definieron cosas como el elemento dramático de la reentrada (idea de la IA) o el contrapunto cómico de la llamada a Houston y que Houston respondiera que no, que no había ningún problema (esta parte es humana).

📝Del guion al storyboard

El siguiente paso es el tratamiento gráfico de imagen que queremos dar a la historia. Podía ser realista, estilo manga, legos, lo que quieras. Después de varias pruebas (algunas muy bizarras), nos decantamos por un aspecto más o menos realista pero antiguo de la cápsula espacial por fuera, y un estilo de stop-motion de plastilina para los personajes y el interior.

Para ello usamos GPTs de chatGPT para crear prompts y definir el estilo de imagen de partida con Midjourney.

Con el estilo y los personajes definidos en formato storyboard, usamos las imágenes para llevarlas a NanoBanana y generar los momentos independientes de nuestros Astronautas (Buzz, Armstrong y Mary). La capacidad de edición multimodal nos dio las imágenes finales de INICIO y de FIN de lo que iba a ser cada uno de los vídeos.

📹El audio y los clips de vídeo

Con el guion y el storyboard, pasamos a la generación de las voces de cada protagonista. Todas generadas con ElevenLabs como voces sintéticas hechas específicamente para el vídeo (sin problemas de derechos).

Una vez que teníamos las voces, optamos por una doble estrategia para generar los clips de vídeo: aquellos que no tenían audio de personaje, los hicimos con Flow (de Google AI Studio). Por ejemplo, la nave, el ratón, las pantallas, etc. Y los clips con ‘diálogo’, con Kling AI, la herramienta china de vídeo (aunque ya hace de todo, como todas), pero que para nuestro gusto es especialmente buena para poner en boca los audios.

También hay muchos audios, como los sonidos del ratón o los gritos, que generó la herramienta de vídeo (ya fuera Kling o Flow).

🎬La edición

La edición final la hicimos con Veed, pero podíamos haber usado Capcut o cualquier otra. Todavía echamos en falta algún tipo de agente que una ves producidos los clips, sea capaz de montarlos con tino y gusto. Pero todo llegará.

Por último, por supuesto, toda la música fue generada con Suno a partir de prompts de texto.

❓ FAQ del proyecto: el vídeo IA de astronautas que ya no tienen problemas

1. ¿De dónde salió la idea del vídeo?

De una sesión de peloteo con un modelo de lenguaje avanzado. Tú lanzas una idea vaga sobre productividad con IA y el sistema devuelve giros narrativos que te ayudan a escapar del típico folio en blanco. La chispa humana sigue ahí; la IA solo empuja.

2. ¿Cómo se escribió el guion?

Primero se fijó el escenario profesional: astronautas saturados de tareas. Sobre eso, un LLM ayudó a plantear momentos dramáticos como la reentrada y tú aportaste el humor de la llamada a Houston con “no tenemos problemas”. Una mezcla sana de creatividad asistida, vaya.

3. ¿Qué herramientas visuales se usaron para el estilo y los personajes?

El aspecto final nació de combinar prompts generados con GPTs y la producción de imágenes con Midjourney. Luego NanoBanana transformó esos diseños en imágenes clave para el inicio y el final de cada clip. El look de plastilina stop-motion para los personajes le dio alma sin caer en lo genérico.

4. ¿Por qué se mezclaron varias IA de vídeo?

Porque ninguna hace todo bien. Flow (de Google AI Studio) generó planos sin diálogo: nave, ratón, pantallas. Kling AI se encargó de los clips con voz, sincronizando el audio creado en ElevenLabs. Y sí, también produjo efectos sonoros para completar la escena.

5. ¿Qué hay de la edición final?

Se montó en Veed, aunque Capcut o similares habrían servido. Falta un agente que edite con criterio estético de principio a fin, pero todavía nadie lo hace bien. Por eso la edición sigue siendo humana: elegir ritmo, cortes y transiciones que no mareen.