0:00
/

Guía de los seis pasos clave para que Sora 2 haga lo que quieres

El prompt debe ser sencillo, claro, preciso y completo. Pero no es tan fácil como parece.

Sora 2 es el último modelo de generación de vídeo multimodal ofrecido por OpenAI. El prompt (texto que le das) debe guiar con claridad lo que quieres ver: personajes, acción, estilo, cámara, sonido, etc.

Paso a paso: cómo construir un buen prompt para Sora 2

Esta es una guía con pasos (y observaciones de mis batallas con prompts) para que puedas hacer esto bien desde el inicio.

Cada paso lo puedes ver como un “bloque” que se puede adaptar, quitar o modificar, según lo que necesites.

Paso 1

Define la escena general (“prose scene description”)

Describe personajes, entorno, ambientación, estado de ánimo. No basta “un bosque” sino “un denso bosque con neblina matinal, árboles altos, hojas húmedas brillando”.

Paso 2

Cinematografía

Indica encuadres, ángulos, movimientos de cámara si los quieres. (“Toma amplia desde el suelo”, “paneo lateral lento”)

Paso 3

Acciones claras en “beats”

En lugar de “el actor camina,” haz algo como “el actor da tres pasos, gira hacia la ventana, pausa medio segundo y extiende la mano al cristal”. Esa precisión le da más control al modelo.

Paso 4

Iluminación y paleta de color

No digas “bien iluminado” — di “luz difusa desde ventana izquierda, relleno cálido amortiguado, borde azul desde fondo; paleta: ámbar, crema, gris pardo”

Paso 5

Diálogo / audio / ambiente

Si hay diálogo, ponlo claramente en bloque “Dialogue:” con quién dice qué. Si no hay diálogo, puedes sugerir un sonido breve o ambiente: “susurro de viento”, “clic mecánico”.

Paso 6

Referencia visual (opcional pero poderoso)

Si tienes una imagen que refleje lo que quieres, úsala como “input_reference” junto con el prompt. Eso “ancla” estilo, personajes, ambientación.


Ejemplo completo

Para que no quede en teoría, te muestro cómo quedaría un prompt “serio” siguiendo estos pasos (a ver qué tal):

A cramped, windowless room with walls the color of old ash. A single bare bulb dangles from the ceiling, its light pooling onto the scarred metal table at the center. Two chairs face each other across it. On one side sits the Detect­ive, trench coat draped across the back of his chair, eyes sharp and unblinking. Across from him, the Suspect slouches, cigarette smoke curling lazily toward the ceiling. The silence presses in, broken only by the faint hum of the overhead light.

Cinematography:

Camera shot: medium shot, eye level, slowly dollying in

Mood: tense, noir, claustrophobic

Actions:

- Detective leans forward, tapping fingers on the table three times

- Suspect shifts uncomfortably, then exhales smoke upward

- Suspect raises his head slowly in the final beat

Dialogue:

- Detective: “You’re lying. I can hear it in your silence.”

- Suspect: “Or maybe I’m just tired of talking.”

- Detective: “Either way, you’ll talk before the night’s over.”

Background sound: hum of overhead light, distant faint drip of water

Ese es un buen prompt ya “listo para disparar” con Sora 2 (o con Sora, si el sistema acepta ese nivel de instrucciones). Es claro, dividido en bloques, con acciones específicas, diálogo, sonido, cámara y ambiente.

Una muestra de lo mismo, pero hecho con Grok:

Recomendaciones adicionales (mi propio “manual de guerra”)

  • Prompts siempre en inglés. Una vieja manía.

  • Comienza con una imagen fija de referencia. Ganas mucho tiempo.

  • Empieza con prompts simples y ve escalando complejidad. Si algo falla mucho, simplifica primero (menos movimiento, menos diálogo) y luego añade capas.

  • No intentes forzar lo imposible (por ejemplo: “flotar en gravedad cero mientras salto hacia arriba y grito al mismo tiempo” puede romper la física interna del modelo).

  • Ten varias versiones del prompt para comparar qué matices funcionan mejor.

  • Observa cómo Sora responde y ajusta lenguaje: a veces un “pausa” funciona mejor si dices “pausa medio segundo” que “pausa”.

  • Guarda versiones que funcionen como plantilla para reutilizar.

  • Revisa, repasa, limpia, itera y edita.

(Algo parecido con Avatar IV de HeyGen)


Enlaces


Lo último

(El primer vídeo no está creado con Sora. Bueno, sí, pero también con un agente).

Discusión sobre este video

Avatar de User

Por supuesto, sigue adelante.