← Inicio/Estructuras de Video
Puente de EmpatiaActiva~33s (flexible con Gemini)

Arco emocional

Identificacion → Alivio → Contagio emocional → Accion

El espectador se reconoce en el conflicto (beat 2), siente alivio cuando aparece la solucion (beat 3), se contagia de la emocion de quien recibe el regalo (beat 4), y actua guiado por un cierre silencioso y cargado (beat 5). La cancion reinicia en el chorus justo cuando entra la prueba social — esa es la palanca emocional principal.

Musica

B1alto 0.80
B2bajo 0.16
B3bajo 0.16
B4CORTE + reinicio alto 0.80
B5alto 0.80

Voz avatar

B1muda 0.0
B2clara 1.0
B3clara 1.0
B4susurro 0.25
B5muda 0.0

Beats (5)

Pulsa en un beat para ver el detalle completo: avatar, prompt Veo y notas de edicion.

1
hook_reaccionCuriosidad4s

Persona mirando el movil con sorpresa/curiosidad, micro-expresion natural, no habla.

Avatar Reaccionveo3 (quality)
2
conflictoEmpatia~8s (flexible — Gemini detecta fin de habla)

Persona hablando a camara casualmente sobre un problema, gestos naturales, tono calido.

Avatar Conflictoveo3 (quality)
3
solucionAlivio~8s (flexible — Gemini detecta fin de habla)

Misma persona sosteniendo el movil mostrando una web, explicando calmadamente. Pantalla visible.

Avatar Solucionveo3 (quality) — multi-imagen: avatar + screenshot web
4
prueba_socialTernura8s

MISMA persona, MISMO fondo, MISMO encuadre — expresion mas intensa: ojos llenandose de lagrimas, sonrisa emotiva. Puede susurrar UNA palabra muy corta. NO subtitulos Whisper.

Avatar Reaccion v2veo3 (quality)
5
ctaTernura5s

Las dos personas abrazandose con fuerza, ojos cerrados, sonrisas genuinas, lagrimas de alegria, momento silencioso. NO hablan. Luz natural suave.

Avatar Abrazoveo3 (quality) — multi-imagen: 2 avatares

FFmpeg — receta de edicion

Canvas: 1080x1920, 30fps, H.264 yuv420p, CRF 18, AAC 192k 48kHz estereo

Safe areas IG/FB feed: arriba y=260px, abajo y=1520px, CTA centro y=780px

Zoom zoompan centrado: x=iw/2-(iw/zoom/2), y=ih/2-(ih/zoom/2)

Subtitulos Whisper: filtro subtitles= con ASS force_style (Arial, fondo blanco, borde negro)

Subtitulos fallback: drawtext estatico si Whisper falla

Audio: amix con normalize=0 para no perder pegada cuando la voz esta a 0

Concatenacion: demuxer concat con -c copy (streams normalizados identicos)

Reglas dinamicas

Duracion flexible: Gemini Flash analiza clips con voz (beats 2/3) segundo a segundo. Detecta cuando deja de hablar y FFmpeg corta ahi. Esto reemplaza duracionObjetivoSeg.

La misma logica aplica a todas las estructuras futuras donde hable el avatar.

Cada beat tiene su propio proceso de creacion de avatar con NanoBanana 2:

Beat 1 (hook): avatar reaccion DESDE CERO. Beat 2 (conflicto): avatar principal DESDE CERO con fondo dinamico.

Beat 3 (solucion): usa avatar conflicto como REFERENCIA → nueva foto con movil + screenshot. Fondo distinto.

Beat 4 (prueba social): usa avatar hook como REFERENCIA → misma persona, MISMO fondo, expresion mas intensa.

Beat 5 (CTA): combina avatar conflicto + avatar reaccion → foto de abrazo. Fondo del avatar reaccion.

Los agentes deciden las situaciones y fondos concretos (calle, jardin, cocina...) segun el perfil del pais.