logo
tonny.wtf
Published on

Una skill de Manim para preparar explicaciones visuales

Authors

He visto una skill para generar animaciones con Manim a partir de lenguaje natural y creo que la lectura interesante no es “ahora la IA hace vídeos de mates”.

A mí esto me toca bastante de cerca porque, cuando explico cosas en clase o preparo presentaciones sobre IA generativa, muchas veces el problema no es entender la idea. Es encontrar una forma clara de contarla visualmente sin meterme una tarde entera de código y ajustes.

Por eso la lectura interesante para mí es otra:

cuando una herramienta potente pero tediosa se convierte en una skill, cambia quién puede usarla y cómo se itera sobre ella.

Y eso sí importa.

El valor no está en la animación final. Está en quitar el peaje de entrada

Manim lleva tiempo siendo una de esas herramientas que todo el mundo respeta y poca gente quiere tocar a mano salvo que le compense mucho.

Tiene sentido.

El resultado puede ser excelente, pero el proceso suele exigir demasiado trabajo mecánico:

  • pensar la narrativa visual,
  • traducirla a escenas,
  • escribir código,
  • ajustar tiempos,
  • renderizar,
  • corregir errores tontos,
  • y volver a iterar.

No es que sea imposible. Es que tiene un coste de arranque alto.

Por eso me parece interesante que empiecen a aparecer skills que atacan justo esa fricción. No prometen magia total. Prometen algo más útil: pasar de página en blanco a primer borrador funcional mucho más rápido.

Y en este tipo de herramientas, ese salto ya cambia bastante el juego.

Lo importante no es “texto a vídeo”. Es “idea a borrador ejecutable”

Hay mucho discurso superficial alrededor de cualquier cosa que suene a generación automática de vídeo.

Pero aquí, al menos para mí, el punto no es ese.

El punto es que una explicación técnica que antes requería dominar bien una librería concreta ahora puede empezar con algo mucho más simple:

  • “explica cómo funciona backpropagation”,
  • “enséñame quicksort paso a paso”,
  • “construye este diagrama de arquitectura por capas”,
  • “anima el antes y después de estos datos”.

Eso no elimina el trabajo de criterio.

Lo desplaza.

En vez de invertir tiempo en el boilerplate inicial, puedes invertirlo en algo bastante más valioso:

  • si la explicación tiene sentido,
  • si el ritmo visual acompaña,
  • si la simplificación es correcta,
  • y si la historia que cuenta la animación realmente enseña algo.

Dicho de otra forma: te deja iterar sobre la explicación, no sobre la font de LaTeX o el placement de cada objeto desde cero.

Me interesa más como interfaz que como demo

Este tipo de skill se puede leer de dos maneras.

La lectura de demo es la típica:

  • mira qué bonito,
  • mira qué rápido,
  • mira que ya hace vídeos como si tuvieras un pequeño 3Blue1Brown en casa.

La lectura útil es menos espectacular:

  • Manim sigue debajo,
  • sigue habiendo escenas complejas que requerirán retoque,
  • sigue haciendo falta gusto visual y criterio pedagógico,
  • pero ahora hay una capa que empaqueta planificación, código, render y stitching.

Eso convierte una librería en una interfaz.

Y cuando una librería se convierte en una interfaz, normalmente pasan tres cosas:

  1. más gente se atreve a usarla,
  2. los expertos tardan menos en producir un primer draft,
  3. y el cuello de botella se mueve del “saber picar la herramienta” al “saber qué quieres contar”.

Ese tercer punto es el más interesante.

El patrón se repite en muchos sitios

Esto no va realmente de Manim.

Va de un patrón bastante más amplio que estamos viendo una y otra vez con agentes y skills:

  • herramientas buenas pero incómodas,
  • flujos potentes pero manuales,
  • y una capa nueva que encapsula pasos, criterio operativo y automatización suficiente para arrancar mejor.

Lo estamos viendo en código, en análisis documental, en research, en automatizaciones y ahora también en piezas visuales.

Por eso creo que este tipo de skill tiene más valor del que parece si sólo la miras como curiosidad creativa.

No porque sustituya al experto.

Sino porque comprime el trabajo de preparación.

Y en casi cualquier flujo técnico, comprimir el trabajo de preparación suele ser una de las mejoras más rentables que puedes introducir.

Donde sí veo utilidad real

Veo bastante sentido en cuatro tipos de uso.

1. Explicación técnica interna

Para equipos que necesitan explicar conceptos complejos dentro de producto, ingeniería o data, tener un borrador animado rápido puede ahorrar muchas horas de documentación mediocre o presentaciones demasiado estáticas.

2. Clases, talleres y presentaciones técnicas

Aquí es donde más lo conecto con mi trabajo reciente.

Cuando hablo de IA generativa, embeddings o cómo aprende un modelo, muchas veces sé perfectamente qué quiero explicar, pero no siempre compensa construir a mano el soporte visual desde cero.

Una pipeline así me resulta útil justo por eso: me permite preparar antes un borrador visual decente para una clase o una presentación, verlo, corregirlo y quedarme con la parte que realmente ayuda a entender la idea.

No porque salga perfecto a la primera, sino porque el umbral de esfuerzo baja mucho.

3. Contenido educativo especializado

Si ya publicas contenido técnico, una pipeline así puede hacer viable producir piezas que antes no compensaban por coste.

No porque salgan perfectas a la primera, sino porque el umbral de esfuerzo baja.

4. Visualización de algoritmos o sistemas

Aquí me parece especialmente útil, porque muchas ideas de software se entienden mejor cuando se ven construirse paso a paso.

5. Iteración con stakeholders

En vez de discutir una idea abstracta sobre cómo debería verse una explicación, puedes enseñar un draft renderizado y corregir sobre algo tangible.

Eso siempre acelera.

Donde todavía no compraría demasiado hype

También creo que conviene no vender esto como algo resuelto.

Las escenas simples probablemente entren muy bien en el molde.

Pero en cuanto sube la complejidad de verdad —múltiples escenas, cámaras, ritmo fino, composición más exigente, transiciones delicadas— lo normal es que siga haciendo falta intervención humana.

Y eso no invalida la skill.

Simplemente aclara cuál es su papel real:

no reemplaza el trabajo creativo serio; reduce el coste de llegar a una base utilizable.

Ese matiz importa mucho, porque evita dos errores típicos:

  • esperar automatización total donde todavía no la hay,
  • o despreciar una herramienta útil sólo porque no resuelve el 100% del proceso.

Mi tesis

La parte importante de estas skills no es que “la IA ahora también hace animaciones”.

La parte importante es que estamos viendo cómo muchos entornos potentes pero poco accesibles empiezan a convertirse en sistemas mucho más iterables.

Y cuando eso pasa, normalmente no gana el que mejor escribe prompts llamativos.

Gana el que usa esa nueva interfaz para pensar mejor, probar antes y refinar más deprisa.

En este caso, Manim no deja de ser complejo.

Pero si una skill consigue que el punto de partida sea un borrador útil en vez de un lienzo vacío y una tarde perdida de boilerplate, ya ha hecho una parte muy valiosa del trabajo.