- Published on
Voxtral 4B TTS no me parece interesante por ser otro modelo de voz, sino porque confirma algo más importante: el audio empieza a convertirse en una capa fundacional del stack de agentes. Y no llega solo: Cohere también ha movido ficha con Transcribe 2B.
