Saltar al contenido principal
Tecnología#10

Construí la herramienta equivocada para mi hermana

Cómo un audio de 15 minutos por WhatsApp me hizo entender que el mejor código no sirve si entendiste mal el problema.

Alejandro Exequiel Hernández Lara
Alejandro Exequiel Hernández Lara
9 min de lectura
Pantalla táctil con onda de audio en rojo sobre fondo oscuro

Trescientas mil pesos.

Eso es lo que mi hermana publicó en Instagram un viernes 13 de marzo buscando a alguien que la ayudara durante dos semanas con un trabajo que, según ella, era interminable. Vi su historia a las 12:45 y le respondí de inmediato. Esa misma tarde nos vimos en el cumpleaños de unos primos y le pregunté cómo le había ido con la búsqueda. Me contó que ya habían encontrado a una chica que empezaba el lunes. Y después, como pasa siempre en las fiestas familiares, la conversación se fue por donde no estaba planeada.

Ciento dos tomos

Silvana estudia derecho y trabaja en un estudio jurídico. Me contó que estaban llevando un caso penal grande — una causa por mal uso de gastos reservados en Carabineros, con decenas de imputados y años de investigación acumulada. El estudio representa a uno de ellos. Y el problema de Silvana no era el caso en sí, sino la montaña de papel que venía con él.

La carpeta investigativa del caso tiene ciento dos tomos. Ciento dos archivos PDF, cada uno de entre trescientas y ochocientas páginas, llenos de documentos que se fueron acumulando sin orden cronológico ni temático. Declaraciones, oficios, cartolas bancarias, informes periciales, fotocopias, escaneos — todo mezclado, todo desordenado, repartido en miles y miles de páginas.

Su trabajo era cruzar esos ciento dos tomos con un documento de acusación para llenar un Excel con datos específicos de cada documento: número de tomo, rango de páginas, número de prueba en la acusación, tipo de prueba, fecha, una descripción breve del contenido, si tenía relación con el imputado que ellos representan, quién firmó el documento, y quién lo recepcionó.

Para cada fila del Excel, el proceso era el mismo: abrir un tomo, identificar un documento, ir al archivo de acusación, buscar si ese documento aparecía como prueba testimonial, documental, pericial o de otro tipo, anotar el número correspondiente, volver al tomo, extraer los datos, llenar cada columna. Siguiente documento. Siguiente tomo. Ciento dos tomos.

Trescientas mil pesos por dos semanas de ayudante para hacer eso a mano.

Cuarenta y ocho horas

Mientras me lo contaba, en mi cabeza ya estaba escribiendo código. Diez años construyendo software te hacen eso — escuchas un proceso manual y automáticamente empiezas a diseñar la solución. Esa noche, cuando llegué a mi departamento, tenía la arquitectura más o menos clara. El domingo 15 de marzo, dos días después del cumpleaños, ya tenía un prototipo desplegado. Le mandé un link para que lo probara.

Cuarenta y ocho horas del cumpleaños al deploy. Subías un PDF, te devolvía un Excel con los datos extraídos.

Me sentí orgulloso.

Pero lo que Silvana necesitaba no era extraer datos de un PDF. Era cruzar información entre decenas de documentos, interpretar el contexto legal de cada uno, identificar si un documento correspondía a una prueba testimonial o documental dentro de la acusación, encontrar números correlativos que el fiscal había asignado siguiendo el orden de los tomos, y determinar si cada documento tenía alguna relación — cualquier relación — con el imputado que ellos defienden. Una mención, una firma, un nombre en una lista.

Mi prototipo hacía algo útil en abstracto, pero no resolvía su problema real. Había construido la solución para el problema que entendí entre empanadas y bebidas en un cumpleaños, no para el problema que ella tenía todos los días sobre su escritorio.

Le pedí que me explicara todo con detalle para poder hacerlo bien. Y confió en mí sin dudarlo.

Quince minutos

El martes 17 de marzo me mandó tres cosas por WhatsApp: un audio de quince minutos, otro de dos, y un video de siete. Veinticuatro minutos de contenido. Me explicó la causa completa desde el inicio — cómo se originó la investigación, por qué la carpeta investigativa era tan grande, cómo estaban organizados los tomos, qué significaba cada columna del Excel, cómo se diferenciaba la prueba testimonial de la documental, por qué la exactitud en los números de acusación era crítica, y qué significaba cada campo de firma y recepción.

El video lo vi. Los audios los miré y pensé: esto es demasiado para procesarlo de oído.

Quince minutos de audio de WhatsApp no se escuchan como quince minutos. Se escuchan como una hora cuando intentas tomar notas. Pausar, escribir, retroceder, volver a escuchar, darte cuenta de que perdiste un detalle tres minutos atrás. Y en este caso, cada detalle importaba. Si confundía un tipo de prueba, si asumía mal cómo se cruzaban los documentos con la acusación, si no entendía la diferencia entre un documento suscrito y uno recepcionado, iba a terminar construyendo la herramienta equivocada por segunda vez.

No podía permitirme eso.

Vamos lentísimoooo

Desde el 17 de marzo no retomé el tema. No porque no me importara, sino porque sabía que construir sin entender bien era exactamente el error que acababa de cometer. Y Silvana tenía su ayudante. El trabajo iba a avanzar.

¿No?

El domingo 29 de marzo, a las 22:39, le mandé un mensaje: «¿Cómo te ha ido con el tema?»

Seis minutos después: «Vamos lentísimoooo».

Respondió al tiro. Un domingo a las diez de la noche, en seis minutos, porque el problema seguía ahí encima de ella. Casi dos semanas después de contratar ayuda, con una persona dedicada exclusivamente a esto, y seguían avanzando lento. Porque el trabajo es inherentemente lento cuando es manual. No importa cuántas manos le pongas — si el proceso es abrir un PDF de quinientas páginas, buscar un nombre, cruzar datos con otro documento, y llenar un Excel celda por celda, va a ser lento. Siempre.

Esa noche me senté en mi oficina, en la habitación del fondo de mi departamento en Puente Alto, y abrí la conversación con los audios de Silvana. Pero no abrí el editor de código. Todavía no. Abrí los audios y pensé: si voy a hacer esto bien, primero necesito capturar cada palabra de lo que me dijo. Sin asumir. Sin interpretar de oído. Sin perder nada.

Y ahí apareció la pregunta: ¿por qué estoy a punto de pasar cuarenta minutos transcribiendo un audio a mano si puedo construir algo que lo haga en treinta segundos?

Voxcribe

Así nació Voxcribe.

Voxcribe toma un archivo de audio, lo transcribe usando inteligencia artificial, analiza el contenido para generar un título y un resumen del contexto, y te entrega un PDF profesional listo para descargar. Subes el audio, esperas unos segundos, y tienes un documento con toda la información estructurada — listo para leer, compartir, o pasarle a una IA para que te ayude a aterrizar el problema.

Que es exactamente lo que necesito hacer. Transcribir los audios de Silvana, tener la transcripción completa negro sobre blanco, y sentarme a diseñar la solución correcta. Esta vez sin asumir nada. Esta vez con los requerimientos exactos.

Y ahora tengo exactamente eso.

A las 2:15 de la mañana del 30 de marzo hice push de la primera versión. Minutos después la probé con los audios reales de Silvana — los mismos que me había mandado el 17 de marzo y que llevaban casi dos semanas esperando en mi WhatsApp. El audio de quince minutos se convirtió en un PDF de cuatro páginas con la explicación completa del caso, la estructura de los ciento dos tomos, los tipos de prueba, y cada detalle que necesito para construir la herramienta que realmente le sirva. El de dos minutos capturó una aclaración sobre la prueba testimonial que habría sido fácil de perder escuchando a mano.

A las 2:21 AM, el MVP estaba validado. Con los audios reales. Con el caso real. Con la certeza de que no se perdió ni una palabra.

Voxcribe no era el proyecto que yo quería construir. Yo quería construir la herramienta que le resuelva el problema a Silvana — esa viene después y se llama Herlax. Pero para hacerlo bien, primero necesitaba escuchar de verdad. Y para escuchar de verdad un audio de quince minutos sin perder un solo detalle, necesitaba Voxcribe.

Lo construí para mí. Pero cualquier persona que recibe audios largos — reuniones, instrucciones, entrevistas, feedback de un cliente — tiene el mismo problema. Yo necesitaba entender a mi hermana. Alguien más necesita entender a su jefe, a su cliente, a su equipo.

Porque «vamos lentísimoooo» no es una frase que quiero volver a escuchar. Y trescientas mil pesos por dos semanas de trabajo manual es un precio que nadie debería tener que pagar cuando la tecnología puede hacerlo mejor.

Probar Voxcribe gratisVoxcribe está disponible y es gratuito en kainext.cl/tools/voxcribe.

A veces el mejor producto que puedes construir no es el que tenías en mente, sino el que necesitas para llegar ahí.

Artículos Relacionados

Más contenido que podría interesarte

¿Necesitas ayuda con tu proyecto?

Solicita una evaluación técnica gratuita para discutir tu desafío y explorar cómo trabajar juntos.

Compartir artículo

Compártelo con tu equipo y síguenos para más contenido.