Servei de transcripció d’àudio i vídeo de Softcatalà

La tecnologia ha transformat la manera en què es duu a terme l’educació, i actualment ofereix diverses eines per millorar l’eficàcia de l’ensenyament i facilitar l’aprenentatge. En són un exemple les eines de transcripció d’àudio i vídeo a text, que tenen la capacitat de convertir el contingut parlat en text escrit de manera precisa i ràpida.

En l’àmbit de l’educació, aquestes eines són especialment útils per als estudiants que necessiten accedir a la informació en suport escrit o per a aquells que tenen dificultats auditives. També són útils per als professors, ja que permeten crear subtítols per als materials didàctics, transcriure conferències i presentacions, i elaborar material didàctic accessible per a persones amb necessitats especials.

Al mercat hi ha disponibles diverses eines de transcripció, tant gratuïtes com de pagament, basades en tecnologies de reconeixement de veu. No obstant això, és important tenir en compte que la precisió de la transcripció depèn en gran manera de la qualitat de l’àudio o el vídeo original i de la claredat de la parla.

Softcatalà ofereix un servei de transcripció d’àudio i vídeo a text en català, gratuït i en línia. Té una interfície molt senzilla, que inclou un bloc amb tres camps per emplenar:

1. Model de transcripció. El sistema permet decidir quin dels models de reconeixement de la parla es vol fer servir. Aquests models, basats en el sistema Whisper i creats per l’empresa OpenAI, són resilients al soroll de fons i també prediuen la puntuació i les majúscules. Softcatalà els ha refinat, reentrenant-los amb corpus en català, per millorar encara més la qualitat de la transcripció en la nostra llengua. A més, hi ha diverses variants dels models: com més gran és el model, més bona qualitat proporciona, però tarda més a processar el fitxer. Es recomana fer servir el model mitjà de Softcatalà, ja que és el que té la qualitat més alta.

2. Selecció del fitxer d’àudio o vídeo. En aquest camp s’ha de pujar l’àudio o el vídeo que es vol transcriure. La mida màxima és 1 GB i els formats admesos són MP3, WAV, OGG, FLAC, AVI, MP4, MOV i MKV.

3. Adreça electrònica on es vol rebre l’enllaç per accedir a la transcripció.

Un cop el sistema ha acabat el procés, envia un correu amb l’enllaç a la transcripció, feta amb oTranscribe. El text transcrit es mostra dividit per minuts i es pot escoltar, editar i descarregar.

A més d’oferir aquest servei de transcripció propi, Softcatalà també inclou al seu web una llista d’altres eines (tant gratuïtes com de pagament) per transcriure àudio al català. Es tracta d’opcions addicionals, que poden adaptar-se millor a les necessitats específiques dels usuaris, com ara Dictation, l’opció de dictat de veu de Google Docs o HappyScribe, entre d’altres.

Finalment, en cas que vulguem fer la transcripció en local, Softcatalà recomana utilitzar l’eina Buzz, que es pot descarregar de franc i serveix tant per a Windows com per a macOS.

Unitat de Docència
Centre de Recursos per a l’Aprenentatge i la Investigació de la Universitat de Barcelona

Deixa un comentari

L'adreça electrònica no es publicarà. Els camps necessaris estan marcats amb *