Skip to main content
Data llançament: 2022
Llenguatge: Multi llenguatge
Sistema Operatiu: Web
Tipus Llicència: Obert
Versió gratuïta: Sí
Llicència UB: No
Protecció de dades:

Whisper

Whisper és un sistema de reconeixement automàtic de veu (ASR) entrenat amb 680.000 hores de dades supervisades multilingües recollides del web. Mostrem que l'ús d'un conjunt de dades tan gran i divers comporta una millora de la robustesa dels accents, el soroll de fons i el llenguatge tècnic. A més, permet la transcripció en diversos idiomes, així com la traducció d'aquests idiomes a l'anglès. Som models de codi obert i codi d'inferència per servir com a base per a la creació d'aplicacions útils i per a més investigacions sobre un processament robust de la parla.

Més informació sobre com transcriure àudio i vídeo a text al nostre Blog:

Transcriure àudio i vídeo a text amb Softcatalà | CRAI Docència UB

 

Sobre això

En aquest Portal del CRAI, trobaràs un recull d'eines i recursos TIC i TAC per ajudar als usuaris en el seu aprenentatge i la docència, així com píndoles formatives. Us podeu subscriure al Blog i estar sempre informats del que es vagi publicant.

Publicacions destacades

Contacte

La Unitat de Docència del CRAI gestiona i ofereix a la comunitat UB recursos d'informació i serveis útils per a la tasca docent.

  • Baldiri Reixac, 2 08028 Barcelona
  • +34934034731 / +34934034013
  • udcrai@ub.edu