Whisper
est un système de reconnaissance automatique de la parole (ASR)
entraîné sur 680 000 heures de données supervisées multilingues et
multitâches collectées sur le web.
Il permet la transcription dans
plusieurs langues, ainsi que la traduction de ces langues vers l'anglais.