Created October 15, 2022 17:52
Transcribe vídeo de YouTube con Whisper e Inteligencia Artificial


Necesitas tener instalado Python 3.9 e instalar la dependencia de Whisper y PyTube:

pip install git+
pip install pytube

También necesitas tener instalado ffmpeg. Según tu sistema operativo se instala de esta forma:

# Ubuntu
sudo apt update && sudo apt install ffmpeg
# Arch Linux
sudo pacman -S ffmpeg
#  MacOS con Homebrew (
brew install ffmpeg
# Windows con Chocolatey (
choco install ffmpeg
# Windows con Scoop (
scoop install ffmpeg

Cómo usar la línea de comandos

Necesitas indicar la URL del vídeo de YouTube que quieres transcribir:

python3 -h

python3 --video ""

# también puedes indicar el modelo de IA que usará Whisper
# cuanto más grande, más tardará en descargarlo la primera vez
python3 --video "" --model "large"
import logging
import pytube
import whisper
import sys
import argparse
parser = argparse.ArgumentParser(description='Transcript a YouTube video using Whisper')
parser.add_argument("--video", help = "Pass the YouTube url to transcribe")
parser.add_argument("--model", help = "Indicate the Whisper model to download", default="small")
args = parser.parse_args()
format="%(asctime)s [%(levelname)s] %(message)s",
if not
logging.error("Please pass a YouTube url to transcribe")
exit()"Downloading Whisper model")
model = whisper.load_model(args.model)"Downloading the video from YouTube...")
youtubeVideo = pytube.YouTube("Get only the audio from the video")
audio = youtubeVideo.streams.get_audio_only()'tmp.mp4')"Transcribe the audio")
result = model.transcribe('tmp.mp4')
