seandearnaley/whispercc.py

## whispercc.py
"""WhisperCC binding module"""
import time
from pathlib import Path

from whispercpp import Whisper

from app.audio_tools import NdArray, convert_to_float_array, decode_audio


class WhisperTranscriber:
    """WhisperCC transcriber"""

    def __init__(self, model: str) -> None:
        """Initialize the transcriber"""
        self.whisper = Whisper.from_pretrained(model)

    def transcribe_audio(self, audio_file: Path) -> str:
        """Transcribe audio from a file"""
        audio_data = self._load_audio(audio_file)
        start_time = time.time()
        transcription = self.whisper.transcribe(audio_data)
        end_time = time.time()
        execution_time = end_time - start_time
        hours, remainder = divmod(execution_time, 3600)
        minutes, seconds = divmod(remainder, 60)
        print(
            "Transcription elapsed execution time:"
            f" {int(hours)}:{int(minutes):02d}:{seconds:06.3f}"
        )
        return transcription

    def _load_audio(self, audio_file: Path) -> NdArray:
        """Load audio from a file"""
        audio_data = decode_audio(audio_file)
        audio_array = convert_to_float_array(audio_data)
        return audio_array
	"""WhisperCC binding module"""
	import time
	from pathlib import Path

	from whispercpp import Whisper

	from app.audio_tools import NdArray, convert_to_float_array, decode_audio


	class WhisperTranscriber:
	"""WhisperCC transcriber"""

	def __init__(self, model: str) -> None:
	"""Initialize the transcriber"""
	self.whisper = Whisper.from_pretrained(model)

	def transcribe_audio(self, audio_file: Path) -> str:
	"""Transcribe audio from a file"""
	audio_data = self._load_audio(audio_file)
	start_time = time.time()
	transcription = self.whisper.transcribe(audio_data)
	end_time = time.time()
	execution_time = end_time - start_time
	hours, remainder = divmod(execution_time, 3600)
	minutes, seconds = divmod(remainder, 60)
	print(
	"Transcription elapsed execution time:"
	f" {int(hours)}:{int(minutes):02d}:{seconds:06.3f}"
	)
	return transcription

	def _load_audio(self, audio_file: Path) -> NdArray:
	"""Load audio from a file"""
	audio_data = decode_audio(audio_file)
	audio_array = convert_to_float_array(audio_data)
	return audio_array