psobot/lame.py

## lame.py
from Queue import Queue
import subprocess
import threading
import traceback
import logging
import time

log = logging.getLogger(__name__)

"""
    Quick and dirty, frame-aware MP3 encoding bridge using LAME.
    About 75% of the speed of raw LAME. Pass PCM data to the Lame class,
    get back (via callback, queue or file) MP3 frames. Supports real-time
    encoding or blocking for the length of the audio stream - useful for
    an MP3 server, or something else real time, for example.
"""

"""
Some important LAME facts used below:
    Each MP3 frame is identifiable by a header.
    This header has, essentially:
        "Frame Sync"            11 1's (i.e.: 0xFF + 3 bits)
        "Mpeg Audio Version ID" should be 0b11 for MPEG V1, 0b10 for MPEG V2
        "Layer Description"     should be 0b11
        "Protection Bit"        set to 1 by Lame, not protected
        "Bitrate index"         0000 -> free
                                0001 -> 32 kbps
                                0010 -> 40 kbps
                                0011 -> 48 kbps
                                0100 -> 56 kbps
                                0101 -> 64 kbps
                                0110 -> 80 kbps
                                0111 -> 96 kbps
                                1000 -> 112 kbps
                                1001 -> 128 kbps
                                1010 -> 160 kbps
                                1011 -> 192 kbps
                                1100 -> 224 kbps
                                1101 -> 256 kbps
                                1110 -> 320 kbps
                                1111 -> invalid

    Following the header, there are always SAMPLES_PER_FRAME samples of audio data.
    At our constant sampling frequency of 44100, this means each frame
    contains exactly .026122449 seconds of audio.
"""

BITRATE_TABLE = [
    0, 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320, None
]
SAMPLERATE_TABLE = [
    44100, 48000, 32000, None
]
HEADER_SIZE = 4
SAMPLES_PER_FRAME = 1152


def avg(l):
    return sum(l) / len(l)


def frame_length(header):
    bitrate = BITRATE_TABLE[ord(header[2]) >> 4]
    sample_rate = SAMPLERATE_TABLE[(ord(header[2]) & 0b00001100) >> 2]
    padding = (ord(header[2]) & 0b00000010) >> 1
    return int((float(SAMPLES_PER_FRAME) / sample_rate) * ((bitrate / 8) * 1000)) + padding


class Lame(threading.Thread):
    """
        Live MP3 streamer. Currently only works for 16-bit, 44.1kHz stereo input.
    """
    safety_buffer = 30  # seconds
    input_wordlength = 16
    samplerate = 44100
    channels = 2
    preset = "-V3"

    #   Time-sensitive options
    real_time = False       #   Should we encode in 1:1 real time?
    block = False           #   Regardless of real-time, should we block
                            #   for as long as the audio we've encoded lasts?

    chunk_size = samplerate * channels * (input_wordlength / 8)
    data = None

    def __init__(self, callback=None, ofile=None, oqueue=None):
        threading.Thread.__init__(self)

        self.lame = None
        self.buffered = 0
        self.oqueue = oqueue
        self.ofile = ofile
        self.callback = callback
        self.finished = False
        self.sent = False
        self.ready = threading.Semaphore()
        self.encode = threading.Semaphore()
        self.setDaemon(True)

        self.__write_queue = Queue()
        self.__write_thread = threading.Thread(target=self.__lame_write)
        self.__write_thread.setDaemon(True)
        self.__write_thread.start()

    @property
    def pcm_datarate(self):
        return self.samplerate * self.channels * (self.input_wordlength / 8)

    def add_pcm(self, data):
        """
        Expects PCM data in the form of a NumPy array.

        """
        if self.lame.returncode is not None:
            return False
        self.encode.acquire()
        samples = len(data)
        self.__write_queue.put(data)
        del data
        put_time = time.time()
        if self.buffered >= self.safety_buffer:
            self.ready.acquire()
        done_time = time.time()
        if self.block and not self.real_time:
            delay = (samples / float(self.samplerate)) \
                    - (done_time - put_time) \
                    - self.safety_buffer
            time.sleep(delay)
        return True

    def __lame_write(self):
        while not self.finished:
            data = self.__write_queue.get()
            if data is None:
                break
            while len(data):
                chunk = data[:self.chunk_size]
                data = data[self.chunk_size:]
                self.buffered += len(chunk) / self.channels * (self.input_wordlength / 8)
                try:
                    chunk.tofile(self.lame.stdin)
                    del chunk
                except IOError:
                    self.finished = True
                    break
            self.encode.release()

    #   TODO: Extend me to work for all samplerates
    def start(self, *args, **kwargs):
        call = ["lame"]
        call.append('-r')
        if self.input_wordlength != 16:
            call.extend(["--bitwidth", str(self.input_wordlength)])
        call.extend(self.preset.split())
        call.extend(["-", "-"])
        self.lame = subprocess.Popen(
            call,
            stdin=subprocess.PIPE,
            stdout=subprocess.PIPE,
            stderr=subprocess.PIPE
        )
        threading.Thread.start(self, *args, **kwargs)

    def ensure_is_alive(self):
        if self.finished:
            return False
        if self.is_alive():
            return True
        try:
            self.start()
            return True
        except Exception:
            return False

    def run(self, *args, **kwargs):
        try:
            last = None
            lag = 0
            while True:
                timing = float(SAMPLES_PER_FRAME) / self.samplerate

                header = self.lame.stdout.read(HEADER_SIZE)
                if len(header) == HEADER_SIZE:
                    frame_len = frame_length(header) - HEADER_SIZE
                    frame = self.lame.stdout.read(frame_len)
                    buf = header + frame
                    if len(frame) == frame_len:
                        self.buffered -= SAMPLES_PER_FRAME
                else:
                    buf = header

                if self.buffered < (self.safety_buffer * self.samplerate):
                    self.ready.release()
                if len(buf):
                    if self.oqueue:
                        self.oqueue.put(buf)
                    if self.ofile:
                        self.ofile.write(buf)
                        self.ofile.flush()
                    if self.callback:
                        self.callback(False)
                    if self.real_time and self.sent:
                        now = time.time()
                        if last:
                            delta = (now - last - timing)
                            lag += delta
                            if lag < timing:
                                time.sleep(max(0, timing - delta))
                        last = now
                    self.sent = True
                else:
                    if self.callback:
                        self.callback(True)
                    break
            self.lame.wait()
        except:
            log.error(traceback.format_exc())
            self.finish()
            raise

    def finish(self):
        """
            Closes input stream to LAME and waits for the last frame(s) to
            finish encoding. Returns LAME's return value code.
        """
        if self.lame:
            self.__write_queue.put(None)
            self.encode.acquire()
            self.lame.stdin.close()
            self.join()
            self.finished = True
            return self.lame.returncode
        return -1


if __name__ == "__main__":
    import wave
    import numpy
    f = wave.open("test.wav")
    a = numpy.frombuffer(f.readframes(f.getnframes()), dtype=numpy.int16).reshape((-1, 2))

    s = time.time()
	from Queue import Queue
	import subprocess
	import threading
	import traceback
	import logging
	import time

	log = logging.getLogger(__name__)

	"""
	Quick and dirty, frame-aware MP3 encoding bridge using LAME.
	About 75% of the speed of raw LAME. Pass PCM data to the Lame class,
	get back (via callback, queue or file) MP3 frames. Supports real-time
	encoding or blocking for the length of the audio stream - useful for
	an MP3 server, or something else real time, for example.
	"""

	"""
	Some important LAME facts used below:
	Each MP3 frame is identifiable by a header.
	This header has, essentially:
	"Frame Sync" 11 1's (i.e.: 0xFF + 3 bits)
	"Mpeg Audio Version ID" should be 0b11 for MPEG V1, 0b10 for MPEG V2
	"Layer Description" should be 0b11
	"Protection Bit" set to 1 by Lame, not protected
	"Bitrate index" 0000 -> free
	0001 -> 32 kbps
	0010 -> 40 kbps
	0011 -> 48 kbps
	0100 -> 56 kbps
	0101 -> 64 kbps
	0110 -> 80 kbps
	0111 -> 96 kbps
	1000 -> 112 kbps
	1001 -> 128 kbps
	1010 -> 160 kbps
	1011 -> 192 kbps
	1100 -> 224 kbps
	1101 -> 256 kbps
	1110 -> 320 kbps
	1111 -> invalid

	Following the header, there are always SAMPLES_PER_FRAME samples of audio data.
	At our constant sampling frequency of 44100, this means each frame
	contains exactly .026122449 seconds of audio.
	"""

	BITRATE_TABLE = [
	0, 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320, None
	]
	SAMPLERATE_TABLE = [
	44100, 48000, 32000, None
	]
	HEADER_SIZE = 4
	SAMPLES_PER_FRAME = 1152


	def avg(l):
	return sum(l) / len(l)


	def frame_length(header):
	bitrate = BITRATE_TABLE[ord(header[2]) >> 4]
	sample_rate = SAMPLERATE_TABLE[(ord(header[2]) & 0b00001100) >> 2]
	padding = (ord(header[2]) & 0b00000010) >> 1
	return int((float(SAMPLES_PER_FRAME) / sample_rate) * ((bitrate / 8) * 1000)) + padding


	class Lame(threading.Thread):
	"""
	Live MP3 streamer. Currently only works for 16-bit, 44.1kHz stereo input.
	"""
	safety_buffer = 30 # seconds
	input_wordlength = 16
	samplerate = 44100
	channels = 2
	preset = "-V3"

	# Time-sensitive options
	real_time = False # Should we encode in 1:1 real time?
	block = False # Regardless of real-time, should we block
	# for as long as the audio we've encoded lasts?

	chunk_size = samplerate * channels * (input_wordlength / 8)
	data = None

	def __init__(self, callback=None, ofile=None, oqueue=None):
	threading.Thread.__init__(self)

	self.lame = None
	self.buffered = 0
	self.oqueue = oqueue
	self.ofile = ofile
	self.callback = callback
	self.finished = False
	self.sent = False
	self.ready = threading.Semaphore()
	self.encode = threading.Semaphore()
	self.setDaemon(True)

	self.__write_queue = Queue()
	self.__write_thread = threading.Thread(target=self.__lame_write)
	self.__write_thread.setDaemon(True)
	self.__write_thread.start()

	@property
	def pcm_datarate(self):
	return self.samplerate * self.channels * (self.input_wordlength / 8)

	def add_pcm(self, data):
	"""
	Expects PCM data in the form of a NumPy array.

	"""
	if self.lame.returncode is not None:
	return False
	self.encode.acquire()
	samples = len(data)
	self.__write_queue.put(data)
	del data
	put_time = time.time()
	if self.buffered >= self.safety_buffer:
	self.ready.acquire()
	done_time = time.time()
	if self.block and not self.real_time:
	delay = (samples / float(self.samplerate)) \
	- (done_time - put_time) \
	- self.safety_buffer
	time.sleep(delay)
	return True

	def __lame_write(self):
	while not self.finished:
	data = self.__write_queue.get()
	if data is None:
	break
	while len(data):
	chunk = data[:self.chunk_size]
	data = data[self.chunk_size:]
	self.buffered += len(chunk) / self.channels * (self.input_wordlength / 8)
	try:
	chunk.tofile(self.lame.stdin)
	del chunk
	except IOError:
	self.finished = True
	break
	self.encode.release()

	# TODO: Extend me to work for all samplerates
	def start(self, args, *kwargs):
	call = ["lame"]
	call.append('-r')
	if self.input_wordlength != 16:
	call.extend(["--bitwidth", str(self.input_wordlength)])
	call.extend(self.preset.split())
	call.extend(["-", "-"])
	self.lame = subprocess.Popen(
	call,
	stdin=subprocess.PIPE,
	stdout=subprocess.PIPE,
	stderr=subprocess.PIPE
	)
	threading.Thread.start(self, args, *kwargs)

	def ensure_is_alive(self):
	if self.finished:
	return False
	if self.is_alive():
	return True
	try:
	self.start()
	return True
	except Exception:
	return False

	def run(self, args, *kwargs):
	try:
	last = None
	lag = 0
	while True:
	timing = float(SAMPLES_PER_FRAME) / self.samplerate

	header = self.lame.stdout.read(HEADER_SIZE)
	if len(header) == HEADER_SIZE:
	frame_len = frame_length(header) - HEADER_SIZE
	frame = self.lame.stdout.read(frame_len)
	buf = header + frame
	if len(frame) == frame_len:
	self.buffered -= SAMPLES_PER_FRAME
	else:
	buf = header

	if self.buffered < (self.safety_buffer * self.samplerate):
	self.ready.release()
	if len(buf):
	if self.oqueue:
	self.oqueue.put(buf)
	if self.ofile:
	self.ofile.write(buf)
	self.ofile.flush()
	if self.callback:
	self.callback(False)
	if self.real_time and self.sent:
	now = time.time()
	if last:
	delta = (now - last - timing)
	lag += delta
	if lag < timing:
	time.sleep(max(0, timing - delta))
	last = now
	self.sent = True
	else:
	if self.callback:
	self.callback(True)
	break
	self.lame.wait()
	except:
	log.error(traceback.format_exc())
	self.finish()
	raise

	def finish(self):
	"""
	Closes input stream to LAME and waits for the last frame(s) to
	finish encoding. Returns LAME's return value code.
	"""
	if self.lame:
	self.__write_queue.put(None)
	self.encode.acquire()
	self.lame.stdin.close()
	self.join()
	self.finished = True
	return self.lame.returncode
	return -1


	if __name__ == "__main__":
	import wave
	import numpy
	f = wave.open("test.wav")
	a = numpy.frombuffer(f.readframes(f.getnframes()), dtype=numpy.int16).reshape((-1, 2))

	s = time.time()