jiaaro/pydub_mixer.py

## pydub_mixer.py
from pydub import AudioSegment
from pydub.utils import db_to_float

# note: see usage example at the bottom of the gist :)

class Mixer(object):
    def __init__(self):
        self.parts = []

    def overlay(self, sound, position=0):
        self.parts.append((position, sound))
        return self

    def _sync(self):
        positions, segs = zip(*self.parts)

        frame_rate = segs[0].frame_rate
        array_type = segs[0].array_type

        offsets = [int(frame_rate * pos / 1000.0) for pos in positions]
        segs = AudioSegment.empty()._sync(*segs)
        return list(zip(offsets, segs))

    def __len__(self):
        parts = self._sync()
        seg = parts[0][1]
        frame_count = max(
            offset + seg.frame_count()
            for offset, seg in parts
        )
        return 1000.0 * frame_count / seg.frame_rate

    def append(self, sound):
        self.overlay(sound, position=len(self))

    def to_audio_segment(self, gain=0):
        samp_multiplier = db_to_float(gain)
        parts = self._sync()
        seg = parts[0][1]
        channels = seg.channels

        frame_count = max(
            offset + seg.frame_count()
            for offset, seg in parts
        )
        sample_count = int(frame_count * seg.channels)

        output = array.array(seg.array_type, [0]*sample_count)
        for offset, seg in parts:
            sample_offset = offset * channels
            samples = seg.get_array_of_samples()
            for i in range(len(samples)):
                output[i+sample_offset] += int(samples[i] * samp_multiplier)

        return seg._spawn(output)


sound1 = AudioSegment.from_file("./test/data/test1.mp3")
sound2 = AudioSegment.from_file("./test/data/test2.mp3")
sound3 = AudioSegment.from_file("./test/data/test3.mp3")

m = Mixer()
m.overlay(sound1)
m.overlay(sound2, 5000)
m.overlay(sound3, 25000)

m.to_audio_segment(gain=-10.0)
	from pydub import AudioSegment
	from pydub.utils import db_to_float

	# note: see usage example at the bottom of the gist :)

	class Mixer(object):
	def __init__(self):
	self.parts = []

	def overlay(self, sound, position=0):
	self.parts.append((position, sound))
	return self

	def _sync(self):
	positions, segs = zip(*self.parts)

	frame_rate = segs[0].frame_rate
	array_type = segs[0].array_type

	offsets = [int(frame_rate * pos / 1000.0) for pos in positions]
	segs = AudioSegment.empty()._sync(*segs)
	return list(zip(offsets, segs))

	def __len__(self):
	parts = self._sync()
	seg = parts[0][1]
	frame_count = max(
	offset + seg.frame_count()
	for offset, seg in parts
	)
	return 1000.0 * frame_count / seg.frame_rate

	def append(self, sound):
	self.overlay(sound, position=len(self))

	def to_audio_segment(self, gain=0):
	samp_multiplier = db_to_float(gain)
	parts = self._sync()
	seg = parts[0][1]
	channels = seg.channels

	frame_count = max(
	offset + seg.frame_count()
	for offset, seg in parts
	)
	sample_count = int(frame_count * seg.channels)

	output = array.array(seg.array_type, [0]*sample_count)
	for offset, seg in parts:
	sample_offset = offset * channels
	samples = seg.get_array_of_samples()
	for i in range(len(samples)):
	output[i+sample_offset] += int(samples[i] * samp_multiplier)

	return seg._spawn(output)


	sound1 = AudioSegment.from_file("./test/data/test1.mp3")
	sound2 = AudioSegment.from_file("./test/data/test2.mp3")
	sound3 = AudioSegment.from_file("./test/data/test3.mp3")

	m = Mixer()
	m.overlay(sound1)
	m.overlay(sound2, 5000)
	m.overlay(sound3, 25000)

	m.to_audio_segment(gain=-10.0)