senyoltw/snowboydecoder.py

## snowboydecoder.py
#!/usr/bin/env python

import collections
import snowboydetect
import time
import wave
import os
import logging

import aiy.audio

logging.basicConfig()
logger = logging.getLogger("snowboy")
logger.setLevel(logging.INFO)
TOP_DIR = os.path.dirname(os.path.abspath(__file__))

RESOURCE_FILE = os.path.join(TOP_DIR, "resources/common.res")
DETECT_DING = os.path.join(TOP_DIR, "resources/ding.wav")
DETECT_DONG = os.path.join(TOP_DIR, "resources/dong.wav")

class RingBuffer(object):
    """Ring buffer to hold audio from PortAudio"""

    def __init__(self, size=4096):
        self._buf = collections.deque(maxlen=size)

    def add_data(self, data):
        """Adds data"""
        self._buf.extend(data)

    def extend(self, data):
        """Adds data to the end of buffer"""
        self._buf.extend(data)

    def get(self):
        """Retrieves data from the beginning of buffer and clears it"""
        tmp = bytes(bytearray(self._buf))
        self._buf.clear()
        return tmp


def play_audio_file(fname=DETECT_DING):
    """Simple callback function to play a wave file. By default it plays
    a Ding sound.

    :param str fname: wave file name
    :return: None
    """
    aiy.audio.play_wave(fname)

class HotwordDetector(object):
    """
    Snowboy decoder to detect whether a keyword specified by `decoder_model`
    exists in a microphone input stream.

    :param decoder_model: decoder model file path, a string or a list of strings
    :param resource: resource file path.
    :param sensitivity: decoder sensitivity, a float of a list of floats.
                              The bigger the value, the more senstive the
                              decoder. If an empty list is provided, then the
                              default sensitivity in the model will be used.
    :param audio_gain: multiply input volume by this factor.
    """

    def __init__(self, decoder_model,
                 resource=RESOURCE_FILE,
                 sensitivity=[],
                 audio_gain=1):

        self._recorder = aiy.audio.get_recorder()

        tm = type(decoder_model)
        ts = type(sensitivity)
        if tm is not list:
            decoder_model = [decoder_model]
        if ts is not list:
            sensitivity = [sensitivity]
        model_str = ",".join(decoder_model)

        self.detector = snowboydetect.SnowboyDetect(
            resource_filename=resource.encode(), model_str=model_str.encode())
        self.detector.SetAudioGain(audio_gain)
        self.num_hotwords = self.detector.NumHotwords()

        if len(decoder_model) > 1 and len(sensitivity) == 1:
            sensitivity = sensitivity * self.num_hotwords
        if len(sensitivity) != 0:
            assert self.num_hotwords == len(sensitivity), \
                "number of hotwords in decoder_model (%d) and sensitivity " \
                "(%d) does not match" % (self.num_hotwords, len(sensitivity))
        sensitivity_str = ",".join([str(t) for t in sensitivity])
        if len(sensitivity) != 0:
            self.detector.SetSensitivity(sensitivity_str.encode())

        self.ring_buffer = RingBuffer(
            self.detector.NumChannels() * self.detector.SampleRate() * 5)

    def start(self, detected_callback=play_audio_file,
              interrupt_check=lambda: False,
              sleep_time=0.03):
        """
        Start the voice detector. For every `sleep_time` second it checks the
        audio buffer for triggering keywords. If detected, then call
        corresponding function in `detected_callback`, which can be a single
        function (single model) or a list of callback functions (multiple
        models). Every loop it also calls `interrupt_check` -- if it returns
        True, then breaks from the loop and return.

        :param detected_callback: a function or list of functions. The number of
                                  items must match the number of models in
                                  `decoder_model`.
        :param interrupt_check: a function that returns True if the main loop
                                needs to stop.
        :param float sleep_time: how much time in second every loop waits.
        :return: None
        """
        self._running = True

        self._recorder.add_processor(self.ring_buffer)

        if interrupt_check():
            logger.debug("detect voice return")
            return

        tc = type(detected_callback)
        if tc is not list:
            detected_callback = [detected_callback]
        if len(detected_callback) == 1 and self.num_hotwords > 1:
            detected_callback *= self.num_hotwords

        assert self.num_hotwords == len(detected_callback), \
            "Error: hotwords in your models (%d) do not match the number of " \
            "callbacks (%d)" % (self.num_hotwords, len(detected_callback))

        logger.debug("detecting...")

        while self._running is True:
            if interrupt_check():
                logger.debug("detect voice break")
                break
            data = self.ring_buffer.get()
            if len(data) == 0:
                time.sleep(sleep_time)
                continue

            ans = self.detector.RunDetection(data)
            if ans == -1:
                logger.warning("Error initializing streams or reading audio data")
            elif ans > 0:
                self._recorder.remove_processor(self.ring_buffer)
                message = "Keyword " + str(ans) + " detected at time: "
                message += time.strftime("%Y-%m-%d %H:%M:%S",
                                         time.localtime(time.time()))
                logger.info(message)
                callback = detected_callback[ans - 1]
                if callback is not None:
                    callback()

        logger.debug("finished.")

    def terminate(self):
        """
        Terminate audio stream. Users can call start() again to detect.
        :return: None
        """
        self._running = False
	#!/usr/bin/env python

	import collections
	import snowboydetect
	import time
	import wave
	import os
	import logging

	import aiy.audio

	logging.basicConfig()
	logger = logging.getLogger("snowboy")
	logger.setLevel(logging.INFO)
	TOP_DIR = os.path.dirname(os.path.abspath(__file__))

	RESOURCE_FILE = os.path.join(TOP_DIR, "resources/common.res")
	DETECT_DING = os.path.join(TOP_DIR, "resources/ding.wav")
	DETECT_DONG = os.path.join(TOP_DIR, "resources/dong.wav")

	class RingBuffer(object):
	"""Ring buffer to hold audio from PortAudio"""

	def __init__(self, size=4096):
	self._buf = collections.deque(maxlen=size)

	def add_data(self, data):
	"""Adds data"""
	self._buf.extend(data)

	def extend(self, data):
	"""Adds data to the end of buffer"""
	self._buf.extend(data)

	def get(self):
	"""Retrieves data from the beginning of buffer and clears it"""
	tmp = bytes(bytearray(self._buf))
	self._buf.clear()
	return tmp


	def play_audio_file(fname=DETECT_DING):
	"""Simple callback function to play a wave file. By default it plays
	a Ding sound.

	:param str fname: wave file name
	:return: None
	"""
	aiy.audio.play_wave(fname)

	class HotwordDetector(object):
	"""
	Snowboy decoder to detect whether a keyword specified by `decoder_model`
	exists in a microphone input stream.

	:param decoder_model: decoder model file path, a string or a list of strings
	:param resource: resource file path.
	:param sensitivity: decoder sensitivity, a float of a list of floats.
	The bigger the value, the more senstive the
	decoder. If an empty list is provided, then the
	default sensitivity in the model will be used.
	:param audio_gain: multiply input volume by this factor.
	"""

	def __init__(self, decoder_model,
	resource=RESOURCE_FILE,
	sensitivity=[],
	audio_gain=1):

	self._recorder = aiy.audio.get_recorder()

	tm = type(decoder_model)
	ts = type(sensitivity)
	if tm is not list:
	decoder_model = [decoder_model]
	if ts is not list:
	sensitivity = [sensitivity]
	model_str = ",".join(decoder_model)

	self.detector = snowboydetect.SnowboyDetect(
	resource_filename=resource.encode(), model_str=model_str.encode())
	self.detector.SetAudioGain(audio_gain)
	self.num_hotwords = self.detector.NumHotwords()

	if len(decoder_model) > 1 and len(sensitivity) == 1:
	sensitivity = sensitivity * self.num_hotwords
	if len(sensitivity) != 0:
	assert self.num_hotwords == len(sensitivity), \
	"number of hotwords in decoder_model (%d) and sensitivity " \
	"(%d) does not match" % (self.num_hotwords, len(sensitivity))
	sensitivity_str = ",".join([str(t) for t in sensitivity])
	if len(sensitivity) != 0:
	self.detector.SetSensitivity(sensitivity_str.encode())

	self.ring_buffer = RingBuffer(
	self.detector.NumChannels() * self.detector.SampleRate() * 5)

	def start(self, detected_callback=play_audio_file,
	interrupt_check=lambda: False,
	sleep_time=0.03):
	"""
	Start the voice detector. For every `sleep_time` second it checks the
	audio buffer for triggering keywords. If detected, then call
	corresponding function in `detected_callback`, which can be a single
	function (single model) or a list of callback functions (multiple
	models). Every loop it also calls `interrupt_check` -- if it returns
	True, then breaks from the loop and return.

	:param detected_callback: a function or list of functions. The number of
	items must match the number of models in
	`decoder_model`.
	:param interrupt_check: a function that returns True if the main loop
	needs to stop.
	:param float sleep_time: how much time in second every loop waits.
	:return: None
	"""
	self._running = True

	self._recorder.add_processor(self.ring_buffer)

	if interrupt_check():
	logger.debug("detect voice return")
	return

	tc = type(detected_callback)
	if tc is not list:
	detected_callback = [detected_callback]
	if len(detected_callback) == 1 and self.num_hotwords > 1:
	detected_callback *= self.num_hotwords

	assert self.num_hotwords == len(detected_callback), \
	"Error: hotwords in your models (%d) do not match the number of " \
	"callbacks (%d)" % (self.num_hotwords, len(detected_callback))

	logger.debug("detecting...")

	while self._running is True:
	if interrupt_check():
	logger.debug("detect voice break")
	break
	data = self.ring_buffer.get()
	if len(data) == 0:
	time.sleep(sleep_time)
	continue

	ans = self.detector.RunDetection(data)
	if ans == -1:
	logger.warning("Error initializing streams or reading audio data")
	elif ans > 0:
	self._recorder.remove_processor(self.ring_buffer)
	message = "Keyword " + str(ans) + " detected at time: "
	message += time.strftime("%Y-%m-%d %H:%M:%S",
	time.localtime(time.time()))
	logger.info(message)
	callback = detected_callback[ans - 1]
	if callback is not None:
	callback()

	logger.debug("finished.")

	def terminate(self):
	"""
	Terminate audio stream. Users can call start() again to detect.
	:return: None
	"""
	self._running = False