pasindud/synth.sh

## synth.sh
#! /bin/bash
# Licensed under the Apache License, Version 2.0 (the "License");
# you may not use this file except in compliance with the License.
# You may obtain a copy of the License at
#
#     http://www.apache.org/licenses/LICENSE-2.0
#
# Unless required by applicable law or agreed to in writing, software
# distributed under the License is distributed on an "AS IS" BASIS,
# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
# See the License for the specific language governing permissions and
# limitations under the License.
#
# Copyright 2017 Google, Inc.

set -x

# To Synth merlin audio, change the values of variables MERLIN_PATH and FESTIVAL_VOICE_PATH.
# Then run
#
# echo "অলিম্পিক ইন্ডাস্ট্রিজ জীবনকে সহজ করে তুলেছে" | synth.sh "audio_file_name_without_wav_extension"
#

TEST_MERLIN=true

# Temp test sentence.
FILENAME=$RANDOM

# If filename is given, then get text from stdin.
if [[ $# == 1 ]]; then
  TEST_MERLIN=false
  FILENAME=$1
fi

TEXT="ප්‍රධානියා ලෙස කල යුතු දෑ කිරීමට"

if [[ ${TEST_MERLIN} == false ]]; then
  echo "Reading data from stdin"
  read text;
  TEXT=${text};
fi

# Tmp file path.
FILEPATH="/tmp/${FILENAME}.txt"
echo "${FILENAME}" "( ' ${TEXT} ' )" > "${FILEPATH}"

# Change this if required.
LANGUAGE=bn

# -------------------- Change these two paths -------------------------
MERLIN_PATH="/usr/local/src/merlin"
FESTIVAL_VOICE_PATH="/usr/local/src/voice/training"


SYNTH_DIR="/usr/local/src/voice/training/synth"
# Copied from https://github.com/googlei18n/language-resources/blob/abb8ca9746d67293d0b09bca71b2eb06261386e0/festival_utils/setup_merlin.sh#L123
TMP_MERLIN_SCRIPTS_PATH="/tmp/merlin_scripts/"

# Clean files from the previous run.
rm -rf "${TMP_MERLIN_SCRIPTS_PATH}"
mkdir -p "${TMP_MERLIN_SCRIPTS_PATH}"
cp -R -T "${MERLIN_PATH}/misc/scripts/frontend/festival_utt_to_lab" "${TMP_MERLIN_SCRIPTS_PATH}"

# Find the name of festival phoneset file.
PHONESET_FILE_PATH=$(find "$FESTIVAL_VOICE_PATH"/festvox/*phoneset.scm)
LOAD_PHONESET_SCRIPT="(load \"$PHONESET_FILE_PATH\") "

# Load phonemeset before generating the labels.
# This adds a lisp cmd to load the current festival setup's phoneset to the 49th line
# of the extra_feats.scm (which is between the license and start of the code) . This is
# because extra_feats.scm defaults to the radio phoneset.
#
# TODO(pasindu): Make this cleaner.
sed -i  '49s|$|'"$LOAD_PHONESET_SCRIPT"'|' \
      "${TMP_MERLIN_SCRIPTS_PATH}/extra_feats.scm"

# Setup festvox for given data
cd /usr/local/src/voice
rm -rf ${SYNTH_DIR}
mkdir -p ${SYNTH_DIR}
cat "${FILEPATH}" > ${SYNTH_DIR}/${FILENAME}.txt
echo "synth" >  ${SYNTH_DIR}/file_id.scp

cd "${FESTIVAL_VOICE_PATH}"

# Generator festival scripts to generator festival utt.
python "${MERLIN_PATH}"/misc/scripts/frontend/utils/genScmFile.py \
"${FILEPATH}" \
"${SYNTH_DIR}"/ \
"${SYNTH_DIR}"/utt_generator.scm \
"${SYNTH_DIR}"/file_id.scp

# Generator festival utt.
festival -b festvox/goog_data_unison_cg.scm \
-b "(Parameter.set 'Duration_Method 'Default)"  \
-b synth/utt_generator.scm

# Dump features.
sh ${TMP_MERLIN_SCRIPTS_PATH}/make_labels \
  "synth/" \
  "synth/" \
  "${FESTIVALDIR}/examples/dumpfeats" \
  "${TMP_MERLIN_SCRIPTS_PATH}"

# Remove leading space from the label files.
FESTIVAL_LABEL_PHONE_ALIGN=synth/full/
sed -i -r "s/^ *//g" "${FESTIVAL_LABEL_PHONE_ALIGN}"/*.lab
sed -i -r "s/  */ /g" "${FESTIVAL_LABEL_PHONE_ALIGN}"/*.lab

# Copy generated labels and test list.
cd "${FESTIVAL_VOICE_PATH}"
mkdir -p "${MERLIN_PATH}"/egs/"${LANGUAGE}"/s1/models/test_synthesis/wav
ls ${SYNTH_DIR}
ls ${SYNTH_DIR}/full/
cp "${SYNTH_DIR}/file_id.scp" "${MERLIN_PATH}"/egs/"${LANGUAGE}"/s1/data/test_id_list.scp
cp "${SYNTH_DIR}/full/${FILENAME}.lab" "${MERLIN_PATH}"/egs/"${LANGUAGE}"/s1/data/label_phone_align/

cd "${MERLIN_PATH}"

# Predict duration parameters.
python src/run_merlin.py "egs/${LANGUAGE}/s1/conf/test_dur_synth.conf"

# Predict acoustics parameters and generate wav.
python src/run_merlin.py egs/"${LANGUAGE}"/s1/conf/test_synth.conf

# Generated wav.
ls -l "${MERLIN_PATH}"/egs/"${LANGUAGE}"/s1/models/test_synthesis/wav/"${FILENAME}".wav
	#! /bin/bash
	# Licensed under the Apache License, Version 2.0 (the "License");
	# you may not use this file except in compliance with the License.
	# You may obtain a copy of the License at
	#
	# http://www.apache.org/licenses/LICENSE-2.0
	#
	# Unless required by applicable law or agreed to in writing, software
	# distributed under the License is distributed on an "AS IS" BASIS,
	# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
	# See the License for the specific language governing permissions and
	# limitations under the License.
	#
	# Copyright 2017 Google, Inc.

	set -x

	# To Synth merlin audio, change the values of variables MERLIN_PATH and FESTIVAL_VOICE_PATH.
	# Then run
	#
	# echo "অলিম্পিক ইন্ডাস্ট্রিজ জীবনকে সহজ করে তুলেছে" \| synth.sh "audio_file_name_without_wav_extension"
	#

	TEST_MERLIN=true

	# Temp test sentence.
	FILENAME=$RANDOM

	# If filename is given, then get text from stdin.
	if [[ $# == 1 ]]; then
	TEST_MERLIN=false
	FILENAME=$1
	fi

	TEXT="ප්‍රධානියා ලෙස කල යුතු දෑ කිරීමට"

	if [[ ${TEST_MERLIN} == false ]]; then
	echo "Reading data from stdin"
	read text;
	TEXT=${text};
	fi

	# Tmp file path.
	FILEPATH="/tmp/${FILENAME}.txt"
	echo "${FILENAME}" "( ' ${TEXT} ' )" > "${FILEPATH}"

	# Change this if required.
	LANGUAGE=bn

	# -------------------- Change these two paths -------------------------
	MERLIN_PATH="/usr/local/src/merlin"
	FESTIVAL_VOICE_PATH="/usr/local/src/voice/training"


	SYNTH_DIR="/usr/local/src/voice/training/synth"
	# Copied from https://github.com/googlei18n/language-resources/blob/abb8ca9746d67293d0b09bca71b2eb06261386e0/festival_utils/setup_merlin.sh#L123
	TMP_MERLIN_SCRIPTS_PATH="/tmp/merlin_scripts/"

	# Clean files from the previous run.
	rm -rf "${TMP_MERLIN_SCRIPTS_PATH}"
	mkdir -p "${TMP_MERLIN_SCRIPTS_PATH}"
	cp -R -T "${MERLIN_PATH}/misc/scripts/frontend/festival_utt_to_lab" "${TMP_MERLIN_SCRIPTS_PATH}"

	# Find the name of festival phoneset file.
	PHONESET_FILE_PATH=$(find "$FESTIVAL_VOICE_PATH"/festvox/*phoneset.scm)
	LOAD_PHONESET_SCRIPT="(load \"$PHONESET_FILE_PATH\") "

	# Load phonemeset before generating the labels.
	# This adds a lisp cmd to load the current festival setup's phoneset to the 49th line
	# of the extra_feats.scm (which is between the license and start of the code) . This is
	# because extra_feats.scm defaults to the radio phoneset.
	#
	# TODO(pasindu): Make this cleaner.
	sed -i '49s\|$\|'"$LOAD_PHONESET_SCRIPT"'\|' \
	"${TMP_MERLIN_SCRIPTS_PATH}/extra_feats.scm"

	# Setup festvox for given data
	cd /usr/local/src/voice
	rm -rf ${SYNTH_DIR}
	mkdir -p ${SYNTH_DIR}
	cat "${FILEPATH}" > ${SYNTH_DIR}/${FILENAME}.txt
	echo "synth" > ${SYNTH_DIR}/file_id.scp

	cd "${FESTIVAL_VOICE_PATH}"

	# Generator festival scripts to generator festival utt.
	python "${MERLIN_PATH}"/misc/scripts/frontend/utils/genScmFile.py \
	"${FILEPATH}" \
	"${SYNTH_DIR}"/ \
	"${SYNTH_DIR}"/utt_generator.scm \
	"${SYNTH_DIR}"/file_id.scp

	# Generator festival utt.
	festival -b festvox/goog_data_unison_cg.scm \
	-b "(Parameter.set 'Duration_Method 'Default)" \
	-b synth/utt_generator.scm

	# Dump features.
	sh ${TMP_MERLIN_SCRIPTS_PATH}/make_labels \
	"synth/" \
	"synth/" \
	"${FESTIVALDIR}/examples/dumpfeats" \
	"${TMP_MERLIN_SCRIPTS_PATH}"

	# Remove leading space from the label files.
	FESTIVAL_LABEL_PHONE_ALIGN=synth/full/
	sed -i -r "s/^ //g" "${FESTIVAL_LABEL_PHONE_ALIGN}"/.lab
	sed -i -r "s/ / /g" "${FESTIVAL_LABEL_PHONE_ALIGN}"/.lab

	# Copy generated labels and test list.
	cd "${FESTIVAL_VOICE_PATH}"
	mkdir -p "${MERLIN_PATH}"/egs/"${LANGUAGE}"/s1/models/test_synthesis/wav
	ls ${SYNTH_DIR}
	ls ${SYNTH_DIR}/full/
	cp "${SYNTH_DIR}/file_id.scp" "${MERLIN_PATH}"/egs/"${LANGUAGE}"/s1/data/test_id_list.scp
	cp "${SYNTH_DIR}/full/${FILENAME}.lab" "${MERLIN_PATH}"/egs/"${LANGUAGE}"/s1/data/label_phone_align/

	cd "${MERLIN_PATH}"

	# Predict duration parameters.
	python src/run_merlin.py "egs/${LANGUAGE}/s1/conf/test_dur_synth.conf"

	# Predict acoustics parameters and generate wav.
	python src/run_merlin.py egs/"${LANGUAGE}"/s1/conf/test_synth.conf

	# Generated wav.
	ls -l "${MERLIN_PATH}"/egs/"${LANGUAGE}"/s1/models/test_synthesis/wav/"${FILENAME}".wav