tg-bomze/audio_volume_list.py

## audio_volume_list.py
import numpy as np
from scipy.io import wavfile

fps = 24
path_to_audio = 'path_to_audio.wav'

try:
  rate, signal = wavfile.read(path_to_audio)
  signal = np.mean(signal, axis=1)
except:
  import moviepy.editor as mpy
  audio_clip = mpy.AudioFileClip(path_to_audio)
  audio_clip.write_audiofile('./temp_audio.wav', fps=44100, nbytes=2, codec='pcm_s16le')
  rate, signal = wavfile.read('./temp_audio.wav')
  signal = np.mean(signal, axis=1)

signal = np.abs(signal)
seed = signal.shape[0]
duration = signal.shape[0] / rate
frames = int(np.ceil(duration * fps))
samples_per_frame = signal.shape[0] / frames
volume = np.zeros(frames, dtype=signal.dtype)
for frame in range(frames):
  start = int(round(frame * samples_per_frame))
  stop = int(round((frame + 1) * samples_per_frame))
  volume[frame] = np.mean(signal[start:stop], axis=0)
volume /= max(volume)

print(volume)
	import numpy as np
	from scipy.io import wavfile

	fps = 24
	path_to_audio = 'path_to_audio.wav'

	try:
	rate, signal = wavfile.read(path_to_audio)
	signal = np.mean(signal, axis=1)
	except:
	import moviepy.editor as mpy
	audio_clip = mpy.AudioFileClip(path_to_audio)
	audio_clip.write_audiofile('./temp_audio.wav', fps=44100, nbytes=2, codec='pcm_s16le')
	rate, signal = wavfile.read('./temp_audio.wav')
	signal = np.mean(signal, axis=1)

	signal = np.abs(signal)
	seed = signal.shape[0]
	duration = signal.shape[0] / rate
	frames = int(np.ceil(duration * fps))
	samples_per_frame = signal.shape[0] / frames
	volume = np.zeros(frames, dtype=signal.dtype)
	for frame in range(frames):
	start = int(round(frame * samples_per_frame))
	stop = int(round((frame + 1) * samples_per_frame))
	volume[frame] = np.mean(signal[start:stop], axis=0)
	volume /= max(volume)

	print(volume)