Last active
May 29, 2020 20:49
-
-
Save FernandaOchoa/d95f7140b9c25e5fe84e0a8470f9ba97 to your computer and use it in GitHub Desktop.
Conversión de Audio a Texto con Azure Cognitive Services Speech
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
using System; | |
using System.Threading.Tasks; | |
using Microsoft.CognitiveServices.Speech; | |
using Microsoft.CognitiveServices.Speech.Audio; | |
namespace HelloWorld { | |
class Program { | |
// Accesamos a los servicios con una función Async | |
static async Task Main() { | |
await RecognizeSpeechAsync(); | |
} | |
static async Task RecognizeSpeechAsync() { | |
// Configuramos la información para accesar a los servicios. | |
// Podemos usar la Clave 1 o Clave 2 que hemos creado con Servicio de Speech en Azure | |
var config = SpeechConfig.FromSubscription("Clave 1 ", "region"); | |
// Agregamos el archivo de audio, en este caso es un archivo en local. | |
using (var audioInput = AudioConfig.FromWavFileInput("archivo.wav")) | |
//Pasamos los parámetros requeridos para el Servicio de Speech el cuál incluye la información de configuración | |
// y el archivo de audio que quieres transcribir | |
using (var recognizer = new SpeechRecognizer(config, audioInput)) { | |
Console.WriteLine("Recognizing first result..."); | |
var result = await recognizer.RecognizeOnceAsync(); | |
switch (result.Reason) { | |
case ResultReason.RecognizedSpeech: | |
// El archivo de audio es reconocido y la transcripción se mostrará en la salida. | |
// en la ventana output de la terminal | |
Console.WriteLine($"He reconocido: {result.Text}"); | |
break; | |
case ResultReason.NoMatch: | |
// Cuando no se puede reconocer el audio del archivo que se ha especificado. | |
// Salida del mensaje con el error | |
Console.WriteLine($"NOMATCH: No he podido reconocer el archivo especificado."); | |
break; | |
case ResultReason.Canceled: | |
// Se cancela todo | |
// Mostramos el por qué | |
var cancellation = CancellationDetails.FromResult(result); | |
Console.WriteLine($"CANCELED: Reason={cancellation.Reason}"); | |
if (cancellation.Reason == CancellationReason.Error) { | |
Console.WriteLine($"CANCELED: ErrorCode={cancellation.ErrorCode}"); | |
Console.WriteLine($"CANCELED: ErrorDetails={cancellation.ErrorDetails}"); | |
Console.WriteLine($"CANCELED: ¿Quieres actualizar la información de la Suscripción?"); | |
} | |
break; | |
} | |
} | |
} | |
} | |
} |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Traducción de voz en tiempo real con Azure Cognitive Services
Creamos el servicio de Voz
Training01
mslearn-speechapi
(Crear nuevo) o elegir uno ya creado.Esperamos en lo que se configura nuestro grupo de recursos (3min)
Obteniendo las credenciales del API Cognitive Services Speech
Training01
Configuración de VS Code Online
1.- Abrir una pestaña o ventana del explorador y entrar a Visual Studio Code en línea.
2.- Creamos un entorno:
3.- Una vez que está creado damos clic en Conectar y esperamos un poco más.
Código
Nos vamos al menú-> Ver->Seleccionamos Terminal (La cual deberá ser Bash)
Escribimos en la terminal:
dotnet new terminal
Con esto hemos configurado la estructura de un proyecto en C#
Program.cs
y pegamos el código proporcionado en este gist.dotnet add package Microsoft.CognitiveServices.Speech
para instalar el paquete de los servicios cognitivos de Speech.Clave 1
y la región en la palabraregion
de nuestro recurso en Azure.hello.wav
Probamos el Código
dotnet run
para ejecutar nuestro código.Listo, de esta manera logramos transcribir a texto un audio con los servicios cognitivos de Azure.