Skip to content

Instantly share code, notes, and snippets.

@solyarisoftware
Last active June 17, 2021 17:50
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save solyarisoftware/84c05e7cc537b724ca8e8fc73bd14cf9 to your computer and use it in GitHub Desktop.
Save solyarisoftware/84c05e7cc537b724ca8e8fc73bd14cf9 to your computer and use it in GitHub Desktop.
Tone ASR notes
input: audio/speech

│
│
│                                     ┌─────────────────────────────────────────┐
│                            (1)      │                                         │
│            ┌─────────────────┐      │                                         │
│            │                 │ text │                                         │
│            │                 │      │                                         │
│     ┌──────► Speech-to-Text  ├──────►                                         │
│     │      │                 │      │                (3)                      │
│     │      │                 │      │      ┌───────────┐                      │
│     │      └─────────────────┘      │      │           │ sentiment analysis   │
│     │                               │      │ sentence  │ attributes           │
├─────► verbal                        └──────► sentiment ├────────────────┐     │
│     │                      (2)             │ analyzer  │                │     │
│     │      ┌─────────────────┐             │           │                │     │
│     │      │                 │ tone        └───────────┘                │     │
│     │      │                 │ attributes                               │     │
│     └──────►  Tone detection ├──────────────────────────────┐           │     │
│            │                 │                              │           │     │
│            │                 │                              │           │     │
│            └─────────────────┘                              │           │     │
│                                                             │           │     │
│                                                             │           │     │
│                            (4)                              │           │     │
│            ┌─────────────────┐                              │           │     │
│            │                 │                              │           │     │
│            │                 │                              │           │     │
│     ┌──────► Interjections   ├──────────┐                   │           │     │
│     │      │ Detection       │          │                   │           │     │
│     │      │                 │          │                   │           │     │
│     │      └─────────────────┘          │                   │           │     │
│     │                                   │                   │           │     │
└─────► non-verbal                        │                   │           │     │
      │                      (5)          │                   │           │     │
      │      ┌─────────────────┐          │                   │           │     │
      │      │                 │          │                   │           │     │
      │      │ Background      │          │                   │           │     │
      └──────► Ambient         ├─────┐    │                   │           │     │
             │ sounds/noises   │     │    │                   │           │     │
             │                 │     │    │                   │           │     │
             └─────────────────┘     │    │                   │           │     │
                                     │    │                   │           │     │
                                     │    │                   │           │     │
                                     │    │                   │           │     │ (6)
                                 ┌───▼────▼───────────────────▼───────────▼─────▼───┐
                                 │                                                  │
                                 │                attributes unifier                │
                                 │                                                  │
                                 └────────────────────┬─────────────────────────────┘
                                                      │
                                                      │
                                                      ▼

                                              output: {text, metadata}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment