Skip to content

Instantly share code, notes, and snippets.

Created August 26, 2017 23:17
Show Gist options
  • Save anonymous/6e8d800a7e1896373085c142bcd7a82e to your computer and use it in GitHub Desktop.
Save anonymous/6e8d800a7e1896373085c142bcd7a82e to your computer and use it in GitHub Desktop.
Перевести аудио в текст

Перевести аудио в текст



Этот пост относится к переводу аудио в текст в модуле транскрибирования Speechpad. Неожиданно обнаружил, что могу использовать для транскрибирования скрытые возможности в windows 7 и 8. Возможно это работает не всегда, но на двух моих компьютерах — старом нотбуке и новом моноблоке сработало. Последовательность действий следующая — открываем контрольную панель, затем выбираем звук и в ней вкладку записывающие устройства. Там нажимаем правую кнопку мыши и в появившемся контекстном меня выбираем — показать скрытые устройства. Появится скрытый миксер звука. Делаем его доступным и затем устройстом записи по умолчанию. После этого напротив миксера появится столбик, означающий, что он используется для записи. И вроде все — можно приступать к переводу аудио в текст в модуле транскрибирования, при этом мы слышим звук из колонок и не нужно никаких повторителей. Пользователь Виктор поделился опытом установки стерео микшера в случае если его нет в системе. Нашел сегодня бесплатную замену программе Virtual audio cabel VAC. Альтернатива почти свободно распространяется там странная лицензия donationware на сайте http: Правда, предлагаемый там программа для повтора аудио у меня не заработала, но создать виртуальный кабель получилось и я смог распознать аудио без микрофона. При переводе аудио с помощью программ, создающих виртуальный аудио кабель происходит неприятное явление — текст накапливается в поле предварительного просмотра и не попадает в результирующее поле. Так как ошибка находится вне кода блокнота, то просто исправить ее нельзя правда можно обойти, например, выключением записи через некоторые промежутки времени. Сделал принудительный перенос из предварительных результатов в результирующее поле при превышении длины текста символов. Теперь проблема практически решена Bite rate записи равнялся kbps, колонки и микрофон самые обычные. Результат перевода аудио с помощью колонок и микрофона. Результат перевода аудио с помощью программы VB-CABLE. Открываете окно управления записывающими устройствами и делаете CABLE Output устройством по умолчанию. Открываете окно управления устройствами воспроизведения и делаете CABLE Input устройством по умолчанию. Теперь можно приступать к транскрибированию. После этих манипуляций звук будет идти из выхода аудио на запись, микрофон при этом перестает работать. Чтобы вернуть его для работы нужно сделанные исменения откатить вернуть все назад. Пользователь Владимир Гусев предложил использовать для транскрибирования кабель 3. Один конец кабеля при этом вставляется в выход на колонки, а другой на вход для микрофона. Качество при этом методе получается близкое к качеству, полученному на vbcable, но нет неприятного эффекта накапливания текста в буфере предварительного просмотра. Для контроля звука он также предлагает использовать кабель с размножителем. Для Linux организация виртуального кабеля делается средствами самой операционной системы. По крайней мере мне в Ubuntu ничего устанавливать не пришлось. Да пробовал, иначе бы не писал. Устанавливаете программу и у вас появляется в playback device CABLE Input, а в Recording device — CABLE Output. Делаете их по умолчанию SET a default device , после чего звук идет на запись, минуя микрофон и колонки. А при использовании этой программы какой должна быть максимальная длительность аудиозаписи, просто у меня 3 часа идет запись, если нужно поделить то по сколько минут нужно делить и как это сделать? Спасибо за сайт, очень полезный. Я бы сначала дал 3 минуты и если качество меня бы устроило, то отключил бы через 20 минут и посмотрел снова и так далее. Если плейер аудио подымает, то делить не нужно, блокнот работает со звуком, а не с файлом. Спасибо за ответ, только теперь возникли проблемы с этой программой, сделал все как сказано здесь http: Это не мое видео. И кстати о какой программе идет речь? Если о VAC, то она платная и я ее не использую. Последний вопрос если позволите, есть ли ограничение количества символов при диктовке через микрофон? Как такового лимита у поля textarea скорей всего нет, но думаю что превышения 64кбайт может иметь неприятные последствия, хотя не пробовал, во всяком случае сохранить такое поле не удастся. Планы на блокнот большие… Попробовала транскрибацию, видео с ютюба прекрасно загрузилось, но запись аудио не получилась. Ладно, попробовала записать своим голосом с микрофона, язык испанский, включила испанский, но… разочарование… не пишет… пишет слова похожие на русские и на русском языке, а испанские нет… Такие у меня надежды были и ничего не получилось… Может быть что — то в настройках нужно поменять? У меня версия блокнота 5. Галина, язык нужно установить в блокноте, там есть выпадающий список. У блокнота версий нет это сайт , версии есть у расширения, на сайте оно роли не играет. Транскрибирование очень сильно зависит от качества записи и от дикции говорящего, как правило большинство роликов и записей этому требованию не удовлетворяют, но может повезти. В выпадающем списке я все правильно сделала, выбрала испанский. Сегодня я снова попробовала и ничего не получилось, но я же лох и поэтому попробовала все кнопочки исследовать. Не мытьем, так катаньем. С транскрибированием буду разбираться. Может быть на форуме помогут? Я уже наговорила целую лекцию, которая была в аудио формате. Получилось быстрее, чем слушать и набивать на клавиатуре. Очень ВЫ мне помогли, думаю дальше будет еще интереснее, да и работа продуктивнее….. Кнопка перевод вообще-то нужна, только для того чтобы перевести на другой язык. Так что в следующий раз можно ее не нажимать, испанский с голоса будет все-равно идти. И еще я поняла, что качество микрофона имеет важное значение. Мне подарили профессиональный, разница чувствуется…. Галина, видео yutube не стартовало, я это поправил сейчас были изменения в youtube и я их не отследил. Добрый день, Вы не могли бы все же подробнее, желательно пошагово описать использование виртуального кабеля? Поставил его, сменил устройства по умолчанию вход и выход в настройках звука на кабель. Вот с этого момента — неясно, что делать дальше. Запускаю файл mp3, 64 kbps в винампе, включаю запись в голосовом блокноте, но эффекта нет. Пытаюсь включить файл во встроенном плеере панель транскрибации и пустить запись — то же самое, текстовые поля остаются чистыми. Мне кажется, я не понимаю какой-то принципиальной вещи, но какой? Проверяем работу модуля транскрибирования с использованием колонок и микрофона. Выбираем mp3 кнопкой выбора файлов 1. Кладем микрофон к колонкам 1. Проверяем с использование VB-CABLE 2. Устанавливаете его как устройство по умолчанию для recording и playback см. Выбираем mp3 файл 2. С колонками проверить, к сожалению, пока не могу — их нет у меня. Пытался наушники на полной громкости к микрофону приложить — не воспринимает. Но с кабелем я так и делал, как у Вас описано, что-то не фурычит.. Если решу ее — отпишусь. А так, через микрофон все работает как надо, пользуюсь и благодарен за сервис. Имею ввиду убирание шумов, повышение высоких частот голоса и т. Спасибо огромное за данный ресурс — вещь просто архинужная. Однако для начала нужно разобраться что к чему. Во-первых перешла по указанной вверху ссылке — скачать программу не удаётся кнопочка скачать жмакается — реакции никакой. Попробовала вариант со скрытыми возможностями винды у меня семёрка. Залезла куда положено, но вместо того, что описано Обе галочки поставила, но ничего из описанного не появилось. Может есть какие соображения как преодолеть эту проблему? Зашел сегодня на http: Но всегда есть два железных варианта колонка и микрофон или аудио кабель. Миксер у меня тоже работал на 2 из 3 компьютерах видимо дело в драйверах. Кабель установить получилось, а также сделать его устройством записи по умолчанию. Однако транскрибация не идёт. Закачала файл и при воспроизведении я слышу звук, а этого как я понимаю, быть не должно. Во вторых у меня в голосовом блокноте нет знака микрофона не знаю как правильнее сказать кнопка или пиктограмма , хотя при первом входе и нажимала разрешить при этом голосовой поиск в хроме работает. Приложения и расширения тоже вроде бы все установлены. Подскажите пожалуйста, какие могут быть проблемы и что можно сделать. Там в комментариях было написано: То есть кабель не только устройством записи, но и устройством воспроизведения по умолчанию. Уважаемый Admin, Eсть ноут I5 со встроенным микрофоном и WEB-камерой под Windows 8. При записи файлов mp3 с плеера VLC , WMP в Блокнот непосредственно без VB-CABLE и др. Но кроме основного текста пишет посторонний текст. Lifehouse i want to play soccer двойной системе xml file to comprise как научиться break dance таймвеб хостинг sd. В плеере в это время звучит английский текст, который я запустил. Начало Примера из этого текста. Как такое может быть? Иван, спасибо за комментарий. Видимо, на главной странице не хватает текста: Голосовой блокнот не работает с внутренним микрофоном ноутбука и нельзя использовать внутренние колонки ноутбука для транскрибирования. А можно ли эту программу использовать для перевода аудио файлов в фильме в текстовые титры? Я понимаю, что при этом, надо весь аудио материал разбивать на отдельные фрагменты, то есть это и будут титры. В программе есть возможность генерировать титры для ютюб в формате srt, в общем этот процесс мало отличается от генерирования титров для фильма. Нужно ли дополнительно выставлять параметры для CABLE Input и CABLE Output, например регулировать уровни, громкость и пр. Часто из поля записи фрагмента в результирующее поле расшифровка не переносится, просто пропадает. Результирующее поле имеет ограничение? Текст пишется до заполнения его…. Голос распознается обычно при разных уровнях, главное чтобы не совсем мало и не очень много зашкаливало 2. Видимо уровень достоверности был настолько мал, что просто пропустил этот фрагмент 3. Результирующее поле скорее всего ограничено просто правилами html, но я бы не рекомендовал работать с длинной больше 64 кб. Без вас, ну никак! И в рамблер подтверждение ждала, и браузер не тот, и микрофон в командной строке был отключен, и кабеля не оказалось, скрытый микшер выручил! Заметил один бзик в работе программы. Хотелось бы узнать, какая такая причина может так тормозить программу. С другого видео, где лектор разговаривает помедленнее и с паузами, перескок текста идёт нормально. Там немного по-другому происходит. Когда длина фраз в буфере предворительном превосходит заданное значение переключатель можно сделать видимым, а по умолчанию там символов происходит искуственный сброс из поля предварительного просмотра в результерующее. Во время этого сброса возможна потеря некотрых слов на границе. Буфер переполняется обычно при использовании виртуального кабеля и невнятной дикции. В принципе, можно было бы немного возвращать назад, но тогда дубли будут. В данном случае я спрашиваю у вас, стоит ли пытаться промотать немного назад секунды на две, три или это будет только мешать? Читайте внимательно инструкцию, программа бесплатная, транскрибирование. Индивидуальной поддержки не предусматривается. Если не получается- ставьте микрофон у колонок. При транскрибации с youtube error: Спасибо за подробную инструкцию. Другими словами есть некие видео в специальном формате и есть проигрыватель для этого формата. Конвертировать в MP3 пока не получается. Можно ли с помощью виртуальных или не виртуальных кабелей использовать SpeechPad для такого видео? В принципе блокноту все-равно откуда звук идет, единственно он при ошибках не сможет останавливать чужой проигрыватель. YouTube video, HTML5 video, HTML5 audio? Снимите флажок — Запускать синхронно с записью и ничего не выбирайте. А можно вообще просто в блокноте, не открывая модуль транскрибирования. Установил vbcable но не могу найти на компьютере панель управления им. В файла скачанных с сайта разработчика есть файл VC CABLE CONTROLPANEL запуская его открывается окно совсем не такое как в видео уроке. Я не использовал и не открывал эту панель. Просто установил нажал на setup драйверы. В звуковых настройках после этого появляются кабели как устройства. Здравствуйте, тут еще можно задавать вопросы. Не получилось у меня преобразовать английскую речь из мр3 в текст тоже английский. Подскажите пожалуйста что можно сделать чтобы поправить положение. И ещё, подскажите пожалуйста какие характеристики лучше всего выставлять на диктофоне для последующей транскрибации текста возможно в этом и есть проблема. Вы может либо воспользоваться временными метками и вручную делать транскрибацию, либо еще раз сделать ее методом проговаривания. Про диктофон ваш ничего сказать не могу пробуйте сами. При транскрибировании думаю, что защиту от шумов надо в этом случае ставить время перезагрузки и следить за уровнем звука. Может быть кто-то подскажет, почему на планшета при голосовом вводе одно слово дублируется, то есть печатается раз? Перевод аудио в текст без микрофона 62 комментария. Использование виртуального кабеля Нашел сегодня бесплатную замену программе Virtual audio cabel VAC. Результат перевода аудио с помощью колонок и микрофона Результат перевода аудио с помощью программы VB-CABLE Настройка виртуального кабеля 1. Использование физического кабеля 2. Транскрибирование аудио в Linux Для Linux организация виртуального кабеля делается средствами самой операционной системы. Перевод аудио в текст без микрофона: Добавить комментарий Отменить ответ Ваш e-mail не будет опубликован. Комментарий Имя E-mail Сайт. Ресурсы по голосовому вводу Последние изменения в голосовом блокноте. Сайт работает на WordPress.


Перевод аудио в текст без микрофона


Друзья, всем хорошего настроения! В этой статье поговорим о том, что под собой подразумевает такое понятие, как транскрибация аудио в текст онлайн. Вернее, даже не только аудио, но и видео. Оказывается, это перевод речи на "бумагу". То есть смысл заключается в том, что при помощи специальных сервисов можно переложить звуковую дорожку аудио или видеофайлов в обыкновенную текстовку. Думается, для ленивых студентов это просто находка. Необходимые настройки звуковой карты для транскрибации Простой и хорошо работающий сервис для транскрибации Вот и у автора статьи с недавних пор возникла острая потребность в транскрибации видеороликов. Поэтому давайте переходить к сути вопроса. Итак, первым делом идем на YouTube и выбираем там ролик, звуковую дорожку которого будем переводить в текст онлайн. Это позволит улучшить распознавание голоса диктора, что существенно уменьшит количество ошибок при дальнейшей транскрибации. После этого ставим видео на паузу, чтобы выставить нехитрые настройки звуковой карты компьютера. Для этого находим в системном трее значок в виде динамика и жмем по нему правой кнопкой мыши. В открывшемся контекстном меню выбираем пункт "Записывающие устройства": На следующем шаге необходимо снова нажать правой кнопкой в появившемся окошке со списком устройств и активировать опцию "Показать отключенные устройства": После этого должно появится новое устройство, которое называется стереомикшер. Делаем его используемым по умолчанию: Таким способ мы перевели входной поток с микрофона, ведь в нашем случае звук будет идти не с него, а из видеоролика. Теперь переходим к завершающему этапу, запуску онлайн-сервиса для транскрибации аудиопотока в текст. Для этого следует перейти по адресу dictation. Затем запускаем воспроизведение видеоролика и наблюдаем за волшебным процессом: Кстати, из всех подобных сервисов и программ, именно описанный в статье проявил себя лучше всех. А в завершение давайте посмотрим очередное интересное видео. С уважением, Комаровский Виталик. Светлана, дело в том, что это вообще не программа, а онлайн-сервис. Попробуйте использовать его в браузере Google Chrome, должно все получится. Именно в нем и использовала. Он не пишет текст, который говорят. Пять слов непонятных на английском написал и стоял на месте. Файл был на русском. Ваш e-mail не будет опубликован. Как качественно перевести аудио и видео в текст онлайн. Как скачать видео с YouTube онлайн бесплатно и без установки всяких левых программ Как эффективно проверить файл на вирусы онлайн. Очень простой способ Как скачать видео с YouTube на телефон Android. Или переходим на мобильные платформы Где скачать эмулятор Денди на компьютер с играми. Или привет от водопроводчика Марио Как смотреть онлайн фильмы со звуком 5. Запускаю файл и видео и программа ничего не записывает. В таком случае даже не знаю, чем Вам можно помочь. Как правило он пишет на том языке, который воспроизводится в файле. Добавить комментарий Отменить ответ Ваш e-mail не будет опубликован. Самое обсуждаемое Как добавить русский язык в Samsung Smart TV J и K серий гг. Функций море NstreamLmod 3. Или медиа-комбайн для Samsung Smart TV ForkPlayer для Samsung Smart TV года K-серия. Или возвращение легенды 2 Настройка IPTV на телевизоре Samsung Smart TV. Или как подружиться с Peers. TV Не поддерживается на вашем устройстве. Что делать и как обмануть Google Play Samsung Smart TV года J-серия. Или привет от производителя серым импортерам Настройка телевизора Samsung Smart TV. Инструкция для новичка от А до Я Twonky Server - простой и удобный медиа-сервер. Инструкция по установке и настройке Давайте рассчитаем таможенные пошлины на посылки из Китая в Беларусь. Да уж, теперь не разгонишься. Страницы блога Все статьи Главная Задать вопрос Конкурсы Поддержи проект Про автора Реклама на блоге. Рубрики и категории Видеонаблюдение Вокруг навигации Говорим про Android Делаем сами Личные заметки Медиа-сеть для дома Настройки Windows Наши конкурсы Покупки в интернете Полезные сервисы Полезный софт Самсунг Смарт ТВ Спутниковое ТВ. Популярные записи Сервисное меню телевизора Samsung. Русификация, смена региона ТВ и Smart Hub NstreamLmod 3. Или медиа-комбайн для Samsung Smart TV Бесплатные рабочие плейлисты для IPTV года. Где скачать в формате M3U Настройка телевизора Samsung Smart TV. Инструкция для новичка от А до Я Где скачать плейлист M3U для просмотра IPTV каналов года. Бесплатно и без регистрации Установка виджетов Samsung Smart TV с флешки. Главная Все статьи Про автора Конкурсы Задать вопрос Поддержи проект Заказать рекламу.


https://gist.github.com/d13a4818a843b02efef63925b85cd7a2
https://gist.github.com/273370daf75fa5f187a2f683b99d8c8a
https://gist.github.com/6531b4cc35001986eb7e186f53421fcb
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment