Skip to content

Instantly share code, notes, and snippets.

Show Gist options
  • Save anonymous/b7aa652d6d4452c41dae215ea20f82cd to your computer and use it in GitHub Desktop.
Save anonymous/b7aa652d6d4452c41dae215ea20f82cd to your computer and use it in GitHub Desktop.
Надо перевести видео и аудио в текст

Надо перевести видео и аудио в текст


Надо перевести видео и аудио в текст



Перевод аудио в текст без микрофона
Два сервиса распознавания речи и перевода в текст онлайн
Как расшифровывать аудиозаписи с помощью YouTube















Только полноправные пользователи могут оставлять комментарии. TM Feed Хабрахабр Geektimes Тостер Мой круг Фрилансим. Хабрахабр Публикации Пользователи Хабы Компании Песочница. Корпорация Добра не перестает удивлять. Уже слышал ранее как на базе разработок гугла можно распознавать речь в текст. В свое время очень сильно интересовался этим вопросом, искал решения программные и не только. Но достойных продуктов под руку не попадалось. Как уже узнал позже, все подобные системы используются спецслужбами и военными. Но дело сейчас не в этом. Обнаружил, что на всех свежих видео появилась кнопка Текст видео Тексты субтитров вместе с тайм-кодом можно копировать и использовать уже как хочется, например: Ранее эта функция была доступна только для англоязычных роликов. Качество распознавания зависит очень сильно от качества звука. Работа с 3D-графикой авторов , публикаций. Компьютерная анимация 12 авторов , 23 публикации. Дизайн игр 11 авторов , 48 публикаций. CGI графика 4 автора , 16 публикаций. Как создать билборд-текстуру растительности в Unreal Engine 4 2,3k 0. Добавить в закладки Синтез и распознавание речи в Asterisk. Зачем вы рекламируете госпожу Пеу… у? Ведь Нибиру не прилетела с ящерами захватчиками? Так вы что не в курсе кто эта женщина? И Все сразу сливать бегут. Для тех кто еще не смотрел… лучше не надо…. Да я сам виноват. Светлана Пеунова это чертовски интересная личность. Для меня такие люди — откровенно загадка. Это просто кладезь информации о психологии человека. Такие люди нужны чтобы почесать затылок — а не сошел ли я сума? Это существующий феномен и это реальность. Партия Воля — звездные войны отдыхают. Но это ведь не новость совсем. Давно уже эта функция существует…. НЛО прилетело и опубликовало эту надпись здесь. Не обязательно ее так далеко искать, можно просто нажать CC. Обнаружил недавно, посмотрел что на хабре про это не говорили решил опубликовать, возможно пригодится. Еще очень впечатлила функция стабилизации изображения. Снимал видео со снегохода на телефон, в исходнике все тряслось намного сильнее www. Снимал видео с велосипеда зимой, после того как включил стабилизацию все плавать начало и при просмотре от такого эффекта просто рвотный рефлекс Больше не пользовался. Видать на борту снегохода держать по-другому телефон неудобно, иначе долго его потом искать в снегу. Объясните, что движет людьми, когда они снимают видео вертикально. Зачем мне кому-то что-то объяснять: Не думал об этом, честное слово ;-. Было бы неплохо, если бы еще эти субтитры можно было скачать. Эта функция есть давно уже. Или статья про новую иконку на одном сайте? Почему же автоматических титров нет на моих видео, где говорит человек? Распознавания компьютерного голоса в текст на текущий момент не существует , ибо люди давно бы пользовались этим и писали бы тексты комментариев на хабре или курсовые в своих редакторах голосом. Всё, что показывают сегодня везде — это демонстрация интерфейсов доступа к живым людям-переводчикам. Какой смысл тогда было презентацию делать? Это не более чем маркетинговая фишка. Вероятно, это и компьютер. Какой-нибудь кластер в тысячи процессоров подключили на короткое время затратив на это миллионы долларов , чтобы показать публике простейший алгоритм поиска и сравнения среди готовой подготовленной базы голоса, которую обучили перед этим. Но чтобы выпустить это в широкий рынок, у них нет на это мощностей. Чтобы обслуживать миллионы людей — вряд ли. У них нет алгоритма прямого преобразования голоса в текст. У меня тоже конечно нет особо оснований, кроме догадок. Но когда вопросом распознавания голоса занимаются светлые умы человечества не один год, создание таких систем — вопрос времени. С учетом имеющихся вычислительных мощностей гугла, они могут позволить себе подобные самообучающиеся системы. Например, тот же перевод с англ на русский сейчас очень даже литературный. Но подобный перевод годится всё равно только для ограниченного набора применений. Распознавание речи есть и работает. В том же Андроиде к примеру ваш голос в поисковом запросе распознается сразу и довольно точно. Пролистал вниз, можете не отвечать. Тут ещё такой момент: Взять хотя бы автоматические субтитры к этому же ролику. Now, I want to come back to the topic of natural user interfaces. One of the most natural interfaces for people is human speech. And for the last sixty years computer scientists have been trying to find a ways to understand and recognize human speech. Now parlor i want to come back sousa ta of naturally surveys. What are the most natural interfaces for people is human speech. And for the last sixty years computer scientists at the trying to find ways to understand and right now humans to be. Now at the beginning put people first cards are homeless problem they look at it largely as a pattern matching in the early ancestors attempted to take the way before they came out uh… speakers boils. Попробуйте хотя бы клавиатуру Swift для Android. Она, на мой взгляд, имеет отлично реализованный движок, который преобразует вашу речь в текст. Не думаю, что за доли секунды она передает запись голоса китайцам, те его распознают, набирают в текст и он волшебным образом появляется у меня в смартфоне в окне набора СМС. К тому же, полагаю, Methos имел в виду пользователей YouTube в целом. Мне кажется это не так. Понимаю, что множество китайцев нечем занять, но какая выгода? Известно давно что гугл занимается голосовыми движками. Не более чем игрушка которой невозможно пользоваться. Попробовал сейчас надиктовать текст для комментария, вот что вышло: Болгария комментарии для того чтобы он написал его в поле ввода комментариев заказать талон голосового вызова нибулон То есть, для надиктовки длинных текстов это не годится. Если же диктовать медленно, а потом править ошибки, то быстрее всё равно писать на клавке. Вообще очень полезны ли сейчас я диктую мне пожалуйста напишите здесь без регистрации Хотя последние слова мои были " пожалуйста напишите здесь это без ошибок". То есть, видно, что их система использует словарь для исправления ошибок распознавания. Короткие же тексты люди быстрее напишут на клавке, чем будут нажимать на какие то клавиши и диктовать. Я сам, можно сказать профессионально, стенографирую различные материалы по работе чуть позже опубликую свой самодельный девайс для этого. Понимаю, что технически это очень сложная задача — распознавание текста. Да пусть даже в такой убогой реализации распознавания — этим можно пользоваться в своих личных интересах. Чем нам рядовым пользователям от этого хуже? Конечно, для личных можно. Тогда продукт готов к рынку, иначе это поделка, которой никто не будет доверять. Может и Siri тоже на самом деле специальный колл-центр из китайцев обслуживает? В интернете уже есть сайт, где собраны самые топовые ролики с самыми смешными субтитрами — funny-sub. Метки лучше разделять запятой. Сейчас Вчера Неделя Вещи, которые мне надо было знать прежде, чем создавать систему с очередью 4,9k Снимаем и вносим наличные в банкомате с помощью смартфона. Впервые в мире 11,1k Три дня как все кассы в стране должны стать онлайн на самом деле нет 40,4k Интересные публикации Хабрахабр Geektimes. Астробиологи из Эдинбургского университета считают, что жизни на Марсе нет из-за токсичных химических соединений GT. Нейросети диагностируют проблемы с сердцем более точно, чем врачи GT. За какие заслуги Kingston любят центры обработки данных? Вещи, которые мне надо было знать прежде, чем создавать систему с очередью. Обработка многократно возникающих SIGSEGV-подобных ошибок. Выбор алгоритма вычисления квантилей для распределённой системы. Как у Словакии украли национальный домен верхнего уровня. Разделы Публикации Хабы Компании Пользователи Песочница. Информация О сайте Правила Помощь Соглашение Конфиденциальность. Услуги Реклама Тарифы Контент Семинары.


Игры бой с тенью с читами играть
Войныза независимость сша таблица
Посудомоечная машина встраиваемая bosch инструкция
Военные стихи друниной
Карта майнкрафт огромный город
I lost my star in krasnodar перевод
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment