Выберите вариант загрузки:
- скачать с сервера SoftPortal (для Windows 32- и 64-bit, установочный exe-файл)
- скачать с официального сайта (для Windows 32- и 64-bit, установочный exe-файл)
Удобный в эксплуатации инструмент для автоматического преобразования речи в текст на различных языках. Помимо аудиофайлов (MP3, FLAC, WAV, OGG), это приложение также поддерживает видеофайлы, такие как MP4, WEBM, MKV, AVI, MPEG, MOV, WMV, FLV, TS (полное описание…)
Рекомендуем популярное
WinScan2PDF 8.67
Небольшая бесплатная портативная утилита, позволяющая сканировать документы с помощью…
Scan2PDF 1.7
Scan2PDF — небольшая программа, которая позволяет сканировать документы и изображения с…
Время на прочтение
7 мин
Количество просмотров 358K
Если вы работаете в digital-маркетинге, вам постоянно нужно взаимодействовать с текстом: записывать идеи, задачи, описывать концепции, писать статьи и многое другое. Иногда проще и быстрее надиктовать текст, чтобы не забыть важную мысль или задачу. Диктофон для этого подходит плохо: запись потом нужно будет расшифровывать и переводить в текст. А если оставлять голосовые заметки часто, то потом просто нереально быстро найти нужную информацию или бегло ее просмотреть.
Голосовой ввод текста помогает решить эту проблему. Вы диктуете — программа сразу переводит речь в текст, который вы можете сохранить как обычную заметку и дальше работать с ней спокойно работать.
В статье мы собрали подборку бесплатных сервисов голосового ввода, которые помогут вам:
- быстро и удобно делать заметки, когда нет возможности или времени записывать вручную;
- записывать голосом список задач;
- надиктовывать черновики статей и других текстов.
Берите на вооружение сервисы из подборки и тестируйте — все они бесплатные и неплохо распознают русский язык.
5 бесплатных онлайн-сервисов для голосового ввода
1. SpeechPad
https://speechpad.ru/
Speechpad — бесплатный сервис для голосового ввода текста. Доступен в трех форматах:
- онлайн-сервис;
- браузерное расширение — с его помощью можно вводить текст в любое поле для ввода;
- мобильное приложение для Android и iOS.
У сервиса также есть платные функции. Их два вида:
- дополнительные (расширенные). Включают в себя голосовой ввод в режиме интеграции с OS Linux и Windows, а также транскрибирование аудиофайлов длиной более 15 минут;
- премиум. Пакетное транскрибирование аудио и видео (больше двух файлов).
Онлайн-сервис
Интерфейс сервиса выглядит так:
Здесь есть несколько настроек, кнопки управления и поле, в котором отображается распознаваемый текст.
Что можно сделать сделать:
- настроить язык голосового ввода. Базово с списке доступно 14 языков (среди них русский, украинский, английский, немецкий). Если нужен другой язык, необходимо зарегистрироваться в сервисе. После этого в личном кабинете появится возможность добавить этот язык (если для него поддерживается распознавание речи);
- активировать опцию «Включить команды». Если вы авторизованы в личном кабинете, вы можете добавлять голосовые команды и использовать их при надиктовке текста. Например, удалить последний распознанный фрагмент текста;
- отключить управление заглавными буквами Google. По умолчанию в речи распознается начало предложений и автоматически проставляются заглавные буквы. Вы можете отключить эту опцию и самостоятельно редактировать предложения.
Обратите внимание! Онлайн-сервис Speechpad корректно работает только в браузере Google Chrome. Можно запускать его и в Яндекс.Браузере, но все же для корректной работы рекомендуется использовать именно Chrome.
Для начала распознавания текста нажмите кнопку «Включить запись» и предоставьте доступ к микрофону.
Затем надиктовывайте текст. Сначала распознанные слова появятся в поле справа от кнопки «Включить запись». После небольшой паузы они попадут в поле ниже (результирующее поле).
Над результирующем полем есть кнопки со знаками пунктуации. По ходу диктовки вы можете добавлять их вручную.
После того как вы закончили диктовку, просмотрите текст, исправьте ошибки (если есть). Затем скопируйте текст или скачайте в виде txt-файла.
Транскрибация
Также с помощью Speechpad можно переводить аудиозаписи разговоров в текст с помощью опции «Транскрибация».
Здесь можно будет загрузить аудио- или видеофайл, а также добавить ссылку на видео с Youtube.
После нажатия на кнопку «Включить запись» файл начнет проигрываться и система переведет речь в текст.
Расширение SpeechPad
Установите расширение из магазина расширений Google Chrome. После установки в контекстном меню в браузере (при клике правой кнопкой мыши на любой области экрана) появится пункт «SpeechPad».
Кликните правой кнопкой мыши по любому полю для ввода текста и выберите расширение из контекстного меню. Поле подсветится, и вы сможете голосом произнести фразу, которую нужно ввести в поле. Расширение распознает ее и отобразит в виде текста.
Мобильное приложение
Доступно две версии: для Android и iOS.
Приложение может работать в автономном режиме (без подключения к интернету). Так выглядит интерфейс приложения на Android:
В настройках можно управлять голосовыми командами (для расстановки знаков препинания и спецсимволов с помощью голоса):
2. VoiceNote
https://voicenote.in/
VoiceNote — еще один сервис для преобразования голоса в текст, который работает только в Google Chrome (также может работать в Яндекс.Браузере). При попытке запустить его в другом браузере появляется сообщение об ошибке.
Для голосового ввода через VoiceNote можно использовать Live Demo или отдельное приложение для Chrome.
Как пользоваться сервисом
Откройте редактор и выберите язык, на котором нужно распознавать речь. Для этого кликните по иконке земного шара и укажите нужный язык.
Затем кликните по значку микрофона и предоставьте сервису доступ к микрофону вашего компьютера или ноутбука.
После этого система начнет запись и вы сможете надиктовывать текст. Распознанный текст появится в редакторе. Возможности:
- можно проговаривать знаки препинания словами;
- голосовой командой можно перевести текст на новую строчку;
- с помощью панели инструментов можно вручную добавлять знаки препинания и спецсимволы прямо во время диктовки;
- готовый текст можно отредактировать и сохранить в txt-файле.
3. Voice Notepad
https://dictation.io/speech
Еще один сервис для голосового ввода текста. Как и остальные сервисы, работает только в браузере Google Chrome.
У сервиса простой интерфейс. Здесь есть:
- возможность выбрать язык распознавания (сервис работает на основе движка Google Speech Recognition и может распознавать речь на более чем 100 языках);
- текстовое поле — здесь будет появляться распознанный текст, который можно отформатировать: выделить полужирным, курсивом или подчеркиванием, оформить списки, добавить или убрать отступы, задать выравнивание;
- кнопки управления — кнопка Start активирует распознавание речи. С помощью остальных кнопок можно копировать текст, сохранять в txt-файл, публиковать и совершать другие действия.
Сервис поддерживает голосовые команды. Например, с помощью команды можно перевести текст на новую строку, поставить тире или другие знаки препинания, спецсимволы и т. д.
Полный список поддерживаемых команд для русского языка — здесь.
4. Speechtexter.com
https://www.speechtexter.com/
Бесплатный онлайн-сервис для распознавания речи. Достаточно неплохо распознает русский язык. Всего поддерживает более 60 языков.
У SpeechTexter есть веб-версия (работает только в Google Chrome) и мобильное приложение для Android.
Для начала работы с сервисом необходимо выбрать язык распознавания и нажать кнопку Start (предоставив доступ к микрофону).
В текстовом поле есть несколько полезных функций:
- счетчик слов, распознанных системой;
- инструменты редактирования текста: выделение полужирным, курсивом, подчеркиванием, выравнивание текста, изменение размера шрифта. Также можно менять цвет текста, создавать нумерованные и ненумерованные списки;
- можно включить ночной режим — полезно, если вы используете сервис вечером или ночью.
В правой части интерфейса размещен блок со стандартными голосовыми командами для добавления знаков препинания и нового абзаца:
На вкладке Custom можно создать свои команды, например для добавления кавычек.
После завершения диктовки текст можно отредактировать и сохранить в файле:
- в txt-файле;
- документом Microsoft Word.
5. TalkTyper
https://talktyper.com/ru/index.html
Простой онлайн-сервис для голосового ввода с поддержкой 37 языков.
В этом сервисе минимум функций, однако с распознаванием русского языка он справляется вполне неплохо. Для начала распознавания речи необходимо нажать на значок микрофона, разрешить его использование в браузере и начать диктовку текста.
Если сервис распознал фразу неправильно, нажмите на значок «Варианты»:
Если среди предложенных вариантов нет правильного, текст можно поправить вручную.
После завершения распознавания вы можете сохранить текст в txt-файле, скопировать, распечатать или отправить на почту.
Дополнительные инструменты для голосового ввода текста
Яндекс.Клавиатура и GBoard (Google Клавиатура)
Если вы большую часть времени работаете со смартфона и хотите использовать возможность голосового ввода текста, воспользуйтесь функционалом голосового ввода, который есть в клавиатурах от Google и Яндекс:
- GBoard — клавиатура от Google. Для Android и iOS;
- Яндекс.Клавиатура. Для Android и iOS.
Так вы сможете надиктовывать текст в любом приложении, которое вы обычно используете для организации личных и рабочих заметок, задач и подобного (Google Keep, Notion, Trello и т. д.).
Воспользоваться голосовым вводом просто:
- Откройте нужное приложение (например, Google Keep) и создайте заметку;
- Откройте клавиатуру и нажмите на значок микрофона (ниже пример, как это сделать в GBoard);
- Начните диктовать заметку. Система распознает речь и преобразует ее в текст.
Голосовой ввод на GBoard (клавиатуре от Google)
Google Docs
Тем, кто много работает с Google Документами, пригодится встроенная функция голосового ввода (поддерживает русский язык).
Если вы еще не знали о ней, вот как ее включить: «Инструменты» → «Голосовой ввод».
Слева появится всплывающее окошко с выпадающим списком для выбора языка речи и кнопкой с иконкой микрофона.
Выберите нужный язык, нажмите на кнопку и начните диктовать текст.
Рекомендации, которые помогут улучшить качество распознавания текста
Все сервисы, которые мы привели в подборке, достаточно хорошо распознают русский язык, однако иногда качество распознанного текста может быть посредственным. Чтобы такого не происходило, следуйте нескольким базовым рекомендациям.
- Используйте хороший микрофон. Идеально, если у вас есть качественная гарнитура или внешний микрофон с шумоподавлением. Если же используете встроенный микрофон компьютера/ноутбука, убедитесь, что микрофон исправно работает, ничем не прикрыт, а вы находитесь достаточно близко, чтобы звук хорошо улавливался устройством.
- Произносите слова четко и неторопливо. Хорошая дикция определенно будет плюсом. Чем четче вы произносите слова, тем выше вероятность, что сервис сможет корректно распознать речь (даже если качество микрофона оставляет желать лучшего). Также не стоит произносит фразы слишком быстро, в этом случае часть слов может быть не распознана и текст придется редактировать.
- Позаботьтесь, чтобы вокруг вас не было посторонних звуков и шумов. Для качественного распознавания речи вокруг не должно быть музыки и других громких звуков.
Соблюдайте эти рекомендации и необходимость правок будет минимальной.
Представляем четыре способа преобразовать речь в текст, используя бесплатные программы и приложения.
Преобразование речи в текст непосредственно в Word
С помощью Microsoft Dictate вы можете диктовать и даже переводить текст прямо в Word.
- Скачайте и установите бесплатную программу Microsoft Dictate.
- Затем откройте Word – в нем появится вкладка Dictation. Кликнув на нее, вы увидите значок микрофона с командой Start.
- Рядом находится выбор языка. Выберите русский язык и начните запись. Старайтесь произносить слова максимально четко, и они появятся прямо в документе.
Превращаем речь в текст с помощью Speak a Message
Бесплатная программа Speak A Message записывает произнесенный текст, а затем расшифровывает его. Основные языки программы — английский, немецкий, испанский и французский, но есть и мультиязычная версия.
- Установите программу и нажмите кнопку «Запись». Произнесите весь текст, а затем кликните «Стоп».
- Под кнопкой записи рядом с записанными файлами вы найдете функцию «Транскрипция» — «Речь в текст».
- Скопируйте готовый текст и вставьте его в нужный текстовый редактор. Но не забудьте проверить то, что записала программа — иногда она допускает ошибки.
Преобразуем речь в текст без специальных программ
В операционной системе Windows 8 и 10 вам не требуется дополнительное программное обеспечение для преобразования голоса в текст.
- Нажмите на клавишу Windows и введите «Распознавание речи». Затем откройте совпадающий с запросом результат и следуйте указаниям программы.
- После завершения настройки запустите приложения и диктуйте текст прямо в документе Word. Для этого просто нажмите на кнопку микрофона и начните говорить.
Преобразование речи в текст через приложение
Если вы хотите диктовать тексты и получать их в напечатанном виде прямо на ходу, используйте специальные приложения.
- Android и iOS уже интегрировали в свои системы функцию распознавания речи. Когда вы открываете приложение для создания заметок и начинаете набирать текст, используйте значок микрофона, чтобы запустить распознавание голоса.
- Есть и другие приложения для аналогичной цели, например Dragon Dictation, доступное для Android и iOS.
Читайте также:
- Как в Outlook организовать быструю вставку текстовых фрагментов с помощью шаблонов
- Как преобразовать голосовое сообщение в текст в WhatsApp?
Фото: компания-разработчик
Редактор направлений «Мобильные устройства» и «Техника для дома»
Ни одна программа не сможет полностью заменить ручную работу по расшифровке записанной речи. Однако существуют решения, которые позволяют существенно ускорить и облегчить перевод речи в текст, то есть, упростить транскрибацию.
Содержание:
1. Транскрибация — что это
2. О проблемах, связанных с переводом речи в текст
3. Сервис oTranscribe в помощь при ручной транскрибации
4. Гугл Документы для автоматического перевода вашей речи в текст
5. Сайт speechpad.ru
6. Сервис dictation.io
7. RealSpeaker
8. Speechnotes
9. Dragon Dictation
10. Биржи фриланса для расшифровки аудио и видео в текст
Что такое транскрибация
Транскрибация – это автоматический или ручной перевод речи в текст, точнее, запись аудио или видео-файла в текстовом виде.
Есть в интернете оплачиваемые платные задания, когда за транскрибацию текста исполнителю выплачивается некоторая сумма денег. В этом случае транскрибацию, в основном, делают вручную.
Однако можно сделать транскрибацию автоматически, с помощью специальной программы, умеющей «слушать» текст и одновременно «печатать» его, превращать в текстовый файл, пригодный для дальнейшего использования.
Перевод речи в текст вручную или с помощью специальной программы полезен
- студентам для перевода записанных аудио- или видео-лекций в текст,
- блогерам, ведущим сайты и блоги,
- писателям, журналистам для написания книг и текстов,
- инфобизнесменам, которым нужен текст после проведенного ими вебинара, выступления и т.д.,
- фрилансерам, которые вручную делают перевод речи в текст, для облегчения и ускорения своей работы,
- людям, которым сложно печатать – они могут надиктовать письмо и послать его родным или близким,
- другие варианты.
О проблемах автоматического перевода речи в текст
Можно выделить две крупных проблемы перевода речи в текст с помощью программы: качество записанной речи и наличие в записи фона в виде шума, музыки или иных посторонних звуков.
Речь у всех людей разная:
- настолько быстрая, что слова проглатываются, или, наоборот, очень медленная;
- с четкой дикцией, как у профессиональных дикторов, или настолько невыразительная, что сложно что-либо разобрать;
- с отличным произношением или, напротив, с сильным акцентом, например, когда говорит иностранец.
В каких случаях программа автоматической транскрибации будет давать самый наилучший результат перевода речи в текст? Программа будет делать более или менее качественный перевод, когда на записи человек говорит с четкой дикцией, с нормальным темпом речи, без акцента. При этом в записи речи отсутствуют посторонние звуки в виде шума, музыки, разговоров других людей. Тогда можно надеяться на хороший автоматический перевод, не требующий ручных исправлений или с минимальными изменениями.
В остальных случаях, когда речь невыразительная и присутствуют посторонние шумы, перевод с помощью программы или приложения будет значительно хуже. Возможно, какая-то программа или сервис будет выполнять транскрибацию такой речи лучше, чем другие программы и приложения, но все-таки не стоит ожидать чуда.
В некоторых случаях стоит обратиться на биржу фриланса, где живой человек выполнит перевод вручную. Впрочем, здесь тоже нельзя гарантировать высокого качества, поскольку фрилансер может использовать программы автоматической транскрибации, и он может полениться внести в получившийся текст правки.
Опишем наиболее эффективные инструменты, доступные на компьютере, мобильные приложения и онлайн-сервисы для перевода речи в текст.
Сервис oTranscribe для ручной расшифровки аудио в текст
oTranscribe — сервис для ручной транскрибации аудио в текст
Начнем с бесплатного сервиса oTranscribe, который упрощает работу при РУЧНОМ переводе речи в текст.
Бесплатный сайт в помощь при ручной транскрибации аудио в текст https://otranscribe.com/
— Может ли oTranscribe преобразовать аудио в текст автоматически?
— Нет, oTranscribe помогает сделать ручную расшифровку аудио проще и менее трудоемкой.
Этот сервис будет полезен для тех, кто периодически расшифровывает (транскрибирует) аудио в текст. Сервис oTranscribe. Бесплатный.
Для ручной транскрибации на oTranscribe можно выбрать аудио или видео файл со своего компьютера, либо вставить ссылку на видео с Youtube.
В чем удобство сервиса?
Во-первых, все находится в одном окне и не надо ничего устанавливать на компьютер. oTranscribe проще и удобнее, чем другой сайт Express Scribe.
Во-вторых, когда ставишь на паузу, аудио откатывается на пару секунд назад. То есть на те критические секунды, из-за которых приходится перематывать, если что-то не успел. Работа так идет в разы быстрее!
В-третьих, одна кнопка для запуска и пуска, самая удобная на клавиатуре — это клавиша Esc.
Кроме того, минималистичный рабочий стол. Серые поля, ничто не отвлекает от работы. Сервис считает слова и сохраняет историю. Текст сохраняется при обновлении страницы.
Гугл Документы: Вы говорите, а компьютер записывает речь в виде текста
В Гугл Документах есть удобный, бесплатный сервис, когда Вы говорите, и при этом ваша речь сразу воспроизводится в виде текста на экране компьютера. Чтобы использовать такой сервис, понадобится браузер Гугл Хром и аккаунт в Гугле.
Подробнее: Голосовой ввод в Гугл Документах для перевода речи в текст
Сайт speechpad.ru
Это онлайн-сервис, который позволяет через браузер Google Chrome переводить речь в текст. Сервис работает с микрофоном и с готовыми файлами. Конечно, качество будет значительно выше, если использовать внешний микрофон и диктовать самому. Однако сервис неплохо справляется даже с видеороликами на YouTube.
https://speechpad.ru/
Нажимаем «Включить запись», отвечаем на вопрос про «Использование микрофона» – для этого кликаем «Разрешить».
Длинную инструкцию про использование сервиса можно свернуть, нажав на кнопку 1 на рис. 3. От рекламы можно избавиться, пройдя несложную регистрацию.
Рис. 3. Сервис speechpad
Готовый результат легко редактируется. Для этого нужно либо вручную исправить выделенное слово, либо надиктовать его заново. Результаты работы сохраняются в личном кабинете, их также можно скачать на свой компьютер.
Список видео-уроков по работе с speechpad:
https://speechpad.ru/help.php
Можно транскрибировать видео с Youtube или со своего компьютера, правда, понадобится микшер, подробнее:
Видео «Транскрибирование аудио»
Работает сервис с семью языками. Есть небольшой минус. Он заключается в том, что если нужно транскрибировать готовый аудио-файл, то его звучание раздаётся в колонки, что создает дополнительные помехи в виде эха.
Сервис dictation.io
Замечательный онлайн-сервис, который позволит бесплатно и легко переводить речь в текст. Работает только в браузере Google Chrome.
dictation НЕ работает, если на вашем компьютере установлена Windows 10 ДОМАШНЯЯ версия.
Рис. 4. Сервис dictation.io
1 на рис. 4 – русский язык можно выбрать в конце страницы.
Примечательно то, что реализована возможность автосохранять готовый результат. Это убережет от случайного удаления в результате закрытия вкладки или браузера. Готовые файлы этот сервис не распознает. Работает с микрофоном. Нужно называть знаки препинания, когда производите диктовку.
Перейти на сервис: https://dictation.io/
Текст распознается достаточно корректно, орфографических ошибок нет. Можно самостоятельно вставлять знаки препинания с клавиатуры. Готовый результат можно сохранить на своем компьютере.
Подробнее о том, как работать с этим онлайн-сервисом показываю и рассказываю в видео:
RealSpeaker
Эта программа позволяет легко переводить человеческую речь в текст. Она предназначена для работы в разных системах: Windows, Android, Linux, Mac. С ее помощью можно преобразовывать речь, звучащую в микрофон (например, он может быть встроен в ноутбук), а также записанную в аудиофайлы.
Может воспринимать 13 языков мира. Существует бета-версия программы, которая работает в режиме онлайн-сервиса:
https://realspeaker.net/
Нужно перейти по указанной выше ссылке, выбрать русский язык, загрузить на онлайн-сервис свой аудио- или видео-файл и оплатить его транскрибацию. После транскрибации можно будет скопировать полученный текст. Чем больше файл для транскрибации, чем больше времени понадобится на его обработку, подробнее:
В 2017-ом году был бесплатный вариант транскрибации с помощью RealSpeaker, с 2018 года такой возможности нет. Вероятно для того, чтобы транскрибированный файл был недоступен всем пользователям для скачивания, необходимо наличие галочки напротив «Сделать файл неудачным в течение 24 часов».
На сайте есть онлайн-чат. Кнопка, чтобы начать чат, находится в правом нижнем углу сайта.
Speechnotes
Альтернатива предыдущему приложению для мобильных устройств, работающих на Android. Доступно бесплатно в магазине приложений:
https://play.google.com/store/apps/details?id=co.speechnotes.speechnotes&hl=ru
Текст редактируется автоматически, в нем расставляются знаки препинания. Очень удобно для того, чтобы надиктовывать себе заметки или составлять списки. В результате текст получится весьма достойного качества. Есть платная премиум-версия.
Dragon Dictation
Это приложение, которое распространяется бесплатно для мобильных устройств от компании Apple.
Программа может работать с 15 языками. Она позволяет редактировать результат, выбирать из списка нужные слова. Нужно четко проговаривать все звуки, не делать лишних пауз и избегать интонации. Иногда возникают ошибки в окончаниях слов.
Приложение Dragon Dictation используют обладатели яблочных гаджетов, например, чтобы, перемещаясь по квартире, надиктовать список покупок в магазине. Придя туда, они могут посмотреть на текст в заметке, и не надо слушать.
Какую бы программу Вы ни использовали в своей практике, будьте готовы перепроверять результат и вносить определенные коррективы.
Только так можно будет получить безукоризненный текст без ошибок.
Расшифровка аудио и видео в текст на биржах фриланса
Что касается ручного перевода, то можно заказать на бирже фриланса расшифровку речи в текст. На бирже фриланса одни пользователи (заказчики) размещают заказ, выбирают исполнителя и оплачивают работу. А другие пользователи (фрилансеры) берут заказы, выполняют необходимую работу и получают за нее оплату.
Как же можно сделать заказ на бирже фриланса? Сначала нужно зарегистрироваться на сайте биржи, то есть пройти там регистрацию. Затем можно будет разместить заказ — задание на транскрибацию.
Для своего заказа на бирже можно выбрать исполнителя — человека, который будет делать транскрибацию. Для этого необходимо, чтобы хотя бы один из потенциальных исполнителей согласился взяться за предложенную работу. Если же никто не взял заказ, то нужно менять его параметры, например, повышать цену за работу.
Оплата за выполненную работу осуществляется не напрямую исполнителю-фрилансеру, а через биржу фриланса. При размещении заказа обычно требуется пополнить счет на сумму, необходимую для выполнения транскрибации. Кроме того, может быть комиссия биржи за посредничество в виде фиксированной суммы или фиксированного процента от суммы заказа. Оплата работы проводится после ее проверки и одобрения заказчиком. Чаще всего сумма отправляется исполнителю одновременно с одобрением его работы заказчиком.
Прежде чем делать заказ, стоит прочитать правила биржи, касающиеся проверки выполненного задания, его оплаты, а также ввода и вывода денег на биржу. Вывод денег нужен, чтобы оставшиеся деньги, планировавшиеся для оплаты других заказов, могли вернуться обратно заказчику, а не остались бы навсегда на бирже.
Ниже предлагаю две известных биржи фриланса, где можно разместить заказ для перевода речи в текст с помощью фрилансера: weblancer.net и freelance.ru.
Две биржи фриланса
Расшифровка аудио и видео в текст (транскрибация) на бирже фриланса weblancer.net:
Биржа фриланса weblancer.net
https://www.weblancer.net/jobs/transkribatciya-97/
Другая биржа, где можно заказать расшифровку аудио/видеозаписей — freelance.ru
Биржа фриланса freelance.ru
https://freelance.ru/projects/?cat=124&spec=612
Дополнительные материалы:
1. Голосовой поиск на компьютере через Гугл Хром или Яндекс Браузер
2. Субтитры в Скайпе для перевода речи в текст во время общения
3. При просмотре роликов на ноутбуке заикается звук
4. Как всегда открывать видео удобным плеером в Windows 10
5. Оповещения Google Alerts – зачем и как пользоваться, примеры использования
Статья впервые была опубликована 5 июля 2017 г.,
последнее обновление 13 мая 2021 г.
Получайте новые статьи по компьютерной грамотности на ваш почтовый ящик:
Необходимо подтвердить подписку в своей почте. Спасибо!
Если вы работаете с видео или аудио, то наверняка находитесь в поисках удобных программ для расшифровки речи в текст. Например, для субтитров или написания статей. В этом материале мы собрали сервисы и программы для транскрибации голоса в письменный формат.
Содержание:
- Что такое транскрибация и зачем нужна расшифровка
- Сервисы, которые облегчат ручную расшифровку
- Программы для транскрибации текста
- Расширение для браузера
- Заключение
Что такое транскрибация и зачем нужна расшифровка
Транскрибация — это расшифровка информации из аудио или видео в текстовую форму. Это может быть актуально для слабослышащих пользователей или для тех, кто предпочитает потреблять контент в беззвучном режиме, получая информацию из письменной речи.
Цель транскрибации — качественно перевести речь в текстовый формат, который человек будет хорошо понимать при прочтении.
Задачи расшифровки:
- Разобрать все сказанное спикерами.
- Разбить речь на предложения.
- Убрать слова-паразиты и паузы.
Расшифровка используется в субтитрах к видео, в статьях и постах, а также для анализа и исследований.
Ниже представлена таблица, в которой мы указали, где используют расшифровку.
Вид транскрибации | Особенности |
Надиктовка | Автор читает подготовленный текст — медленно, с выражением и расстановкой знаков препинания. Текст может использоваться для статей, постов, ведения блога или написания материала в журнал |
Лекция | Студенты записывают речь преподавателя на диктофон для дальнейшей расшифровки лекций, в тексте которых встречаются сложные термины и незнакомые имена. Используется, когда лектор быстро говорит — и записать материал в такой ситуации очень сложно |
Подкаст | Формат радио, в котором редко встречаются проблемы с речью. Подкаст может быть монологом или диалогом. При расшифровке нужно учитывать, кто говорит — обязательно укажите имя человека. Расшифровка нужна для субтитров |
Интервью | Формат, в котором участвует двое и более человек. Расшифровка нужна для субтитров в видео, написания статьи или поста. Жесткая дословность не требуется, в приоритете — передать эмоции и главную мысль интервьюируемого |
Синхрон | Похож на интервью. В кадре эксперт дает комментарий по какой-то теме, камера записывает не только голос, но и звуковой фон, который сопровождает запись |
Вебинар | Речь одного или нескольких экспертов вебинара. Расшифровка похожа на формат подкаста — нужно указать имя говорящего. Транскрибацию используют для субтитров, написания статьи или книги |
Фокус-группа | Фокус-группа используется в маркетинговых исследованиях и социологических опросах. Сложный формат для расшифровки. Изначально все люди могут говорить спокойно, но под конец многие начинают перебивать друг друга. Чтобы этого избежать — задавайте вопросы каждому участнику по очереди. Расшифровка нужна для отчетов, анализа и исследований |
Конференция | В конференции есть ведущий (он же — модератор) и спикеры. Здесь также важно указать имя говорящего. Расшифровка используется для субтитров, написания статей и постов |
Телефонные разговоры | Расшифровка используется для анализа клиентов, сбора данных о них — интересы, потребности, боли и проблемы. Также это помогает улучшить качество работы менеджеров. Транскрибация звонков используется не только для бизнеса, но и для решения более специфических задач — например, силовики могут прослушивать разговоры потенциальных преступников |
Субтитры | Используются в видео. Текст должен точно повторять речь говорящего. А чтобы разбить ее на подтемы — используйте тайм-коды |
Монтажный лист | Применяется в кино и клипах. Это таблица, в которой указаны кадры с репликами героев и техническими комментариями. Здесь нужно не только расписать речь персонажа, но и зафиксировать все, что в данный момент находится в кадре |
Далее мы рассмотрим не только программы для автоматической транскрибации, но и сервисы для ручной расшифровки.
Сервисы, которые облегчат ручную расшифровку
В этом разделе мы собрали подборку популярных сервисов для расшифровки аудио и видео в текст.
Google Docs
Google Docs — онлайн-сервис для работы с текстом и данными. Внутри платформы можно включить микрофон, который поможет перевести речь в письменный формат.
Чтобы активировать данную функцию, выберите «Создать документ». Далее в верхнем меню найдите раздел «Инструменты» и выберите «Голосовой набор». Либо зажмите кнопки «Ctrl+Shift+S» для вызова команды.
Особенности:
- Работать с файлом могут несколько человек одновременно.
- Подходит для исследований, расшифровки телефонных звонков и анализа потребителей.
Плюсы:
- Бесплатный продукт.
- Автоматическое сохранение текста.
- Возможность сразу же отредактировать материал.
Минусы:
- Медленная расшифровка.
- Сервис распознает не все слова. Требуется хорошая надиктовка, чтобы получить качественный текст.
- Сервис не сможет распознать запись из другой вкладки браузера или плеера. Нужно все записывать в микрофон — то есть с другого устройства: диктофона, телефона, телевизора или компьютера.
Dictation.io
Dictation.io — простой сервис расшифровки речи на английском языке.
Особенности:
- Готовый материал можно скачать, опубликовать в Твиттере или отправить электронным письмом.
Плюсы:
- Бесплатная программа.
- Встроенный редактор текста.
- Более 100 языков озвучки.
Минусы:
- Не поддерживает работу с готовыми файлами.
oTranscribe
oTranscribe — бесплатный сервис для самостоятельной расшифровки речи в текст.
Особенности:
- Есть функция отслеживания тайм-кодов.
- Возможность восстановить прошлый проект из истории.
- Работает со ссылками из YouTube и файлами: WAV, MP3, MPEG, WEBM и многими другими.
- Сохраняет документы в формате OTR.
Плюсы:
- Минималистичный редактор текста.
- Автоматически сохраняет документ в формате HTML5.
- Для удобства пользования можно настроить горячие клавиши.
Минусы:
- Нет автоматизации процесса, все нужно делать вручную.
Transcribe by Wreally
Transcribe by Wreally — универсальный сервис, в котором вы можете расшифровать файл или самостоятельно продиктовать текст. Подписка стоит 20 долларов в год. Есть тестовый период 7 дней, в котором вы можете безлимитно использовать самостоятельную расшифровку и 30 минут для автоматической транскрибации.
Особенности:
- Поддерживает форматы файлов — 3GP, AAC, AIF, AIFF, AMR, CAF, DSS, FLAC, M4A, MOV, MP3, MP4, OGG, WAV, WEBM, WMA, WMV.
- Максимальный размер файла — 6 гигабайт, или 420 минут.
- Готовый документ можно скачать в формате DOC.
Плюсы:
- Простой в управлении сервис.
- Есть редактор текста в самостоятельной расшифровке.
- Поддерживает ссылки с YouTube.
- Есть тайм-коды.
- Файлы можно загрузить как с ПК, так и с облачных сервисов.
- Есть инструкция, как пользоваться сервисом.
- Поддерживает большое количество языков и диалектов.
- Есть горячие клавиши для быстрой работы.
Минусы:
- Требуется регистрация.
- Платный сервис.
Алгоритм YouTube — встроенные субтитры
Субтитры YouTube — это возможность не только автоматически создать текст, но и самостоятельно расшифровать речь из видео.
Ниже показан пример, как работают автоматические субтитры: текст воспринимается нечетко. Если прозвучало иностранное слово, оно будет переделано под выбранный язык, а не переведено. Также если человек запнулся, алгоритм подберет свой вариант слова.
Чтобы самостоятельно расшифровать речь в YouTube, зайдите в «Творческую студию», перейдите в настройки видео и найдите раздел «Субтитры». В открывшемся окне выберите «Синхронизировать автоматически».
Рекомендуем к прочтению! Узнайте, как раскрутить канал на Ютубе и где найти идеи для новых видео.
Особенности:
- Блогерам удобно работать на одной площадке — редактировать ролик и настраивать субтитры.
- Есть возможность самостоятельно настроить субтитры.
Плюсы:
- Бесплатный инструмент.
- Простой сервис.
Минусы:
- Нечеткое восприятие речи — текст с непонятными словами и разрывами.
- Работает только с качественным видео и аудио. Если речь сложно разобрать — автоматическая настройка субтитров не сработает.
Dragon Dictation
Dragon Dictation — платное приложение для iOS. Есть тестовый период на неделю, далее необходимо оформить подписку — 14,99 долларов в месяц.
Особенности:
- Поддерживает до 15 языков.
- Подходит для ежедневных дел — отчетность, исследования.
Плюсы:
- Позволяет только диктовать текст.
Минусы:
- Нельзя расшифровать файлы или ссылки из YouTube.
- Платное приложение.
Speechnotes
Speechnotes — онлайн-сервис для браузеров и приложение для Android.
Скриншот того, как выглядит онлайн-версия, где можно надиктовать текст.
Пример работы приложения:
Особенности:
- В приложении можно сохранять файлы в облако или отправлять в соцсети и по email.
- Онлайн-сервис воспринимает знаки препинания, а приложение распознает еще и смайлики.
Плюсы:
- Сохраняет документ в форматах DOC и TXT. Приложение также позволяет работать с PDF.
- Простой интерфейс.
- Есть редактор текста.
- Более 50 языков.
Минусы:
- Платный сервис.
Переводчик Google
Переводчик Google — сервис для перевода с одного языка на другой. Здесь вы можете надиктовать материал, трансформировать записанную речь в текст — и перевести его на другой язык. Либо включить видео или аудио на ПК или в соседней вкладке и дать сервису записать речь.
Особенности:
- Сервис может записать речь и перевести ее.
- Максимальный объем текста — 5000 символов.
Плюсы:
- Бесплатный инструмент.
- Простой интерфейс.
Минусы:
- Перевод может быть некорректным.
- Распознавание слов не всегда соответствует действительности.
Rev
Rev — платный сервис с искусственным интеллектом. Транскрибация и создание видео стоят от 1,25 долларов.
Важно! Подобные сервисы с такими же функциями, но стоимость услуг у них выше: Transcription Panda и GoTranscript.
Особенности:
- Высокое качество перевода речи в текст.
- Можно расшифровать любой тип и формат аудио или видео.
Плюсы:
- Быстрая расшифровка.
- Удобный интерфейс.
Минусы:
- Платный сервис.
Temi
Temi — еще один быстрый сервис от создателей Rev. Точность транскрибации — 90-95%. Бесплатно можно расшифровать 45 минут, далее требуется оплата — 0,25 долларов за минуту.
Особенности:
- Высокая точность транскрибации.
Плюсы:
- Быстрая расшифровка.
Минусы:
- Платный сервис.
- Запись изначально не должна содержать шум, чтобы получилась качественная расшифровка.
Программы для транскрибации текста
А здесь мы собрали варианты программ для профессиональной работы с расшифровкой речи в текст.
Express Scribe
Express Scribe — программа от Windows, которая поддерживает редактор текста Word. В бесплатной версии можно работать только с аудиофайлами. Расширенная версия стоит 59,99 долларов.
Особенности:
- Позволяет загружать файлы с различных источников — например, дисков, FTP-серверов, электронных ящиков.
- Интеграция с MS Word, Corel WordPerfect, Lotus WordPro.
- Есть функционал, помогающий работать с шумом, фильтрацией частот и громкостью голоса.
Плюсы:
- Работает с многими форматами — например, MP3, WAV, MP4, 3GP.
- Поддерживает воспроизведение аудио и видео.
- Горячие клавиши.
- Установка тайм-кодов.
- Совместима с ножной педалью — используется геймерами и профессиональными расшифровщиками.
Минусы:
- Платная программа.
- Устаревший интерфейс.
Расширение для браузера
Ниже представлен список расширений для браузера, которые помогут вам работать с транскрибацией в любое время.
VoiceIn Voice Typing
VoiceIn Voice Typing — расширение создано на основе распознавания речи от Google. Оно позволяет использовать расшифровку на любом сайте и при этом работать в любом редакторе. Есть пробная версия с минимальными возможностями. Подписка стоит 25 долларов в год.
После установки расширения разработчик рекомендует закрыть браузер и загрузить его снова, чтобы распознавание речи сработало.
Важно! Ряд похожих расширений для браузера — Speech Recognition Anywhere и Voice to Text.
Особенности:
- Можно использовать для диктовки текстов для сайта, заполнения форм и для того, чтобы оставить комментарий.
Плюсы:
- Поддерживает более 120 языков.
Минусы:
- Полный функционал доступен в платной версии.
Заключение
В этой статье мы рассмотрели программы для транскрибации — узнали их особенности, плюсы и минусы. Вы можете использовать не только готовые сервисы, в которых люди или ИИ будут расшифровывать файлы, но и самостоятельно заняться транскрибацией аудио и видео.
Рекомендации по работе с расшифровкой:
- При уменьшении скорости воспроизведения транскрибация проходит с наименьшим количеством ошибок.
- Если вы набираете текст вручную, действуйте по следующей схеме: прослушали запись — поставили на паузу — записали и отредактировали.
- Используйте горячие клавиши для работы с шаблонами. Если у вас часто повторяется одно и то же слово — используйте клавишу вместо того, чтобы заново его набирать.
- Все правки и корректировки делайте в конце, когда уже расшифровали весь текст.
- Если у вас высококачественное видео или аудио — используйте автоматические инструменты.
- В случае, когда на записи есть шумы, а сам звук плохого качества — попробуйте самостоятельную расшифровку или доверьтесь профессионалам.
А чтобы отслеживать потребности клиентов и поддерживать с ними связь в любое время суток — регистрируйтесь в сервисе SendPulse и подключайте наши инструменты: используйте бесплатную CRM и конструктор лендингов, отправляйте email, Viber и SMS рассылки, а также подключайте чат-боты в Instagram, Viber, Facebook, Telegram и WhatsApp!