MSpeech — программа для распознавания голоса с последующим его преобразованием в текст или выполнением заданной пользователем команды. Кроме того, приложение может использоваться и в обратном направлении — для преобразования текста в голос.
MSpeech — условно-бесплатная программа с ограниченным функционалом (но имеется возможность бесплатно получить полнофункциональную версию). Подходит для компьютеров под управлением Windows XP, Vista, 7, 8, 8.1 и 10 (32 и 64 бит). Интерфейс программы выполнен на русском языке.
Для распознавания голоса программа MSpeech использует встроенный модуль Google Voice API (т.е. для работы приложения требуется доступ в интернет). В его задачу входит отправка записанного голосового сообщения на сервер Google, где оно обрабатывается (транскрибируется в текст) и отправляется обратно на пользовательский компьютер в виде текстового сообщения. Благодаря Google Voice API программа MSpeech способна распознавать более 50 языков, включая русский.
Для ввода звука (голоса) в приложении предусмотрен собственный звукозаписывающий модуль, которым можно управлять посредством горячих клавиш. Также через программу можно транскрибировать голос из ранее созданных аудиозаписей, но для этого придется внести соответствующие настройки в системные параметры Windows, отвечающие за управление микрофоном (нужно задействовать функцию «Прослушать с данного устройства» в свойствах микрофона).
Однако у Google Voice API есть недостаток — для работы с сервисом пользователю может потребоваться создать специальный ключ API (API key Google Speech), что можно сделать на одном из сайтов известного поисковика. Также у сервиса Google Voice API есть ограничение на бесплатное использование — общая продолжительность отправляемых звукозаписей не должно превышать 60 минут в месяц. За дальнейшее распознавание голоса требуется оформить платную подписку.
Функции MSpeech
Помимо основной функции по распознаванию голоса, в возможности программы MSpeech также входят:
- Возможность создания неограниченного количества голосовых команд. Всего их 5 категорий — запуск, закрытие и остановка процесса программ, запуск программ с параметрами командной строки, а также запуск функции преобразования текста в голос (синтез речи).
- Функция преобразования текста в голос имеет собственные настройки. Пользователь может выбрать одну из 5 систем синтеза речи, включая стандартную Microsoft SAPI, которая может работать без интернета. Все прочие системы — онлайн (сервисы от Google, Yandex, iSpeech и Nuance).
- Возможность передачи преобразованного из голоса текста в текстовые поля любых запущенных программ путем использования метода WM_SETTEXT +EM_REPLACESEL, WM_PASRE, WM_CHAR, WM_PASTE (MOD) или WM_COPYDATA (платная функция). Данный функционал предназначен, в первую очередь, для программистов с целью организации взаимодействия своих разрабатываемых программ с MSpeech.
- Автоматическая коррекция текста перед отправкой в поля ввода других программ (замена слов по словарю и изменение первых букв предложений на заглавные буквы). Это еще одна платная функция.
Как получить MSpeech без ограничений по функционалу?
Разработчик MSpeech на своем официальном сайте выложил исходный код своей программы на языке Delphi. Исходники можно скачать и самостоятельно скомпилировать в компиляторе «Delphi XE6» или более поздних версиях. Скомпилированная в итоге программа MSpeech не будет иметь функциональных ограничений (не относится к ограничениям сервиса Google Voice API).
File Name:
MSSpeech_SR_da-DK_TELE.msi
MSSpeech_TTS_ca-ES_Herena.msi
MSSpeech_SR_en-GB_TELE.msi
MSSpeech_SR_nl-NL_TELE.msi
MSSpeech_TTS_fi-FI_Heidi.msi
MSSpeech_TTS_zh-HK_HunYee.msi
MSSpeech_TTS_nb-NO_Hulda.msi
MSSpeech_SR_sv-SE_TELE.msi
MSSpeech_SR_zh-HK_TELE.msi
MSSpeech_TTS_en-IN_Heera.msi
MSSpeech_SR_fr-CA_TELE.msi
MSSpeech_SR_ca-ES_TELE.msi
MSSpeech_SR_fi-FI_TELE.msi
MSSpeech_TTS_pt-BR_Heloisa.msi
MSSpeech_SR_nb-NO_TELE.msi
MSSpeech_TTS_fr-FR_Hortense.msi
MSSpeech_TTS_sv-SE_Hedvig.msi
MSSpeech_TTS_pt-PT_Helia16k.msi
MSSpeech_TTS_zh-TW_HanHan.msi
MSSpeech_TTS_it-IT_Lucia.msi
MSSpeech_TTS_de-DE_Hedda.msi
SR Engine Supplement License.rtf
MSSpeech_TTS_da-DK_Helle.msi
MSSpeech_TTS_zh-CN_HuiHui.msi
MSSpeech_SR_en-US_TELE.msi
MSSpeech_SR_ru-RU_TELE.msi
MSSpeech_TTS_nl-NL_Hanna.msi
MSSpeech_SR_pt-PT_TELE.msi
MSSpeech_SR_en-CA_TELE.msi
MSSpeech_SR_de-DE_TELE.msi
MSSpeech_TTS_fr-CA_Harmonie.msi
MSSpeech_TTS_en-CA_Heather.msi
MSSpeech_SR_zh-CN_TELE.msi
MSSpeech_SR_pl-PL_TELE.msi
MSSpeech_TTS_en-US_Helen.msi
MSSpeech_TTS_pt-PT_Helia.msi
MSSpeech_SR_ko-KR_TELE.msi
MSSpeech_TTS_es-ES_Helena.msi
MSSpeech_SR_it-IT_TELE.msi
TTS Supplement License.rtf
MSSpeech_SR_zh-TW_TELE.msi
MSSpeech_TTS_ru-RU_Elena.msi
MSSpeech_TTS_en-GB_Hazel.msi
MSSpeech_SR_es-MX_TELE.msi
MSSpeech_TTS_en-US_ZiraPro.msi
MSSpeech_TTS_pl-PL_Paulina.msi
MSSpeech_SR_ja-JP_TELE.msi
MSSpeech_SR_en-IN_TELE.msi
MSSpeech_TTS_en-AU_Hayley.msi
MSSpeech_SR_pt-BR_TELE.msi
MSSpeech_SR_fr-FR_TELE.msi
MSSpeech_SR_en-AU_TELE.msi
MSSpeech_TTS_ja-JP_Haruka.msi
MSSpeech_TTS_es-MX_Hilda.msi
MSSpeech_TTS_ko-KR_Heami.msi
MSSpeech_SR_es-ES_TELE.msi
Чтобы управлять компьютерными приложениями собственным голосом, а также преобразовывать набранный текс в речь используйте бесплатную библиотеку Speech API. С ее помощью пользователю становятся доступны широкие возможности для распознавания и синтеза речи.
SAPI часто применяется в разных электронных читалках для прочтения книг или других текстовых документов вслух, кроме того, данная библиотека крайне полезна для юзеров с плохим зрением или ограниченными возможностями.
Для распознавания голоса продукт получает звук и осуществляет его цифровое преобразование, затем звук переводится в так называемые фонемы, далее фонемы выстраиваются в слова, причем слова, не подходящие для контекста, могут быть заменены подходящими синонимами.
С синтезом речи все обстоит иначе. Сначала слова разбиваются на фонемы, потом текст анализируется на наличие спецсимволов, цифр и пунктуации, завершающим этапом является создание цифрового звука, который при воспроизведении имитирует голос.
Помните, что изначально новые версии ОС Windows поддерживают эту библиотеку. Если операционная система ее содержит, тогда не требуется повторная установка и более того, это может спровоцировать конфликт версий.
В остальных случаях следует скачать Speech API и использовать библиотеку для распознавания или синтеза речи. Программы, работающие с ней в связке, автоматически подхватят нужные компоненты и будут корректно функционировать.
Распространяется | Бесплатно |
Разработчик | Microsoft |
Операционная система | Windows 2K / XP / Vista / 7 / 8 / 8.1 / 10 |
Язык | Русский |
Размер | 68 Mb |
Скачать бесплатно Speech API (SAPI) 5.1 для Windows:
Версия x86/x64
DSpeech
для Windows
DSpeech — интересное приложение, которое способно преобразовать печатный текст в звуковую речь. Это удобно для создания различных аудио уроков, лекций или даже целых книжек, когда находясь в дороге можно просто одеть наушники и прослушать конспект или другую важную информацию. Для этого предусмотрена возможность сохранения звукового текста в один из популярных форматов: .wav, .mp3, .aac, .wma или .ogg.
Доступен выбор разных по тональности и тембру голосов, что особенно удобно при чтении диалогов, когда речь отдельного персонажа будет выделена. Кроме того, есть возможность провести индивидуальную настройку голоса с помощью встроенных тегов — изменить такие особенности голоса как скорость воспроизведения, высота звука, тембр, вставить паузы для подчеркивания определенных слов и т.д.
Из других особенностей DSpeech можно выделить захват и воспроизведение содержимого буфера обмена, совместимость со звуковыми движками SAPI 4 и 5, интеграция с медиа проигрывателями Media Player Classic и VideoLAN VLC Player с возможностью дублирования фильма путем чтения субтитров и др.
На сайте разработчика Вам доступны дополнительные голоса для озвучки текста на разных языках.
ТОП-сегодня раздела «Текст в речь»
Балаболка 2.15.0.853
Балаболка (Balabolka) — программа предназначена для чтения вслух текстовых файлов. Для…
ICE Book Reader Pro 9.6.5
ICE Book Reader Pro — программа для удобного чтения электронных текстов (книг). Может читать тексты…
Govorilka 2.22
Govorilka — это небольшая программа для чтения текста голосом. Она может прочитать вслух любой…
ABoo 0.8.5
ABoo — программа для преобразования текста в аудиокнигу в формате mp3, котоаря использует возможности операционной системы Windows для генерирования голоса из текста…
RussAcc 2.1.1
RussAcc — удобная и быстрая программа для озвучивания текстов, создания аудиокниг (в формате…
Отзывы о программе DSpeech
Pavel Dein про DSpeech 1.73 [05-05-2021]
Как читалка текста пойдет. Но при конвертации текста в речь некоторые строки просто не записываются, хотя при предварительном прогоне читает все. Почему так хз.
2 | 5 | Ответить
Ольга про DSpeech 1.73 [23-08-2019]
Интересное приложение. Пока лучше Говорилки, которая постоянно вылетает. Непонятны интерфейс, но если покопаться и разобраться, все работает как надо. Качала для функции чтения буфера обмена, программа с задачей справляется на все 100. Спасибо разрабам, может даже задоначу, если все будет работать
4 | 5 | Ответить
Oleg Morak про DSpeech 1.73 [18-04-2019]
Не могу запустить. Винда пишет ошибка.
5 | 5 | Ответить
Сергей про DSpeech 1.70.77 [11-09-2018]
скачал, а как запустить?
5 | 5 | Ответить
Закидон про DSpeech 1.62.2 [15-07-2016]
Русский не читает
6 | 11 | Ответить
Krit в ответ Закидон про DSpeech 1.62.2 [26-09-2016]
Скачай русский голос и будет тебе читать на русском.
5 | 14 | Ответить
Гость в ответ Krit про DSpeech 1.64.3 [29-10-2017]
Скачай то, да скачай это … нельзя что ли сделать программу так, чтобы после установки уже ничего докачивать не нужно было, бери и пользуйся.
Не умеют программы делать пусть и не берутся значит
11 | 4 | Ответить
Microsoft Speech Application Programming Interface (Speech API, SAPI) — библиотека программ для Windows, позволяющая распознавать и синтезировать голос в приложениях для этой операционной системы.
Speech API активно используется в программах по преобразованию текста в голос (читалках), а также для голосового управления операционной системой и отдельными программами.
SAPI 4.0 вышел в 1998 году. Он входил в состав пакета SDK, содержащего инструменты для распознавания и синтеза речи. Также он входил в операционную систему Windows 2000 (только с возможностью синтеза речи).
Версия SAPI 5.1 вышла в 2001 году как составная часть Speech SDK 5.1. Эта версия входила в состав ОС Windows XP.
В операционной системе Windows Vista установлена версия SAPI 5.3, а в Windows 7 — SAPI 5.4.
Внимание:
Поскольку большинство современных операционных систем Windows уже содержат SAPI4 или SAPI5, то устанавливать их не нужно. Однако возможны случаи, когда такая необходимость возникает. Будьте особенно внимательны при установке библиотеки SAPI 5.1 — установка этой версии на компьютеры, где уже установлена высшая версия SAPI (5.3 или 5.4), может привести к ухудшению работы программ, его использующих.
Дополнительные материалы
- Бесплатные голоса для Microsoft Speech API
Изменения в последней версии
— В SAPI 5.1 есть возможность использования Win32 Speech API (SAPI) для сторонних приложений написанных на Visual Basic®, ECMAScript и других языках.
— SDK также содержит свободно распространяемые движки text-to-speech (TTS) (американский английский и упрощенный китайский) и движки распознавания речи (американский английский, упрощенный китайский и японский.
Разработчик: | |
Официальный сайт: | www.microsoft.com |
Обновлено: | |
Версия Windows: | 2000, XP, Vista, 7 |
Язык интерфейса: | English, Українська, Русский |
Скачать Speech API для Windows