|
Любой пользователь компьютера может столкнуться с ситуацией, когда необходимо ввести текст на компьютере голосом. Помимо стандартных решений Windows, существуют сторонние приложения, позволяющие это сделать. Предлагаем рассмотреть лучшие из них.
MSpeech
В первую очередь рассмотрим бесплатный инструмент MSpeech от независимого разработчика Михаила Григорьева, который бесплатно распространяет свой продукт с открытым исходным кодом. Решение основано на технологии Google Voice API, предназначенной для распознавания человеческой речи и последующего преобразования ее в текст. Распознанный текст вводится в специальное окно, из которого его можно легко перенести в другие приложения различными способами. Поддерживается около 50 различных языков, включая русский. Горячие клавиши доступны для легкой активации и окончания записи.
Предусмотрен простой текстовый редактор, в котором можно произвести первичную коррекцию полученного текста: заменить одни слова другими или изменить первые буквы предложений на заглавные. Вы можете использовать любое устройство, подключенное к компьютеру, в качестве источника звука. Если их несколько, MSpeech попросит вас выбрать правильный. Меню программы поддерживает русский язык. Кроме того, он совместим со следующими интерфейсами: Microsoft SAPI, Google Text-to-Speech, iSpeech Text-to-Speech, Yandex Text-to-Speech и др.
См также: речевой ввод текста на компьютере
Lossplay
Далее идет еще одно простое приложение для транскрипции, изначально созданное командой разработчиков из разных стран. Теперь в роли создателя выступает независимый программист, который продолжает его развивать. LossPlay можно использовать не только для перевода голоса в текст, но и как обычный проигрыватель для прослушивания музыки и других аудиофайлов. Решение поддерживает все текущие расширения от MP3 до WMA. Управление воспроизведением осуществляется с помощью настраиваемых горячих клавиш.
LossPlay оптимизирован для работы с текстовыми документами Microsoft Word. Распознаваемый текст вводится в программу без вмешательства пользователя. Кроме того, предусмотрена функция автоматической подстановки тайм-кодов для всех фраз. Интерфейс рассматриваемого решения представлен в виде привычного плеера с дополнительными функциями. При этом с меню справится даже новичок. LossPlay распространяется бесплатно на русском языке.
См также: Написание текста голосом в Документах Google
Transcriber-Pro
Transcriber-Pro — программа от российских разработчиков, предназначенная для ручной расшифровки аудио- и видеофайлов в текст. Это встроенный текстовый редактор со всеми необходимыми функциями для качественной транскрипции: вставка меток времени и дикторов, удобная навигация по записи, исправление без повторного прослушивания, профессиональная транскрипция и т.д. Управление осуществляется с помощью настраиваемых горячих клавиш, что делает решение более удобным.
Рассматриваемое приложение позволяет работать в команде над одним проектом. Для владельцев платной лицензии предлагается оперативная техническая поддержка. Подписка рассчитана на один год. На официальном сайте вы можете ознакомиться с системными требованиями, посмотреть наглядное видео о работе с Transcriber-Pro, а также ознакомиться с подробным руководством пользователя.
Смотрите также: программы для озвучивания
Express Scribe
Express Scribe — многофункциональный инструмент для ручной расшифровки аудиозаписей, представленный в виде удобного проигрывателя с дополнительными функциями. Звуковой и текстовый модуль сосредоточены в одном интерфейсе, что избавляет пользователя от переключения между окнами. Среди примечательных особенностей стоит отметить возможность переключения между звуковыми дорожками, перехода к определенным ее частям и добавления заметок с тайм-кодами.
Вы можете использовать свой компьютерный каталог, FTP-сервер, компакт-диск, электронную почту или внешнее хранилище, чтобы открыть файл. Кроме того, Express Scribe поддерживает переносное аудиозаписывающее оборудование. Текущее решение работает с большим количеством аудиоформатов: WAV, MP3, WMA, VOX, AU, DSS и др. поддерживаются расширения для диктофонов Philips Digital Recorder, GSM 6.10, ALaw, DSP и др. пледует отметить, что некоторые форматы недоступны в демо-версии, а русский язык здесь вообще не предусмотрен.
Voco
Voco — это простой инструмент для автоматического распознавания человеческой речи и преобразования ее в текст. Он работает в фоновом режиме, и соответствующий значок можно найти в ящике. Микрофон запускается при нажатии комбинации горячих клавиш, после чего пользователь произносит нужные слова и через несколько секунд они появляются на экране. Благодаря совершенным алгоритмам система практически не ошибается, а скорость работы превосходит опытных стенографисток.
Механизм Voco позволяет вам расставлять акценты своим голосом и перемещать курсор на новую строку или абзац. Кроме того, есть функция расшифровки аудио- или видеофайла, но она доступна только в платной версии. Инструмент имеет растущий словарный запас, который может добавить любой пользователь. В базе уже более 85 тысяч слов. Для получения демо-версии необходимо заполнить специальную форму. Это русская локализация.
Это были самые надежные и популярные способы перевода голоса в текст. Некоторые из них работают в автоматическом режиме, где достаточно загрузить аудиофайл или воспользоваться микрофоном, а другие являются лишь вспомогательным инструментом, значительно упрощающим ручную транскрипцию.
- https://lumpics.ru/programs-for-translating-voice-to-text/