Перевод английского аудио в текст

На автомате, в ручном режиме и при помощи профессионалов

Никита АлексеенкоFollow

Mar 22, 2018 · 3 min read

Кто как расшифровывает интервью? По-старинке отслушиваете и набираете ручками? Или пользуетесь какими-то программами? Эти вопросы в журналистской среде задают друг другу регулярно.

Казалось бы на дворе век искусственного интеллекта и нейросетей. Роботы вот-вот оставят без куска хлеба новостников и поработят мир, но идеальных программ для автоматической транскрибации до сих пор нет.

Зато есть небольшой список лучших на сегодняшний день:• Для автоматической расшифровки интервью• Для более удобной ручной расшифровки• Для заказа расшифровки у профессионалов

Для автоматической расшифровки интервью

  • Телегам-бот Voicy — превращает видео- и аудиозаписи в текст. Работает далеко не идеально. Но может очень выручить когда нет времени разбираться в тонкостях и читать этот текст до конца.
  • Dragon Dictation — для тех, кто имеет привычку делать аудиозаметки на ходу.Для iOS, бесплатно, требует подключения к инету.
  • — текст можно наговаривать или включить записанное аудио. Программа российская, и поэтому хорошо справляется даже со сложными текстами.Для Windows, стоит 1690 руб. (для дома) и 49 900 руб. (для профи).
  • RealSpeaker — лучше других справляется с расшифровкой видео (читает по губам). Для Windows, стоит $69.
  • On Air — загружаете онлайн, получаете текст на почту. Раз в сутки расшифрует 10 минут бесплатно, затем по 5 рублей за минуту.
  • Аудио — в текст — бесплатная конвертация аудио в текст онлайн. Сайт сейчас недоступен. Надеюсь, временно.
  • Стандартный аудионабор текста на Айосе, Андройде, Гугл Переводчике, Гугл Доке и множестве других приложений с голосовым набором.

На одном устройстве включаете записанное интервью, а на втором открываете приложение и запускаете аудионабор. Подносите гаджеты поближе друг к другу (желательно в тихом помещении) и наблюдаете.

Если речь длинная, то операцию придется повторить несколько раз — расшифровка через какое-то время может прерываться.

Текст, расшифрованный таким образом, потребует тщательной редактуры — не все слова программы понимают правильно, а с запятыми и точками совсем беда.

Для более удобной ручной расшифровки

  • Express Scribe — загружаете аудиофайл и горячими клавишами управляете воспроизведением. При этом набирая текст в том же окне и не отрывая рук от клавиатуры. Для Windows и Mac, базовая версия бесплатна, за расширенные опции придется доплатить до $60.
  • Transcriber Pro — то же самое, что и программа выше, но плюс возможность работать с видео, автоматически вставлять в расшифровку имена собеседников и русскоязычный интерфейс.Для Windows, 690 рублей в год.
  • Используйте аудиоплееры, в которых можно уменьшать скорость воспроизведения, так не придется прыгать из программы в программу, чтобы ставить на паузу.
  • Otranscribe — всё онлайн, аудио и текст сразу перед глазами, есть простые горячие клавиши для остановки/включения записи и вставки временных меток.
  • Купите медиа-клавиатуру с дополнительными кнопками.
  • Используйте горячие клавиши для быстрого переключения программ (Alt+Tab / ⌘+Tab) и плей/пауза (обычно это пробел).
  • Разместите окна с плеером и текстом рядом, в конце концов.

Для заказа расшифровки у профессионалов

zapisano.org — простой и понятный сайт полностью посвященный услуге расшифровки аудиозаписей в текст. Есть разные тарифы, зависящие от сложности и срочности расшифровки. На онлайн калькуляторе можно сразу посчитать во сколько обойдется услуга.

Расшифровка 1 часа обычного интервью в течение 1 рабочего дня обойдется в 1740 рублей.

Стационарные программы для голосового ввода

Кроме перечисленных сервисов существуют разнообразные стационарные программы, позволяющие перевести речь в текст. Обычно они имеют в своей структуре встроенный механизм для распознавания текста, работают с множеством языков, и во многих случаях не требуют постоянного подключения к Интернету.

Среди таких программ отметим следующие:

  • «Dictate» — специальная программа-надстройка для MS Word. После установки программы в системе откройте ваш Ворд, и выберите в нём вкладку «Dictation». Появится значок с микрофоном. Рядом с последним выберите русский язык и начните запись;
  • «Dragon Professional Individual» (Windows, Mac) – одна из лучших платных программ в своём сегменте. Включает множество инноваций, поддерживает различные голосовые команды формата, имеют мощные возможности транскрибации;
  • «Braina Pro» (Windows) – это целый виртуальный ассистент, управляемый искусственным интеллектом. Вы можете диктовать ему текст более чем на 100 языках, он отлично понимает различные компьютерные команды, устанавливает будильник, служит как словарь и тезаурус;
  • «E-speaking.com» (Windows) — Используя программный интерфейс «Microsoft Speech Application» и «Net Framework», программа «e-Speaking» позволяет использовать голос для управления ПК, диктовки документов и электронных писем, прочтения текста вслух. Поддерживается множество голосовых команд для управления ПК.

Боты для голосовых сообщений

Бот в ВКонтакте

Бот «Что тут сказано?» расшифровывает голосовые сообщения. Войс нужно переслать в переписку с ботом, он пришлет текст в ответ. Если надиктовать аудио напрямую в диалог с ботом, он не справится.

Бот расшифровывает войсы

Бота можно пригласить в беседу, тогда он будет автоматически расшифровывать сообщения в чате. Для этого на странице группы кликаем «Пригласить в беседу».

Приглашаем бота в беседу

Дальше выбираем нужный чат, куда добавим бота в качестве участника.

Выбираем чат

В настройках чата находим среди участников бота и даем ему доступ к переписке.

Даем доступ к сообщениям

Теперь если кто-то из участников записывает войс, следующим сообщением бот пришлет расшифровку.

Протестировать другие боты для перевода голосовых сообщений в текст не удалось, группы заброшены, а боты не реагируют на команды.

Бот в Телеграме

Бот Voicy переводит аудиосообщения или аудиофайлы в текст. Можно писать или присылать аудиофайлы боту напрямую или добавить его в чат, тогда на каждую реплику он будет отвечать ее текстовой расшифровкой.

Бот присылает расшифровку сразу после сообщения

Бота нужно настроить. Команда /language вызывает выбор языка, на котором будут записываться голосовые, /engine дает выбрать движок:

  • стандартный wit.ai хорошо распознает слова, но не справляется с сообщениями длиннее 50 секунд;
  • Yandex.SpeechKit работает без ограничений, но распознает слова хуже;
  • Google Speech хорошо распознает голос, работает с любой длиной, но требует оплаты.

Команда /silent отключит уведомления о том, что бот приступил к работе над войсом.

Для отключения бота в чате нужно набрать команду /files.

Сервис Zapisano.org

Иногда нужна точная расшифровка аудиозаписи, но на внесение правок в распознанные тексты или самостоятельный набор с нуля нет времени. В этом случае пока единственный выход — делегировать ручную расшифровку кому-то другому.

За помощью можно обратиться к фрилансерам или в специализирующиеся на транскрибации фирмы. Однако в первом случае придется потратить дополнительное время на поиск ответственного исполнителя и согласование условий, а во втором — на общение с менеджерами по почте.

Для того, чтобы сэкономить время на всех этапах работы, можно воспользоваться сервисом Zapisano.org. Пока это единственный в России сервис расшифровки с личным кабинетом, куда можно быстро загрузить аудиофайлы, оплатить заказ, а после его выполнения хранить исходные аудио и стенограммы.

Интерфейс простой и понятный. После регистрации загрузите файлы или скопируйте ссылку на запись:

Загрузка аудиозаписей для расшифровки

Сервис автоматически подсчитает длительность и спросит, какой тип расшифровки нужен — стандартный, для суда или перевод с иностранного языка. Вам нужно будет только выбрать тариф в зависимости от срочности работы:

Выбор формата тарифа для расшифровки

Прогресс по задачам удобно отслеживать в личном кабинете. Там вы увидите подробности по каждой:

Личный кабинет с прогрессом по задачам

Интерфейс также оптимизирован под мобильные устройства, поэтому в кабинет удобно загружать записи, сделанные на телефон. 

Тестовый перевод можно сделать бесплатно, так что у вас будет возможность оценить сервис.

Сервисы из подборки помогут сделать расшифровку интервью на аудио или видео, быстро узнать содержание голосового сообщения и упростят работу с надиктованным текстом. Качество расшифровки сильно зависит от дикции и скорости речи, поэтому всегда требует правок. Если нужно быстро получить точный текст без ошибок распознавания, единственный выход пока — делегировать ручной труд фрилансерам или специализированным сервисам.

Для чего нужно переводить аудио в текст

Для начала поговорим, для чего вообще может понадобиться транскрибация. Тут на самом деле очень много вариантов.

  • Достаточно часто требуется расшифровка аудио какого-нибудь семинара очередного “гуру”. Он вещает час-два и его записывают на видео. А потом нужно все это дело издать в виде методички или книги. Это транскрибация так называемого вебинара. Кстати, вебинары расшифровывать немного легче, так как в случае невнятного звука можно иногда догадаться о чем речь по жестам и поведению спикера.
  • Иногда обращаются журналисты. Они могут надиктовывать себе заметки на диктофон в течение выполнения какого-нибудь журналисткого расследования. И потом все аудио это нужно перевести в текст.
  • Достаточно редкие “клиенты” транскрибатора это “настоящие писатели”. Они тоже сейчас часто любят надиктовывать книги в аудиофайл, а потом переносить на бумагу.

  • Часто нужно транскрибировать аудиоподкасты. Кстати, что такое аудиоподкаст? Если по русски- это устное сообщение владельца сайта или блога своим подписчикам.
  • Расшифровка аудио в текст разного рода интервью. Тут Вы понимаете, что нужно журналистам и всякого рода блоггерам.
  • Иногда нужна расшифровка телефонных переговоров. Чаще всего такие работы заказывают фирмы для фиксации внутрикорпоративных переговоров.
  • Еще бывает транскрибация совещаний. Но эту работу часто выполняют сами секретари и не отдают на аутсорсинг. Кстати, если Вы секретарь, то возьмите мои советы себе на вооружение.

Я перечислил только малую часть тех задач по транскрибации, для решения которых может понадобиться профессиональный транскрибатор. Этих задач может быть намного больше. Так что работа для “аудиопереводчика” всегда найдется.

Командная строка Яндекса

С её помо­щью мы смо­жем полу­чать нуж­ные клю­чи досту­па, что­бы отправ­лять фай­лы с запи­ся­ми на сер­вер для обработки.

Весь про­цесс уста­нов­ки мы опи­шем для Windows. Если у вас Mac OS или Linux, то всё будет то же самое, но с поправ­кой на опе­ра­ци­он­ную систе­му. Поэто­му если что — .

Для уста­нов­ки и даль­ней­шей рабо­ты нам пона­до­бит­ся PowerShell — это про­грам­ма для рабо­ты с команд­ной стро­кой, но с рас­ши­рен­ны­ми воз­мож­но­стя­ми. Запус­ка­ем PowerShell и пишем там такую команду:

iex (New-Object System.Net.WebClient).DownloadString(‘https://storage.yandexcloud.net/yandexcloud-yc/install.ps1’)

Она ска­ча­ет и запу­стит уста­нов­щик команд­ной стро­ки Яндек­са. В сере­дине скрипт спро­сит нас, доба­вить ли путь в систем­ную пере­мен­ную PATH, — в ответ пишем Y и нажи­ма­ем Enter:

Команд­ная стро­ка Яндек­са уста­нов­ле­на в систе­ме, закры­ва­ем PowerShell и запус­ка­ем его зано­во. Теперь нам нуж­но полу­чить токен авто­ри­за­ции — это такая после­до­ва­тель­ность сим­во­лов, кото­рая пока­жет «Обла­ку», что мы — это мы, а не кто-то другой.

Пере­хо­дим по спе­ци­аль­ной ссыл­ке, кото­рая даст нам нуж­ный токен. Сер­вис спро­сит у нас, раз­ре­ша­ем ли мы доступ «Обла­ка» к нашим дан­ным на Яндек­се — нажи­ма­ем «Раз­ре­шить». В ито­ге видим стра­ни­цу с токеном:

Теперь нуж­но закон­чить настрой­ку команд­ной стро­ки Яндек­са, что­бы мож­но было с ней пол­но­цен­но рабо­тать. Для это­го в PowerShell пишем команду:

yc init

Когда скрипт попро­сит — вво­дим токен, кото­рый мы толь­ко что получили:

Сна­ча­ла отве­ча­ем «1», затем «Y» и «4».

Приложение Windows – VOCO

Эта программа распознавания речи профессионального уровня.

Основной функционал Windows-приложения перевода аудио в текст VOCO:

  • Голосовой набор текста с микрофона
  • Расстановка знаков препинания устными командами
  • Распознавание знаков препинания в аудиофайлах. Это круто!
  • Само-собой есть распознавание речи из аудиозаписей.
  • Есть сопряжение с Word
  • Можно подключать словари
  • Ну и есть свой, достаточно большой словарный запас

Короче, программа просто находка для профессионального транскрибатора! Но программа платная! Правда, есть демо-версия, в которой Вы можете ознакомиться с основным функционалом бесплатно. Правда, нужно подать заявку скачивание демо-версии Voco.

«Gboard» — мобильное приложение преобразователь записи в текст

Мобильное приложение «Gboard» является популярным приложением для Android и iOS, позволяя осуществлять длительный голосовой ввод с дальнейшей трансформацией сказанного в стандартный текст (конвертация голоса в текст). Для задействования режима голосового ввода достаточно нажать и удерживать сенсорную клавишу пробела (Space) на клавиатуре, после чего вы сможете говорить так долго как захотите — всё сказанное вами будет переведено программой в текст.


Для активации голосового ввода в «Gboard» достаточно нажать и удерживать пробел

Приложение абсолютно бесплатно, поддерживает несколько десятков языков, среди которых и русский.

7 полезных программ для ускорения расшифровки аудиофайлов

Несмотря на наличие нескольких программ, использующих автоматический режим для расшифровки аудио в текстовый документ, они все, как правило, несовершенны и отличаются низким качеством распознавания голоса. Время, потраченное на придание надлежащего вида тексту, который был автоматически обработан, больше, нежели время, затраченное на самостоятельную транскрибацию.

Заработать на переводе аудио в текст транскрибатору помогут следующие программы:

  • Программы, воспроизводящие видео и звук (KMPlayer, LossPlay)
  • Профессиональные редакторы видео и аудио (Adobe Audition)
  • Вспомогательные приложения (AutoHotkey)
  • Он-лайн программы для транскрибации (Speechpad.ru, Dictation.io).
  • Express Scribe — программа-помощник для транскрибаторов.

Смотрите обзор программы для быстрой транскрибации в видео:

Как дополнительный заработок в интернете перевод аудио в текст — это отличная возможность получать стабильный доход в любое свободное время. Чтобы увеличить заработок в интернете на переводе аудио в текст, новичкам, не овладевшим десятипальцевым «слепым» методом печати, рекомендуется пользоваться специальными плеерами, которые оснащены функцией замедления аудиозаписи до нужной скорости. Если запись обладает низким качеством, то использование таких плееров поможет избежать трудностей.

Как вид работы в интернете перевод аудио в текст процветает уже достаточно давно, поэтому сомневаться в его надежности новичкам и старожилам бирж фриланса не приходится. В отличие от заработка на аукционах имущества должников, он более надежен и стабилен. Если вы хотите зарабатывать на автопилоте, тогда ищите идеи из статьи Куда инвестировать деньги для получения пассивного дохода.

Оцените, пожалуйста, статью:

Статья подготовлена редакцией сайта. Познакомьтесь с авторами блога

Если вы хотите получать свежие идеи о заработке, инвестидеях, бизнесе, управлении личными финансами в свой почтовый ящик, то подпишитесь на обновления.

100% полезный контент и никакого спама!

Усовершенствовать ручную расшифровку

Можно пойти другим путем — не автоматизировать, но упростить работу и транскрибировать без кошмара, описанного в самом начале статьи. Вам все равно придется слушать и записывать, но это будет удобно делать внутри хорошо обустроенного сервиса.

oTranscribe

Бесплатный веб-сервис для ручной транскрибации текста. Работает как с аудио, так и с видео, в том числе YouTube-роликами. Открывает десятки форматов: wav, mp3, mpeg, webm и др.

Можно назначить горячие клавиши для управления воспроизведением. Есть автосохранение, простой текстовый редактор, интерактивные метки, упрощающие навигацию.

Интерфейс oTranscribeИнтерфейс oTranscribe

Express Scribe

Условно-бесплатное десктопное ПО для Windows/Mac. Позволяет загружать аудио и видеофайлы с самых разных источников: дисков, FTP-серверов, электронных писем и др. Поддержка форматов зависит от версии: например, mp3 и wav открываются в любом случае, а wmv, mp4 или 3gp — только в Pro.

Гибкие настройки воспроизведения: управляйте горячими клавишами, меняйте скорость, переключайтесь на определенный таймкод. Можно добавлять заметки к файлам, подключать к работе ножную педаль — специальное устройство, USB-переключатель для геймеров и транскрибаторов.

Удобно, что все записи добавляются в список и между ними легко переключаться — не нужно каждый раз заново их загружать. Неудобно, что нет текстового редактора (зато есть интеграция с MS Word, Corel Wordperfect, Lotus Wordpro ​​и другими текстовыми процессорами под Windows).

Неограниченная лицензия PRO стоит от 25 $, но для личного использования вполне хватит бесплатной версии.

Так выглядит окно Express Scribe

Transcriber Pro

Тоже десктопный инструмент для ускорения ручной расшифровки (правда, только аудио в текст и только для Windows). Функциональность похожа на аналогичные решения: есть управление горячими клавишами, создание заметок (тегов), автозамена текста, настройка «прыжка» после паузы и др.

В числе преимуществ Transcriber Pro также указали командную работу — возможность разбивать проект на подзадачи, выгружать их и пересылать, потом объединять результаты в один файл. Участники команды будут работать в офлайне, но результат потом соберется в одно целое.

Платная лицензия стоит 640 руб. в год, но ее нет смысла покупать ради такой функции, как экспорт в интерактивные стенограммы. Этот формат похож на обычные субтитры, которые, например, выгружаются с YouTube.

Видеообзор программы.

LossPlay

Это десктопный плеер для Windows в помощь расшифровщикам аудио/видео. Открывает mp3, wav, mp4 и др. (разработчики отмечают, что есть также «интеллектуальная поддержка недокументированных форматов», что бы это ни значило). Парит поверх всех окон, поэтому позволяет работать в любом текстовом редакторе.

Hot keys настраиваются не только для управления воспроизведением, но и для вставки шаблонных текстовых фрагментов. Если не нравится стандартный дизайн, в настройках можно задать элементам другие цвета.

Придется по душе тем, кто ностальгирует или до сих пор пользуется Winamp.

Такой вот внешний вид у LossPlay

Универсальное решение: wreally.com

Альтернатива всем вышеперечисленным инструментам — Transcribe (wreally.com). Этот онлайн-сервис позволяет транскрибировать текст обоими способами: вручную (как в oTranscribe) и автоматически (создатели указывают точность 90%). Открывает десятки видов файлов: webm, mp3, mp4, 3gp, wmv и др. Есть автосохранение, работа без доступа к интернету, интеграция ножной педали, настройка горячих клавиш, экспорт видеосубтитров. В отличие от RealSpeaker, гарантируется безопасность и приватность.

Бесплатно можно получить только 1 минуту автоматической расшифровки. Далее — 6$ в час. Ручная транскрибация тоже стоит денег, но совсем небольших — 20$ в год.

Так выглядит инструмент для ручной транскрибации

Пример работы авторасшифровщика

Кто и как заказывает транскрибацию

Транскрибацию, чаще всего заказывают те, кто имеет дело с интервью, курсами, конференциями и другими подобными мероприятиями.

Когда, к примеру, после лекции остается только запись, которую нужно конвертировать в текст, чтобы после этого разместить в интернете.

Именно это и есть ниша, где заказывают транскрибацию аудио. Стоит заметить, что записи у заказчиков могут быть самого разного качества, как и сама постановка задания.

Первое и самое главное, вам придется самостоятельно разбивать текст на предложения и ставить знаки препинания. Как говорилось выше, машина этого сделать не может.

Второе, довольно часто вам нужно озаглавливать кто говорит. Обычно это пометки типа первый и второй голос, или просто, мужчина и женщина.

Слова паразиты и другие ненужные выражения или мычания, тоже практически всегда удаляются из текста, чтобы он получился красивым и читабельным.

Иногда для этого нужно убирать из записи корявые фразы, но подобные заказы встречаются довольно редко.

Транскрибация вакансии: как найти исполнителя?

Найти подходящего специалиста для работы с текстом несложно, если, конечно, вы используете для этого биржу Weblancer. Создание проекта и дальнейший поиск исполнителя не потребует от вас практически никаких усилий и даже регистрации: для размещения заказа нужно не больше пары минут. Укажите в названии, что вам требуется расшифровка аудио, приложите исходный файл, над которым нужно поработать, и введите адрес электронной почты. Отклики от исполнителей вы можете получать отдельными письмами.

Среди несомненных преимуществ использования Веблансер — наш сервис безопасных сделок, созданный специально для защиты обеих сторон договора от недобросовестности. Это существенно упрощает задачу для заказчика, давая ему уверенность в эффективности вакансии транскрибация аудио и видеозаписи. Он получит гарантию, что работа будет выполнена в срок, точно в соответствии с техническим заданием, а деньги не будут потрачены впустую.

Помочь в выборе исполнителя среди всех откликнувшихся на ваш проект призван наш рейтинг фрилансеров. Не забудьте ознакомиться и с портфолио фрилансера, уточнить, есть ли у него опыт подобной работы. А после сотрудничества оставьте отзыв, чтобы другим заказчикам было легче ориентироваться в многообразии предложений.

Программы для транскрибации

Существует много специальных сервисов, которые позволяют облегчить работу. Сервис dictation.io считается прекрасным вариантом, который дает возможность бесплатно перевести речь в текстовый формат.

Площадка обеспечивает автоматическое сохранение готовых результатов. Это поможет избежать случайного удаления вследствие закрытия вкладки или браузера. Сервис не позволяет распознать готовые файлы. Он работает с микрофоном. При диктовке следует называть знаки препинания.

Текст удается распознать достаточно корректно, без орфографических ошибок. Также можно самостоятельно вставлять с клавиатуры знаки препинания. Сохранить готовые результаты можно на своем компьютере.

Сайт speechpad.ru представляет собой онлайн-площадку, которая позволяет через браузер Google Chrome переводить речь в текстовый формат.

Сервис работает с готовыми файлами и микрофоном. Безусловно, качество будет выше при использовании внешнего микрофона. Однако сайт неплохо трансформирует даже ролики на YouTube.

При этом нужно нажать «Включить запись», ответить на вопрос относительно использования микрофона. А затем следует нажать «Разрешить».

Готовый результат удается легко отредактировать. Для этого требуется ручным способом исправить выделенное слово или надиктовать его снова. Результаты можно сохранить в личном кабинете или скачать на компьютер.

Сервис позволяет работать с 7 языками. При этом он имеет и недостаток. Если требуется транскрибация готового аудиофайла, он звучит в колонках. Это становится причиной дополнительных помех в виде эха.

Dragon Dictation представляет собой бесплатное приложение, которое подходит для устройств компании Apple. Программа дает возможность редактировать результаты, выбирая нужные слова из списка

При этом важно четко проговаривать все звуки, без пауз. Нежелательной является и интонация

Иногда можно столкнуться с ошибками в конце слова.


Существует много программ, которые облегчают работу

Приложение Dragon Dictation подойдет и для обладателей гаджетов Android. Они могут диктовать в него список покупок или другую важную информацию.

Следующим полезным сайтом станет RealSpeaker. Эта программа с легкостью переводит речь человека в текстовый формат. Она позволяет преобразовывать речь, которая звучит в микрофон. Он может быть встроен в ноутбук. Также удается преобразовывать формат, записанный в аудиофайлы.

Программа преобразовывает 13 языков мира. Существует бета-версия, которая функционирует как онлайн-сервис. Для этого необходимо выбрать русский язык, загрузить на сайт файл. При этом за его перевод приходится платить. После этого можно скопировать готовый текст. Чем больше размер файла, тем больше времени уйдет на преобразование.

Speechnotes считается альтернативой RealSpeaker, которая позволяет работать на Android. Текст удается редактировать автоматически и расставлять в нем знаки препинания. Этот вариант удобен для составления список или заметок. В результате удается получить качественный текст. Также существует платная премиум-версия.

Dictation.io

Сервис онлайн распознавания речи через микрофон. Посредством голоса можно расставлять параграфы, знаки пунктуации и даже смайлики. Dictation пригодится для написания электронных писем или заполнения документов в браузере.

Использование сервиса:

  • Перейти на страницу транскрибации.
  • В правой части экрана нажать на три горизонтальные полоски, чтобы выбрать язык ввода. Поддерживается большое количество языковых направлений.

В левом нижнем углу кликнуть по кнопке «Start».

Начать диктовку текста.
Редактирование материала осуществляется путем встроенного редактора. Непосредственно со страницы можно выполнить сохранение текста, его публикацию, печать.

Сайт и программа Speechpad (Спичпэд)

Еще одна, любимая многими программа и одновременно онлайн-сервис. Голосовой блокнот Speechpad.

Можно заниматься транскрибацией прямо онлайн. На сайте. Можно установить расширение для Гугл Хром. Можно интегрировать это все в операционную систему для ввода в нужные программы. Кстати, это одна из немногих программ, которая работает в моем любимом Линукс Минт!

Вообще, функционал  сервиса SpeechPad воистину огромен. Давайте посмотрим на него внимательней:

  • Голосовой набор текста с микрофона. Кстати, этот сервис один из лидеров по правильному распознаванию речи (на мой взгляд). Ввод текста идет синхронно “говорению”. Можно по ходу сразу же править текст и вставлять знаки препинания.
  • Транскрибация с аудиофайла или прямо с ролика Ютуб. Достаточно указать путь к аудиофайлу или видеоролику, включить транскрибатор, и начнется перевод. Правда, у меня почему-то не всегда получается это с первого раза. Может, потому что стоит Линукс.
  • Есть озвучивание субтитров. Да и простого текста. Используется голос Гугл переводчика. Немного коряво, но в принципе “слушательно”
  • Можно делать проверку произношения. Это пригодится тем, кто изучает иностранный язык

Если внимательно посмотреть, то можно много чего еще найти в сервисе для перевода аудио в текст SpeechPad. Есть подробные видеоуроки по каждому пункту. Есть просто подсказки. Можно сохранить готовый текст в файлы.

И да, он тоже бесплатен! Во всяком случае, на момент написания данной статьи!

Заказ перевода аудио в текст у специалистов

Вообще, мне достаточно часто нужна услуга по расшифровке аудиозаписей в текст. Нужно переводить в текст мои видеоуроки. Иногда я сначала наговариваю мысли для статьи на диктофон, а потом транскрибирую. Можно конечно заниматься этим самостоятельно с помощью программ, но это отнимает много времени. Почему? Потому что программы для транскрибации не всегда верно расшифровывают слова и приходится долго править полученный текст, форматировать его, вставлять знаки препинания и таймкоды.

Поэтому я нанимаю фрилансеров. Но.. И тут есть “засады”! Очень сложно найти “правильного” фрилансера, который бы делал все четко и в срок. И особенная проблема в том, что фрилансеры (особенно молодые) плохо дружат с русским языком. И часто делают еще больше ошибок, чем программы 🙁 Поэтому я стал искать специализированный сервис, который занимается ручным переводом аудио в текст. И чтобы качественно и недорого. И… Я похоже, нашел такую фирму.

Сейчас я расскажу, чем мне приглянулся данный сервис. Итак, смотрим. Кстати, Все картинки увеличиваются по клику…

Это пока единственный российский сервис по транскрибации аудио с личными кабинетами, который “заточен” под бизнесменов, журналистов, юристов и т.п. То есть, для тех людей, для которых качество и скорость расшифровки аудиофайлов являются самыми важными факторами.

Из “приятных плюшек” хочу отметить еще три, особо мне понравившихся.

  • Тестовый заказ. Бесплатный. Для проверки качества работы этого сервиса. Можете попробовать, если не уверены в качестве расшифровки.
  • Работа с PayPal. Это означает, что с сервисом могут работать “забугорные” люди. Кстати, проблема с платежами, нередка в случае когда пытаются оплатить услуги российского сервиса из-за рубежа. Ну и PayPal дополнительно защищает Ваши покупки.
  • Работа с аудиозаписями из судов. Для меня это ничего не говорит, но мой друг, юрист, говорит, что это крутая фишка..

Короче, не буду навязывать Вам этот сервис. Лучше сами посмотрите и решите, стоит ли с ним работать.

Ну и как обещал выше, рекомендую посмотреть это видео, где я подробней разбираю этот сайт.

А вот и подоспели итоги полной расшифровки моего видеоролика. Посмотрим, что получилось!

Способ 5. LossPlay

Для корректной работы программы дополнительно потребуется установить кодеки: K-Lite Codec Pack и QuickTime. Рекомендации по их установке есть на сайте разработчика LossPlay. 

Плюсы программы:

  • транскрибация аудио и видео файлов
  • наличие горячих клавиш
  • возможность менять скорость записи 
  • наличие тайм-кодов
  • работа с текстовым редактором Word

Минус всего один  — набор текста выполняется вручную, то есть слушаем запись и набираем текст на клавиатуре.

Шаг 1. Заходим на сайт разработчика LossPlay.  Нажимаем «Скачать».

Шаг 2. Далее открываем скачанный файл и устанавливаем программу на свой компьютер. Также скачиваем и устанавливаем необходимые кодеки. 

Шаг 3. Запускаем плеер. Медиа файл можно добавить нажав внизу на кнопку «+», либо перетащить его мышкой, либо же воспользоваться горячими клавишами Ctrl+Shift+O.

Плеер содержит 7 основных кнопок управления:

  • Перемотка
  • Пауза
  • Стоп
  • Добавление и удаление файлов в плейлист
  • Регулятор громкости
  • Регулятор баланса
  • Регулятор скорости

Шаг 4. С помощью вкладки «Настройки» — «Общие» можно настроить Тайм-код  — указатель времени, который вставляется в текст транскрибации. Он нужен для того, чтобы найти конкретный момент в записи, при этом не переслушивая весь медиа файл, а также для сопоставления текста и записи.

Шаг 5. Открываем документ Word и набираем текст под диктовку плеера.

 

Во время транскрибации окно плеера можно свернуть, а работу регулировать с помощью горячих клавиш. При этом есть возможность пользоваться как заводскими настройками клавиш, так и настроить их для себя самостоятельно. 

Благодаря горячим клавишам в текстовом редакторе удобно работать, не обращаясь к самому плееру. С их помощью легко перемотать прослушиваемый отрывок назад, поставить на паузу или замедлить воспроизведение, даже не переключаясь на окно плеера.

Теперь вы знаете 5 сервисов, которые помогают сделать транскрибацию. 

Их основные отличия рассмотрим в сводной таблице. Выбирайте тот, который понравится и будет максимально удобен лично вам.

+/- Google Docs Dictation.io Speechpad.ru Realspeaker LossPlay
требуется ли установка +
распознавание речи + + + +
допускает ошибки + + + + +
сервис платный +
корректно работает/
устанавливается со всех браузеров

Все перечисленные способы существенно облегчают кропотливый труд транскрибатора. Но ни один сервис не справится с этой работой без вашего участия. Всё равно придется проверять текст, редактировать его и исправлять ошибки. Только так задание будет выполнено качественно и безупречно. 

На мой взгляд, больше всего ошибок допускает голосовой ввод в Google Docs. Ошибки при работе с программой LossPlay зависят от грамотности самого транскрибатора. Примерно одинаковое количество ошибок допускается в остальных сервисах. На результат транскрибации во многом влияет и качество исходной записи. 

The following two tabs change content below.

  • Елена Кревская: «Мне не жаль отпускать в мир свои тексты» — 20/11/2020
  • Самозанятость для статейного автора: плюсы и минусы — 18/11/2020
  • 6 лучших книг для копирайтера в 2020 году — 31/07/2020
Оцените статью
Рейтинг автора
5
Материал подготовил
Андрей Измаилов
Наш эксперт
Написано статей
116
Добавить комментарий