yandex-speechkit-talk-recognition
v3.0.0
Published
Распознавание больших файлов разговоров через Yandex SpeechKit
Downloads
10
Readme
Распознавание больших файлов через Yandex SpeechKit.
Распознавание длинных аудио - документация
Что делает
- Конвертирует файл в OGG Opus
- Заливает файл на Yandex Object Storage
- Отправляет файл на распознавание
- Дожидается результата (проверка раз в 10 секунд)
Данные сохраняет в ~/yandex-stt/
.
Установка
npm install -g yandex-speechkit-talk-recognition
Зависимости
- ffmpeg 4.x (3.4 не подойдёт)
Как запустить
- Создать сервисный аккаунт, получить API ключ (в документации), вписать его в
config.js
. - Создать статический ключ, получить Id и Secret
- Запустить
yandex-stt --file <путь_к_файлу_с_голосом>
, создастся конфиг в~/yandex-stt/config.js
. - Заполнить конфиг
- Запускать
yandex-stt --file <path>
или yandex-stt --id abcde`
Стоимость
Распознавание с низким приоритетом (deferred) стоит примерно 15 копеек/минута, грубо говоря, 10 руб/час. Тарифы.
TODO:
- Права на файлы. У каждой операции должен быть владелец. Он может обновлять файлы
- Изменение filename
- Изменение распознанного текста