Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0). Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=58543
> белорусского языка охватывает 7903 участников и 1419 часов
> русского языка - 2815 участников и 229 часовИ не надо мне рассказывать о количестве населения.
Выводы неверные делаете.
А каких выводах вы говорите ?
Я действительно не понимаю
Выводы очевидные. Качественных распознавалок русского языка на рынке предостаточно. Спрос на новые невелик. А вот носителям разных малых и исчезающих языков приходиться волонтерствовать, чтобы хоть немного улучшить ситуацию.// Из 229 часов русского - полчаса моих, если что.
> на рынке предостаточноа мне бы без рынка распознавалку
>> на рынке предостаточно
> а мне бы без рынка распознавалку
> Vosk is a speech recognition toolkit. The best things in Vosk are:Supports 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish, Uzbek, Korean. More to come.
Наглядная иллюстрация моего тезиса.
>русского языка - 2815 участников и 229 часов (было 2731 участник и 215 часов)Бросятся ли местные эксперты-неалкаши заполнять базу данных? Или как всегда?
строчить на opennet - максимум)
Лучше это дело стороной обходить.Сбор данных спонсируется USAID, вот например узбекам раздают подарки и собирают тусовки за голосовые данные
https://uzbekvoice.ai/en-US/yangilik/8
https://info.undp.org/docs/pdc/Documents/UZB/EF%20on...
Очень годный проект, стоит уделять свободную минутку хотя бы на отслушивание
Но вообще страшно помогать роботам учиться.
Потом меня уволят, а вместо меня посадят робота.
Женщину вынут, автомат засунут.
Но вообще если вы хотите мне вместо робота делать text2speech, я не против.
text2speech как раз попой ешь, вот в speech recognition абсолютно по нулям. всякие сфинксы а-ля прибей гвоздями в конфиге полторы команды - такое себе
Вот лучше бы большинство из голосовых движков попа и съела. Нормальных по пальцам пересчитать, а уж если оффлайн нужен, да ещё не английский, то вообще печально всё.
https://github.com/rhasspy/larynx2Хороший современный движок синтеза. Пользуйтесь.
Хм.. обидно и не понятно , почему так мало на русском
Пойду попробую чуть помочь :)
> не понятно
> Пойду попробую чуть помочь :)хочешь помочь - не мешай
Хорошо, что выкладывают аудио, но где взять текст фраз, которые зачитываются? На сайте не нашёл, а без текста весь проект не имеет смысла.
всё там есть, скачай датасет, внутри идут mp3 с голосом и файлы с текстом
Я скачал German - Common Voice Delta Segment 11.0, а там только mp3. Видимо, нужно качать Corpus. Но эти файлы жирные, а скорость скачивания у них режется до 1 Мбит/с. Если бы в torrent выложили, я бы повисел месяцок на раздаче.
может зеркало неудачное получил, у меня скачивается со скорость ~5 Мбайт/с
Да, или такой сервер попался, или из-за того, что браузером качал. Запустил арию, а она на полную катушку качает.