URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 129598
[ Назад ]

Исходное сообщение
"Обновление голосовых данных Mozilla Common Voice 12.0"

Отправлено opennews , 25-Янв-23 09:34 
Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=58543


Содержание

Сообщения в этом обсуждении
"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 10:29 
> белорусского языка охватывает 7903 участников и 1419 часов
> русского языка - 2815 участников и 229 часов

И не надо мне рассказывать о количестве населения.


"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 10:42 
Выводы неверные делаете.

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 12:32 
А каких выводах вы говорите ?
Я действительно не понимаю

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Анонус , 25-Янв-23 13:50 
Выводы очевидные. Качественных распознавалок русского языка на рынке предостаточно. Спрос на новые невелик. А вот носителям разных малых и исчезающих языков приходиться волонтерствовать, чтобы хоть немного улучшить ситуацию.

// Из 229 часов русского - полчаса моих, если что.


"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 14:09 
> на рынке предостаточно

а мне бы без рынка распознавалку


"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Анонус , 25-Янв-23 14:14 
>> на рынке предостаточно
> а мне бы без рынка распознавалку
> Vosk is a speech recognition toolkit. The best things in Vosk are:

Supports 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish, Uzbek, Korean. More to come.

Наглядная иллюстрация моего тезиса.


"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 11:27 
>русского языка - 2815 участников и 229 часов (было 2731 участник и 215 часов)

Бросятся ли местные эксперты-неалкаши заполнять базу данных? Или как всегда?


"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Bob , 25-Янв-23 12:41 
строчить на opennet - максимум)

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено nshmyrev , 28-Янв-23 17:27 
Лучше это дело стороной обходить.

Сбор данных спонсируется USAID, вот например узбекам раздают подарки и собирают тусовки за голосовые данные

https://uzbekvoice.ai/en-US/yangilik/8

https://info.undp.org/docs/pdc/Documents/UZB/EF%20on�...


"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Амомин , 25-Янв-23 11:28 
Очень годный проект, стоит уделять свободную минутку хотя бы на отслушивание

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 11:30 
Но вообще страшно помогать роботам учиться.
Потом меня уволят, а вместо меня посадят робота.

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 11:52 
Женщину вынут, автомат засунут.
Но вообще если вы хотите мне вместо робота делать text2speech, я не против.

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 13:02 
text2speech как раз попой ешь, вот в speech recognition абсолютно по нулям. всякие сфинксы а-ля прибей гвоздями в конфиге полторы команды - такое себе

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 13:32 
Вот лучше бы большинство из голосовых движков попа и съела. Нормальных по пальцам пересчитать, а уж если оффлайн нужен, да ещё не английский, то вообще печально всё.

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено nshmyrev , 28-Янв-23 17:23 
https://github.com/rhasspy/larynx2

Хороший современный движок синтеза. Пользуйтесь.


"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 12:35 
Хм.. обидно и не понятно , почему так мало на русском
Пойду попробую чуть помочь :)

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 15:26 
> не понятно
> Пойду попробую чуть помочь :)

хочешь помочь - не мешай


"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 17:12 
Хорошо, что выкладывают аудио, но где взять текст фраз, которые зачитываются? На сайте не нашёл, а без текста весь проект не имеет смысла.

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 17:44 
всё там есть, скачай датасет, внутри идут mp3 с голосом и файлы с текстом

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 17:53 
Я скачал German - Common Voice Delta Segment 11.0, а там только mp3. Видимо, нужно качать Corpus. Но эти файлы жирные, а скорость скачивания у них режется до 1 Мбит/с. Если бы в torrent выложили, я бы повисел месяцок на раздаче.

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 18:37 
может зеркало неудачное получил, у меня скачивается со скорость ~5 Мбайт/с

"Обновление голосовых данных Mozilla Common Voice 12.0"
Отправлено Аноним , 25-Янв-23 18:49 
Да, или такой сервер попался, или из-за того, что браузером качал. Запустил арию, а она на полную катушку качает.