The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Обновление голосовых данных Mozilla Common Voice 12.0"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от opennews (??), 25-Янв-23, 09:34 
Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=58543

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


4. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Аноним (4), 25-Янв-23, 10:29 
> белорусского языка охватывает 7903 участников и 1419 часов
> русского языка - 2815 участников и 229 часов

И не надо мне рассказывать о количестве населения.

Ответить | Правка | Наверх | Cообщить модератору

6. "Обновление голосовых данных Mozilla Common Voice 12.0"  +1 +/
Сообщение от Аноним (6), 25-Янв-23, 10:42 
Выводы неверные делаете.
Ответить | Правка | Наверх | Cообщить модератору

11. "Обновление голосовых данных Mozilla Common Voice 12.0"  +1 +/
Сообщение от Аноним (11), 25-Янв-23, 12:32 
А каких выводах вы говорите ?
Я действительно не понимаю
Ответить | Правка | Наверх | Cообщить модератору

25. "Обновление голосовых данных Mozilla Common Voice 12.0"  +2 +/
Сообщение от Анонус (?), 25-Янв-23, 13:50 
Выводы очевидные. Качественных распознавалок русского языка на рынке предостаточно. Спрос на новые невелик. А вот носителям разных малых и исчезающих языков приходиться волонтерствовать, чтобы хоть немного улучшить ситуацию.

// Из 229 часов русского - полчаса моих, если что.

Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

28. "Обновление голосовых данных Mozilla Common Voice 12.0"  +1 +/
Сообщение от Аноним (28), 25-Янв-23, 14:09 
> на рынке предостаточно

а мне бы без рынка распознавалку

Ответить | Правка | Наверх | Cообщить модератору

29. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Анонус (?), 25-Янв-23, 14:14 
>> на рынке предостаточно
> а мне бы без рынка распознавалку
> Vosk is a speech recognition toolkit. The best things in Vosk are:

Supports 20+ languages and dialects - English, Indian English, German, French, Spanish, Portuguese, Chinese, Russian, Turkish, Vietnamese, Italian, Dutch, Catalan, Arabic, Greek, Farsi, Filipino, Ukrainian, Kazakh, Swedish, Japanese, Esperanto, Hindi, Czech, Polish, Uzbek, Korean. More to come.

Наглядная иллюстрация моего тезиса.

Ответить | Правка | Наверх | Cообщить модератору

7. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Аноним (7), 25-Янв-23, 11:27 
>русского языка - 2815 участников и 229 часов (было 2731 участник и 215 часов)

Бросятся ли местные эксперты-неалкаши заполнять базу данных? Или как всегда?

Ответить | Правка | Наверх | Cообщить модератору

16. "Обновление голосовых данных Mozilla Common Voice 12.0"  –2 +/
Сообщение от Bob (??), 25-Янв-23, 12:41 
строчить на opennet - максимум)
Ответить | Правка | Наверх | Cообщить модератору

41. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от nshmyrev (ok), 28-Янв-23, 17:27 
Лучше это дело стороной обходить.

Сбор данных спонсируется USAID, вот например узбекам раздают подарки и собирают тусовки за голосовые данные

https://uzbekvoice.ai/en-US/yangilik/8

https://info.undp.org/docs/pdc/Documents/UZB/EF%20on�...

Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

8. "Обновление голосовых данных Mozilla Common Voice 12.0"  +2 +/
Сообщение от Амомин (?), 25-Янв-23, 11:28 
Очень годный проект, стоит уделять свободную минутку хотя бы на отслушивание
Ответить | Правка | Наверх | Cообщить модератору

9. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Аноним (7), 25-Янв-23, 11:30 
Но вообще страшно помогать роботам учиться.
Потом меня уволят, а вместо меня посадят робота.
Ответить | Правка | Наверх | Cообщить модератору

10. "Обновление голосовых данных Mozilla Common Voice 12.0"  +3 +/
Сообщение от Аноним (10), 25-Янв-23, 11:52 
Женщину вынут, автомат засунут.
Но вообще если вы хотите мне вместо робота делать text2speech, я не против.
Ответить | Правка | Наверх | Cообщить модератору

22. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Аноним (28), 25-Янв-23, 13:02 
text2speech как раз попой ешь, вот в speech recognition абсолютно по нулям. всякие сфинксы а-ля прибей гвоздями в конфиге полторы команды - такое себе
Ответить | Правка | Наверх | Cообщить модератору

24. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Аноним (10), 25-Янв-23, 13:32 
Вот лучше бы большинство из голосовых движков попа и съела. Нормальных по пальцам пересчитать, а уж если оффлайн нужен, да ещё не английский, то вообще печально всё.
Ответить | Правка | Наверх | Cообщить модератору

40. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от nshmyrev (ok), 28-Янв-23, 17:23 
https://github.com/rhasspy/larynx2

Хороший современный движок синтеза. Пользуйтесь.

Ответить | Правка | Наверх | Cообщить модератору

12. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Аноним (11), 25-Янв-23, 12:35 
Хм.. обидно и не понятно , почему так мало на русском
Пойду попробую чуть помочь :)
Ответить | Правка | Наверх | Cообщить модератору

30. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Аноним (28), 25-Янв-23, 15:26 
> не понятно
> Пойду попробую чуть помочь :)

хочешь помочь - не мешай

Ответить | Правка | Наверх | Cообщить модератору

32. "Обновление голосовых данных Mozilla Common Voice 12.0"  +1 +/
Сообщение от Аноним (32), 25-Янв-23, 17:12 
Хорошо, что выкладывают аудио, но где взять текст фраз, которые зачитываются? На сайте не нашёл, а без текста весь проект не имеет смысла.
Ответить | Правка | Наверх | Cообщить модератору

33. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Аноним (33), 25-Янв-23, 17:44 
всё там есть, скачай датасет, внутри идут mp3 с голосом и файлы с текстом
Ответить | Правка | Наверх | Cообщить модератору

34. "Обновление голосовых данных Mozilla Common Voice 12.0"  +1 +/
Сообщение от Аноним (32), 25-Янв-23, 17:53 
Я скачал German - Common Voice Delta Segment 11.0, а там только mp3. Видимо, нужно качать Corpus. Но эти файлы жирные, а скорость скачивания у них режется до 1 Мбит/с. Если бы в torrent выложили, я бы повисел месяцок на раздаче.
Ответить | Правка | Наверх | Cообщить модератору

36. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Аноним (33), 25-Янв-23, 18:37 
может зеркало неудачное получил, у меня скачивается со скорость ~5 Мбайт/с
Ответить | Правка | Наверх | Cообщить модератору

37. "Обновление голосовых данных Mozilla Common Voice 12.0"  +/
Сообщение от Аноним (32), 25-Янв-23, 18:49 
Да, или такой сервер попался, или из-за того, что браузером качал. Запустил арию, а она на полную катушку качает.
Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру