The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Обновление голосовых данных Mozilla Common Voice 18.0"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Обновление голосовых данных Mozilla Common Voice 18.0"  +/
Сообщение от opennews (ok), 23-Июн-24, 00:51 
Компания Mozilla обновила наборы голосовых данных Common Voice, включающие примеры произношения более 200 тысяч человек. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи. По сравнению с прошлым обновлением  объём речевого материала в коллекции увеличился с 31.1 до 31.8 тысяч часов речи, из которых 20.8 тысяч часов прошли процедуру проверки. Число поддерживаемых языков увеличилось со 124 до 129 (добавлены языки африканских племён коса, календжин, кидавида, долуо и тсвана)...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=61422

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по ответам | RSS]

1. Сообщение от Константавр (ok), 23-Июн-24, 00:51   –5 +/
>русского языка - 3241 участник и 277 часов

Что-то мало. Чувствуется, что указа свыше небыло.

Ответить | Правка | Наверх | Cообщить модератору
Ответы: #16

16. Сообщение от Анонус (?), 23-Июн-24, 09:37   +3 +/
Для русского уже есть отличные модели распознавания речи. Поэтому мало интереса к развитию новых. А вот для разных малых языков пока потребность в датасетах и моделях есть.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #1 Ответы: #17, #18, #23

17. Сообщение от Аноним (17), 23-Июн-24, 13:52   –1 +/
Английский очень малый язык.
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #16 Ответы: #22

18. Сообщение от Васян из васяна (?), 23-Июн-24, 17:09   +/
какие?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #16 Ответы: #21

21. Сообщение от Анонус (?), 23-Июн-24, 18:12   +2 +/
> какие?

https://alphacephei.com/nsh/2024/04/14/russian-models.html

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #18 Ответы: #24, #25

22. Сообщение от Анонус (?), 23-Июн-24, 18:13   +2 +/
> Английский очень малый язык.

Интересно, а шотландцы понимают ямайцев?

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #17

23. Сообщение от Аноним (24), 25-Июн-24, 18:19   +1 +/
модели "есть", все среднего качества кроме закрытых коммерческих (например, яндексовых или тинькова), а открытых качественных датасетов - нет
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #16 Ответы: #27

24. Сообщение от Аноним (24), 25-Июн-24, 18:20   +/
это все про распознавание, а как с синтезом?
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #21

25. Сообщение от Аноним (24), 25-Июн-24, 18:22   +/
внезапно, лучшая моделька с этой страницы натренирована на Common Voice
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #21 Ответы: #26

26. Сообщение от Аноним (24), 25-Июн-24, 18:32   +/
(окей, внезапно ещё и на своем новом открытом датасете)
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #25

27. Сообщение от Аноним (24), 25-Июн-24, 18:33   –1 +/
(ну и сбер догнал яндекс/тинек, 6 лет не прошло с анонса)
Ответить | Правка | Наверх | Cообщить модератору
Родитель: #23 Ответы: #28, #29

28. Сообщение от Анонус (?), 25-Июн-24, 19:41   +/
> (ну и сбер догнал яндекс/тинек, 6 лет не прошло с анонса)

А ведь есть еще VK, ЦРТ, Наносемантика, Silero, МТС. Так еще и многие иностранные системы ASR поддерживают русский.

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #27

29. Сообщение от Бывалый Смузихлёб (ok), 26-Июн-24, 15:38   +/
сбер, яндекс.. да тот же билайн - раскалёнными кочергами по голым задам хреначить надо за их "успехи". Те проблемы, что ещё 10-15 лет назад решались за 0,5-1мин с оператором - нынче решаются за 10-15-30 мин с "ИИ" и огромной горой потраченных нервов
За подобное уже надо бы вводить статью

"предлагаю вам ознакомиться со справкой.. "( а с хрена ли тогда звонок, если "справка" его не покрывает и надо решить лично !? )

Ответить | Правка | Наверх | Cообщить модератору
Родитель: #27


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2025 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру