The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Обновление голосовых данных Mozilla Common Voice 7.0"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от opennews (??), 01-Авг-21, 10:48 
Компании NVIDIA и Mozilla представили обновление наборов голосовых данных, собранных в результате инициативы Common Voice и включающих примеры произношения 182 тысяч людей, что на 25% больше, чем 6 месяцев назад. Данные опубликованы как общественное достояние (CC0).  Предложенные наборы можно использовать в системах машинного обучения для построения моделей распознавания и синтеза речи...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=55571

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


1. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Аноним (1), 01-Авг-21, 10:48 
Я тут заметил, что качество автогенерируемых субтитров на тытрупе ощутимо выросло (в том числе, на русском языке, хоть и хуже). Причём, распознавание работает несмотря на музыку и шум. Я что-то пропустил? Как такого добиться?
Ответить | Правка | Наверх | Cообщить модератору

2. "Обновление голосовых данных Mozilla Common Voice 7.0"  +4 +/
Сообщение от Аноним (2), 01-Авг-21, 10:52 
Люди постят субтитры. Тытруп стал получше, но с японским он все так же лажает как и с русским.
Ответить | Правка | Наверх | Cообщить модератору

3. "Обновление голосовых данных Mozilla Common Voice 7.0"  –1 +/
Сообщение от Аноним (1), 01-Авг-21, 10:56 
> Люди постят субтитры. Тытруп стал получше, но с японским он все так
> же лажает как и с русским.

Часто бывает такое, что я не могу понять, что за слово (из-за дефектов речи или особенностей дикции), а оно вот распознаёт верно. Так в целом конечно много ошибок.

Ответить | Правка | Наверх | Cообщить модератору

30. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Аноним (-), 02-Авг-21, 08:29 
> Люди постят субтитры.

Гугол придумал как дешево и сердито заапгрейдить нейросетки на порядки, без нвидии :)

Ответить | Правка | К родителю #2 | Наверх | Cообщить модератору

5. "Обновление голосовых данных Mozilla Common Voice 7.0"  +2 +/
Сообщение от Аноним (5), 01-Авг-21, 11:44 
Не заметил какой-либо разницы в английском и японском, автоперево (особенно для азиатской группы языков) всё такой же трешак.
Ответить | Правка | К родителю #1 | Наверх | Cообщить модератору

29. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от nebularia (ok), 02-Авг-21, 06:18 
Речь всё-таки не про перевод, а про распознавание. С ним довольно хорошо, видео ютуба с нужными гайдами по работе без звука смотрятся неплохо
Ответить | Правка | Наверх | Cообщить модератору

35. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Аноним (35), 02-Авг-21, 12:17 
Так я и писал не только про перевод. Распознавание такое же костыльное - спотыкается на созвучных словах и даже иногда на артиклях. Точно так же было и год-два назад.
Ответить | Правка | Наверх | Cообщить модератору

42. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от nebularia (ok), 03-Авг-21, 10:52 
> спотыкается на созвучных словах

Поэтому оригинал читать можно, так как понятно, что там могло быть. А при переводе превращается в кашу.

Ответить | Правка | Наверх | Cообщить модератору

4. "Обновление голосовых данных Mozilla Common Voice 7.0"  +4 +/
Сообщение от Аноним (4), 01-Авг-21, 11:26 
>Данные опубликованы как общественное достояние (CC0).

Единственная нормальная свободная лицензия.

Ответить | Правка | Наверх | Cообщить модератору

7. "Обновление голосовых данных Mozilla Common Voice 7.0"  +1 +/
Сообщение от 1111 (??), 01-Авг-21, 12:39 
>Единственная нормальная свободная лицензия.

единственная нормальная - это жпл, потому что не заставляет нахаляву работать сообщество на копиистов и капиталистов, ну или точнее заставляет паразитов что то отдавать сообществу назад.

Ответить | Правка | Наверх | Cообщить модератору

11. "Обновление голосовых данных Mozilla Common Voice 7.0"  +3 +/
Сообщение от Аноним (-), 01-Авг-21, 13:28 
>>Единственная нормальная свободная лицензия.
> единственная нормальная - это жпл, потому что не заставляет нахаляву работать сообщество
> на копиистов и капиталистов, ну или точнее заставляет паразитов что то отдавать сообществу назад.

И как там с исправлением и улучшением EXT от гугла? Уже заставили? Или опять  "не нужно и вообще, не очень хотелось - мы тут EXT4 успели написать и даже собрать почти все грабли!" ?


Ответить | Правка | Наверх | Cообщить модератору

24. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от maximnik0 (?), 01-Авг-21, 23:32 
>И как там с исправлением и улучшением EXT от гугла? Уже заставили?

Есть  физ.лицо и есть юр.лицо ,компания.Пока гпл код пользуется внутри компании,право выкладывать его не возникает,т.к они приобретают права потребителя согласно лицензии (по крайне мере такое объяснение было в статье linuxformat).И была неопределенность для   сетевых сервисов- это недостаток гпл2,в 3 версии промах устранили.

Ответить | Правка | Наверх | Cообщить модератору

26. "Обновление голосовых данных Mozilla Common Voice 7.0"  +1 +/
Сообщение от Аноним (-), 02-Авг-21, 02:27 
>> единственная нормальная - это жпл, потому что не заставляет нахаляву работать сообщество
> на копиистов и капиталистов,
> Есть  физ.лицо и есть юр.лицо ,компания.Пока гпл код пользуется внутри компании,право
> выкладывать его не возникает,т.к они приобретают права потребителя согласно лицензии

Угу, кто бы сомневался, что облачные сервисы гугло-амазонов, с многомиллиардными прибылями и выкладыванием "на тебе Бож^W сообщество то, что невыгодно поддерживать нам самим" - "это другое" и "лицензия позволяет!".

>> Mere interaction with a user through a computer network, with no transfer of a copy, is not conveying.
> (по крайне мере такое объяснение было в статье linuxformat).И была неопределенность для
> сетевых сервисов- это недостаток гпл2,в 3 версии промах устранили.

Ага, только совсем не в пользу "сообщества". Возможно, вы хотели указать на AGPL?


Ответить | Правка | Наверх | Cообщить модератору

31. "Обновление голосовых данных Mozilla Common Voice 7.0"  –1 +/
Сообщение от Аноним (-), 02-Авг-21, 08:31 
Опять этот чувак с родовой травмой EXT'а. Блин, ext4 то уже не сильно нужен стал, а его не попустит. И он все так же не покажет альтернативы где все это сработало бы лучше.
Ответить | Правка | К родителю #11 | Наверх | Cообщить модератору

38. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Аноним (-), 02-Авг-21, 15:10 
> Опять этот чувак с родовой травмой EXT'а.

Классический и известный пример, что не так, чудик? Даже если тебе лично патчи на производительность и надежность ext2 не нужны были, потому что ты тогда под вендой сидел.

Лицензия, которая типа "заставляет нахаляву работать сообщество на копиистов и капиталистов, ну или точнее заставляет паразитов что то отдавать сообществу назад", позволяет отдавать гугло-амазону-клаудфляри хоть дырку от бублика, хоть только то, что просто невыгодно поддерживать самим - поди узнай, что они еще назажимали "для внутреннего пользования".

> Блин, ext4 то уже не сильно нужен стал, а его не попустит.
>> "не нужно и вообще, не очень хотелось - мы тут EXT4 успели написать и даже собрать почти все грабли!"

Да-да, "это было давно и поэтому почти неправда!"
Но все же, какое меткое описание получилось.

Ответить | Правка | Наверх | Cообщить модератору

16. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Аноним (16), 01-Авг-21, 17:17 
Но это уже не свободная лицензия, раз она ограничивает чьи-то права
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

22. "Обновление голосовых данных Mozilla Common Voice 7.0"  –3 +/
Сообщение от Аноним (-), 01-Авг-21, 19:49 
Не занимался демагогией. Дураков тут нет.
Ответить | Правка | Наверх | Cообщить модератору

28. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Ordu (ok), 02-Авг-21, 03:44 
> CC0 enables scientists, educators, artists and other creators and owners of copyright- or database-protected content to waive those interests in their works and thereby place them as completely as possible in the public domain, so that others may freely build upon, enhance and reuse the works for any purposes without restriction under copyright or database law.
> ...
> while no tool, not even CC0, can guarantee a complete relinquishment of all copyright and database rights in every jurisdiction, we believe it provides the best and most complete alternative for contributing a work to the public domain given the many complex and diverse copyright and database systems around the world.[1]

[1] https://creativecommons.org/share-your-work/public-domain/cc0/

Ответить | Правка | К родителю #16 | Наверх | Cообщить модератору

34. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Анонимный Аноним (?), 02-Авг-21, 10:30 
> это уже не свободная лицензия, раз она ограничивает чьи-то права

Любая лицензия ограничивает какие-либо права - такова природа лицензий. Лицензия на то и существует, чтобы отделить правомерные условия использования от неправомерных, а это уже ограничение чьих-то прав и интересов.

Ответить | Правка | К родителю #16 | Наверх | Cообщить модератору

21. "Обновление голосовых данных Mozilla Common Voice 7.0"  –4 +/
Сообщение от Аноним (-), 01-Авг-21, 19:47 
Согласен с тобой, но про капиталистов ты перегнул. Очистки свою башку от коммунизма.
Ответить | Правка | К родителю #7 | Наверх | Cообщить модератору

39. "Обновление голосовых данных Mozilla Common Voice 7.0"  +2 +/
Сообщение от Аноним (39), 02-Авг-21, 16:43 
Начни с очистки своей. Судя по твоему короткому комментарию, там есть чем заняться.
Ответить | Правка | Наверх | Cообщить модератору

8. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от th3m3 (ok), 01-Авг-21, 12:43 
Да, но копирасты и тут влезают. Издают произведения в коммерческих целях, а потом блочат материалы по всей сети, якобы у них есть какие-то права.
Ответить | Правка | К родителю #4 | Наверх | Cообщить модератору

9. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Аноним (4), 01-Авг-21, 12:50 
Так ведь по дате надо смотреть. Если что-то по cc0 опубликованно раньше, то всё. Копирастец идёт на конец
Ответить | Правка | Наверх | Cообщить модератору

10. "Обновление голосовых данных Mozilla Common Voice 7.0"  +2 +/
Сообщение от th3m3 (ok), 01-Авг-21, 13:13 
Ага, передайте привет Литресу)
Ответить | Правка | Наверх | Cообщить модератору

12. "Обновление голосовых данных Mozilla Common Voice 7.0"  +1 +/
Сообщение от dullish (ok), 01-Авг-21, 13:56 
По многочисленным заявкам передаём привет и ставим песню группы "Ленинград"...
Ответить | Правка | Наверх | Cообщить модератору

13. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Аноним (4), 01-Авг-21, 14:19 
>и ставим песню группы "Ленинград"...

Дорожную?

Ответить | Правка | Наверх | Cообщить модератору

17. Скрыто модератором  +1 +/
Сообщение от Аноним (17), 01-Авг-21, 18:52 
Ответить | Правка | Наверх | Cообщить модератору

18. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Kuromi (ok), 01-Авг-21, 19:39 
"Интересно, что на втором месте по размеру накопленных данных язык руанда, для которого собрано 2260 часов."

Да все просто, наверное Мозилла с Невидией платят какую-то копейку носителю языка за его диктовку, а в Руанде работы нет ВООБЩЕ, так что все население ломанулось диктовать...
Это примерно та же ситуация когда рост битков помогал выживанию населения Венесуэллы, майнящего потихоньку на бесплатном электричестве.

Ответить | Правка | Наверх | Cообщить модератору

20. "Обновление голосовых данных Mozilla Common Voice 7.0"  –1 +/
Сообщение от Аноним (-), 01-Авг-21, 19:46 
Голоса алкашей распознает?
Ответить | Правка | Наверх | Cообщить модератору

23. "Обновление голосовых данных Mozilla Common Voice 7.0"  +4 +/
Сообщение от Аноним (23), 01-Авг-21, 20:18 
Я пока что не тестировал
Ответить | Правка | Наверх | Cообщить модератору

36. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Аноним (-), 02-Авг-21, 12:46 
Проблема речи алкашей в том, что они невнятные.
Ответить | Правка | Наверх | Cообщить модератору

25. "Обновление голосовых данных Mozilla Common Voice 7.0"  +2 +/
Сообщение от Аноним (25), 01-Авг-21, 23:34 
Внутренние?
Ответить | Правка | К родителю #20 | Наверх | Cообщить модератору

27. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Аноним (27), 02-Авг-21, 02:47 
Нет, твой не распознает.
Ответить | Правка | К родителю #20 | Наверх | Cообщить модератору

32. "Обновление голосовых данных Mozilla Common Voice 7.0"  +2 +/
Сообщение от Аноним (32), 02-Авг-21, 08:55 
Бэкдорчик для корпораций зла по сбору телеметрии. Мозилка скатилась конечно. Хотя после прошедших событий я ничему не удивляюсь. Сам жертвовал мозилке, а потом обнаружил что они деньги угрохивают в ИНКЛЮЗИВНОСТЬ и прочие нетехнические ЛГБТ-%#^, одновременно сокращая тех. персонал (Rust считай закопали).
Ответить | Правка | Наверх | Cообщить модератору

44. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Аноним (44), 03-Авг-21, 16:56 
Так потому что фонды это фуфельность. Сегодня уже есть возможность сделать инвестирование в фичу. В частности был полудохлый проект БоунтиБоне или как-то так и там можно было предложить фичу и на нее переводить деньги и как только кто-то ее реализует и сообщество как-то подтвердит реализацию бабло делилось по контрибьюторам. Вот будущее фондов, а так да всякое гомно финансировали. Я вот тоже теперь хочу офрмить возврат инвестиций в фонд мозиллы
Ответить | Правка | Наверх | Cообщить модератору

46. "Обновление голосовых данных Mozilla Common Voice 7.0"  +/
Сообщение от Анонимemail (46), 05-Авг-21, 21:43 
MP3, когда есть OGG, Opus — это конечно сильно.
Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру