Представлен выпуск развиваемого компанией Mozilla движка распознавания речи DeepSpeech 0.6, который реализует одноимённую архитектуру распознавания речи, предложенную исследователями из компании Baidu. Реализация написана на языке Python с использованием платформы машинного обучения TensorFlow и распространяется под свободной лицензией MPL 2.0. Поддерживается работа в Linux, Android, macOS и Windows. Производительности достаточно для использования движка на платах LePotato, Raspberry Pi 3 и Raspberry Pi 4...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=51991
Кстати, как там дела над:
https://www.opennet.dev/opennews/art.shtml?num=51110
Исходя из графиков можно сделать вывод что теперь оно бесполезно чуть более чем полностью. А по ссылке инициатива по компрометации и дискредитации приличной сборки браузера с удалёнными бэкдорами и телеметрией.
Коммент твой бесполезен чуть более чем полностью. Так же как и все комменты, которые проповедуют о "бесполезности" вообще всего кода. Меньше нойте, больше пишите код, бесполезные вы наши.
Речь не о вообще всём коде, а о результате подобной "оптимизации" под мобильные устройства.
Леннарту тоже _ты_ насоветовал? )
аугментация - это не корекция, а наоборот - порча.
аугментация - это модификация с целью улучшения, как уж получается - другой вопрос.
Вы в машобе, я вижу, совсем не очень понимаете. Улучшают модель. Улучшают - в смысле улучшают её обобщающие способности. Для этого нужно много данных, похожих на реальные. А реальные данные внезапно испорченные.Для этого модель учат работать на испорченных данных. Для картинок: вращают, флипают и прочие аффинные преобразования, закрашивают части, кропают, делают нелинейные искажения, типа сферической абберации, добавляют шумы и дефекты оптики и матрицы, добавляют adversarial-примеси. От всего этого кошка в тюленя не превратиться, и сеть должна это усвоить.
Тут звук и тут делают похожие вещи.
ё!@#$%й стыд! разумеется "не превратится".
> 27 часами на русском.Операторам связи по закону Яровой голос диктуете (из-за чего у кое-кого уже наверное лучшая в мире система для распознавания русской речи, но с вами ей не поделятся, ибо для них желательно, чтобы распознавали речь вы исключительно в облаках), а Мозилле продиктовать, значит, западло !?
> Мозилле продиктовать, значит, западло !?Мсье, прошу вас пройти на сайт Common Voice и собственноручно^W собсвенноголосно надиктовать сколько угодно часов речи.
Просто поставьте на телефон прогу, пишущую ваши разговоры с микрофона (и не пишущую ответы ваших собеседников). И вылейте их туда. Всё равно по закону Яровой всё пишется.
А текстовое представление надиктованной речи кто будет печатать?
работники мозиллы / туркеры / толокеры.
Оно само научится.
что же ты такой болезный вообще в сети делаешь? Да и в этом мире. За тобой все следят. Шапочка есть из фольги?
А что он не так сказал? Всё в соответствии с россиянским законом. Если у какого оператора ещё не пишется, в ближайшее время устранят отставание.
>сторонними разработчиками отдельно подготовлены модули для Rust и GoОднако странная позиция мозиллы. Вроде как они ратуют за использование раста в своих проекта, но при этом продолжают писать на си. Даже биндинги сделали сторонние разрабы. Насколько знаю, ABI раста нестабилен, поэтому сложно применять как библиотеку, но тогда почему до сих пор ABI не стабилизировался? Различные фишки развивают, но при этом такие базовые вещи как стабильный ABI обходят стороной. Позиционировать как замену си в таком случае бесмысленно.
Ответы на твой вопрос звучали тут уже тысячу раз, но их все удалил модератор Fourt. И ровно по той же причина не взлетела идея переписать Postgre на раст https://www.opennet.dev/opennews/art.shtml?num=45826Поэтому попробуй догадаться сам.
> И ровно по той же причина не взлетела
> идея переписать Postgre на растНу, одно дело переписать существующий код (что почти всегда бессмысленно). Другое дело начать разрабатывать новые продукты на расте, тем более в мозилле. А эта либа в разработке с 2016 года, раст же релизнулся версией 1.0 в 2015.
Да уж, хрусты в своём унылом фанатизме превзошли даже пихтоновых обезьянок.На опеннете с модераторами просто беда. Вот прямо всё хорошо, а модераторы — хуже стихийного бедствия и казней египетских.
Конечно же правильно тот модератор пишется Forth.
Никогда не запомню что форт правильно пишется Forth.
>предложенную исследователями из компании BaiduТеперь ещё кто-то будет вякать о том, что мурзиловцы не сливают данные? Да гугл это невинная девственница, против байду. Оно не просто собирает данные, оно отсылает собранную информацию на серверы Baidu. При этом оно пренебрегает шифрованием вообще или использует очень слабые методы шифрования.
поддерживаю, сливают все они без исключений, но не припомню что тут кто то говорил что мозила не сливает, говорят обычно сливают но меньше чем угол, тут согласен, но вот если угл дальше не льет ибо шарит, а вот мозила таки да льет дальше наверняка, да еще и на расте лол
Baidu статью написали. Mozilla по ней сделала. Что за клоунаду вы тут развели?
Гуглботам надо зарплату отрабатывать. В одном треде упомянули сразу Baidu, Mozillу и даже Rust. Кто-то получит премию за этот месяц.(во всяком случае я надеюсь, что люди не настолько отсталые, чтобы писать подобное не за деньги)
Можно? Можно я вякну?Факты в студию. Мозилла имеет чёткую позицию в отношении того, какие данные она собирает и что она с ними делает. В частности она определённо и недвусмысленно заявляет, что третьим лицам эти данные не уйдут ни в каком виде. И до сих пор я не видел никаких фактов, которые бы противоречили заявлениям мозиллы.
> определённо и недвусмысленно заявляет, что третьим лицам эти данные не уйдут ни в каком видеСколько тебе лет?
>> определённо и недвусмысленно заявляет, что третьим лицам эти данные не уйдут ни в каком виде
> Сколько тебе лет?Для тебя твой возраст является аргументом, доказывающим то, что мозилла сливает данные на сторону? Дедушка, вам пора прекращать сидеть в интернете, надо пить корвалол и смотреть телевизор. Грядки копать можно, но осторожно.
> что третьим лицам эти данные не уйдут ни в каком виде.Естественно, только партнёрам. По крайней мере пока не "утекут" на флешке или через взлом.
Уверен, что все "правильные" организации, которым нужны эти данные уже партнёры.
> Естественно, только партнёрам.Откуда дровишки? "Третья сторона", по определению, включает в себя и партнёров тоже, но у тебя видимо инсайдерская информация? Поделишься?
> Уверен, что все "правильные" организации, которым нужны эти данные уже партнёры.
И твоя уверенность основана на том, на том, что твоя голова покрылась сединами, как и у соседнего анонима? Или у тебя есть более существенные причины для уверенности?
> По крайней мере пока не "утекут" на флешке или через взлом.
Да, от этого не застрахован никто, и мозилла в частности.
> "Третья сторона", по определению, включает в себя и партнёров тоже,понятия "третья сторона" и "партнёры" достаточно размыты (в штатах), т.е. одно может включать другое, а может и не включать.
> И твоя уверенность основана на том, на том, что твоя голова покрылась сединами
моя уверенность основана на опыте работы в одной из крупнейших в мире компаний, где правая рука не знает, чем занята левая. Я не работал в мазилла конечно, и если честно - брезгую туда соваться.
Возможно они там все белые и пушистые, но последние пару лет улучшения в браузере как бы намекают.Соглашусь, я возможно слишком мрачно всё воспринимаю, но это уже профдеформация, всегда оцениваю не только текущую утечку личных данных, о которой я знаю, но и теоретический worst-case scenario.
И да, шапочка из фольги оч полезный в хозяйстве инструмент, хотя бы потому, что она из фольги. Ж)
>> И твоя уверенность основана на том, на том, что твоя голова покрылась сединами
> моя уверенность основана на опыте работы в одной из крупнейших в мире
> компаний, где правая рука не знает, чем занята левая. Я не
> работал в мазилла конечно, и если честно - брезгую туда соваться.Ну хоть один фактец о Мозилле? Хоть не очень существеный. Маааленькая утечка данных? Странное партнёрство с компанией, которая могла бы покупать данные? Ну или хотя бы один факт лжи в исполнении мозиллы, не важно по какой теме.
> Возможно они там все белые и пушистые, но последние пару лет улучшения
> в браузере как бы намекают.Последние несколько лет они собирают телеметрию и активно меняют браузер -- вполне укладывается в их легенду, не?
> Ну хоть один фактец о Мозилле? Хоть не очень существеный. Маааленькая утечка данных? Странное партнёрство с компанией, которая могла бы покупать данные?Кто ищет, тот всегда найдёт, тут всё достаточно субьективно. Одни покеты чего стоят.
Мне лень для тебя копаться в истории Мазиллы, сори.
>> Ну хоть один фактец о Мозилле? Хоть не очень существеный. Маааленькая утечка данных? Странное партнёрство с компанией, которая могла бы покупать данные?
> Кто ищет, тот всегда найдёт, тут всё достаточно субьективно. Одни покеты чего
> стоят.Которую Mozilla купила, чтобы не было необходимости сливать данные третьей стороне.
> Мне лень для тебя копаться в истории Мазиллы, сори.
Если лень, то зачем ты вообще трудился тут что-то писать? Кому какое дело до твоих фантазий?
> Если лень, то зачем ты вообще трудился тут что-то писать? Кому какое дело до твоих фантазий?ты же умный, психолог, подумай над своим вопросом на досуге.
у меня жена такие вопросы задаёт, когда неудовлетворена. :)
>> Если лень, то зачем ты вообще трудился тут что-то писать? Кому какое дело до твоих фантазий?
> ты же умный, психолог, подумай над своим вопросом на досуге.Я и без того знаю ответ. Мне интересно, знаешь ли его ты. Практика показывает, что мало лишь кто способен к осознанному поведению, и под "мало лишь" я имею в виду единицы людей на тысячи.
> у меня жена такие вопросы задаёт, когда неудовлетворена. :)
А вот зачем ты это сказал, я действительно не понимаю. Какое мне дело до твоей способности/неспособности удовлетворять свою жену?
> мало лишь кто способен к осознанному поведению, и под "мало лишь" я имею в виду единицы людейя точно не из этих счастливчиков. и это единственное что я осознаю. изредка.
> А вот зачем ты это сказал, я действительно не понимаю.
Затем, что ты задаёшь вопросы на которые знаешь ответы, при этом хочешь узнать нечто совсем другое, подобное поведение выходит за рамки "обычной мужской логики". Предлагаю перестать флудить. Мне точно больше нечего добавить про мозилу и т.п. вещи, а заниматься психоанализом я не хочу.
кто-то уже сказал "Кортана"? нет? .. хмм..
Breaking news: реализация написана на языке Python!! Тьфу ты.. неинтересно.
Это можно было не упоминать вообще, или констатировать с сожалением. Современный кодэр, если не уеб-разработчик, ничего больше и не умеет, противно. А эсли и умеет, то ему не позволят эффективные менеджеры из Байды..
Ну раз такой умный, пойди на раст перепиши.
А не подумал ли ты, что как раз "умных" может не интересовать ни первый, ни второй ЯП? ;)
Ну тут не много вариантов. Либо человек умный и берёт питон и си, Либо человек не умный и не берёт питон и си. Раст интересен, но только в теории. Будь он интересен практически, на нём бы уже написали что-нибудь помимо 1 quiche (например, графический тулкит).
о, типичный иксперт опеннетов в области машинного обучения
Я ващет про обезьян, зачем ты сюда приплетаешь какую-то ерунду?))
Он тоже про обезъян.
Принципиально новый фаерфокс! Теперь и с голосовой телеметрией (ну, как всегда, чтобы делать продукт ещё лучше!)
Если бы была голосовая телеметрия, дейтасеты не были бы такими куцыми.
Пусть спросят у яндекса или гугла, те пишут звук круглые сутки.
Так они их своим конкурентам и дали.
А у вас есть доступ к полным? Ибо то, что они выкладывают публично не означает, что это всё что у них есть.
Какие же вы всё-таки идиоты, товарищи комментаторы.
Вам было бы идеально с бубнами из компакт-дисков в серверной, как кощеям, над вашими серверами чахнуть и на люди не показываться.
Почему ему нельзя аудиокниги подсовывать?
Наверное, нужна определённая лицензия на эти данные.
Нужна не лицензия, а очень дорогой юрист. Кому надо - тот давно подсовывает (не голос, а текст худ. литературы), причём в открытую, но судиться с ними просто сумасшедших нет - даже если корпорация иск проиграет, истцу может такая ответка прилететь, что продажи сильно просядут, и сделать с этим истец ничего не сможет, кроме как пойти поныть конгрессменам. А конгрессмены его слушать не будут.
Да ладно, если сор из избы не выносить - то можно, если что - мы не знали, а вся отвественность на контракторах. Если код так пишут, почему нельзя ИИ тренировать?
Вижу, разрабы до сих пор не рассматривают принципиальной возможности сборки TensorFlow c поддержкой OpenCL. Онли CUDA.
Так опенсорсно.
Потому что только куда имеет смысл. Опенцл - детская поделка на ее фоне.
Модель можно экспортировать в ONNX, из ONNX перевести в любой из как минимум 2х тулкитов для под OpenCL (один из которых ещё и умеет в обучение на OpenCL, но имеет отвратительную лицензию AGPL, второй же имеет пермиссивную лицензию, но годится только для inference и вообще пилится исключительно под нужды крупных корпораций (отсюда поддержка SGX и TrustZone, чтобы злые пейраты не вытащили модели, на сбор дейтасетов для которых и обучение которых бедные корпорации затратили миллионы долларов, и теперь законно хотят всех нагибать)).
предлагаю особо ревностным комментаторам зачитать мурзилловцам русские народные сказки. так сказать продвинуть культуру в массы)) причем с большим количеством старославянских слов. пусть их движок помучается))
предлагаю по ролям начитывать комментарии с опеннета. Намного круче сказок.
> Производительности достаточно для использования движка на платах LePotato, Raspberry Pi 3 и Raspberry Pi 4Такая слабая производительность достаточна? Неужели. Может, и на Pentium 3 заведётся?
Это вечная проблема процов. В 1996 году ты покупаешь Pentium 166 MMX, заплатив за него, как за полтора Pentium 100. А ни одна прога MMX не использует: ты тупо переплатил за ещё 33 МГц. Вышел Quake 2 без MMX, вышел Carmageddon с MMX, но ты его прошёл за три дня. А потом игры стали использовать 3dfx, и вообще не нуждаться ни в каком MMX! Но через пару лет, MMX реально понадобился: кодек MPEG2 без него показывает совсем печальную производительность... Но всё равно нужен минимум 366 МГц, который кстати в 1998 году стоит недорого, а твой 166, купленный "на вырост", за огромные деньги в 1996 году, в ожидании прог, использующих MMX, оказался не нужен. Разве что WinRAR на 10 секунд быстрее распаковал архив, а им ты пользуешься раз в год.
Тогда ты покупаешь Pentium 3 в 2000 году, ведь там SSE, а эти инструкции ускоряют в том числе распознание голоса. И ты уже ждёшь этих прог. Бесплатно, разумеется, как и фотошоп, который хоть и стоит тыщу баксов, но тебе достался бесплатно, как и майя, как и много что ещё. А вот хрен, не вышло никаких распознавателей голоса ни в 2000, ни в 2010. А когда всё-таки вышли, то твой SSE они вообще не используют - минимально хотят SSE2, который сейчас есть даже в самых дешёвых процах. А твой P3, купленный задорого, вообще не использовал свой SSE примерно ни в чём, кроме WinRAR, которым ты пользуешься раз в год.
>Такая слабая производительность достаточна? Неужели. Может, и на Pentium 3 заведётся?Инференс относительно обучения очень лёгкий.
)) Покупать топовые процы на релизе? Это такой особый вид извращений? Это всё равно что купить AMD64 на релизе в 2003 году, ещё на сокете 754, чтобы установить туда 64-битную систему. И ждааааать, когда же она выйдет?
Покупай середнячки и не парься. Всё равно в будущем апгрейдиться.
мозилла: *выкладывает опенсорсный проект, позволяющий запилить качественное распознавание речи на своем собственном железе, не сливая ничего в интернет, в отличие от всяких гуглов с амазонами*эксперты с опенка: "фи, не нужно, почему не на <название_языка>". Все как обычно.
Кстати о <название_языка>. Эсперанто есть?
Почему просто не скормить этой приблуде звуки и субтитры из какого-нибудь Скайрима? Качественные записи, хорошие субтитры. И ещё 10 подобных игр.
Ой-вей... питонище. Ладно, забудьте.
Сири, Алиса... А как мозилловскую барышню звать будет, Мурзилла?
Зе Мамзелька.
У мозиллы нет поисковика. И основной контингент любителей мозиллы - мужчины. Поэтому у мозиллы не будет барышни. Хотя на крайняк можно мужской голос нейросетью переделать в голос гея и трансгендера-бывшей лесбиянки - всё как SJW любят.
Пора делать форк DeepThroat
Дайте URL сервиса для создания титров !!!
пжлста !
Попробовал зайти на сайт коммонвойса...Господа, у кого это уё... чудо сайтостроения всё-таки показало список языков - там японский есть?
https://voice.mozilla.org/ja
Признавайся, вокалоидов решил подсунуть?
Забавно.>по прилагаемой инструкции можно обучить систему самостоятельно, используя голосовые данные, собранные проектом Common Voice
>(ветка 0.6 не совместима с прошлыми выпусками и требует обновления кода и моделей)
>, но потребовало внесения в код изменений, нарушающих совместимость с моделями, подготовленными ранее.Для предыдущей ветки ты такой напрягался, потратил стотыщпицот часов обучения на создание нужных тебе моделей, а в новой ветке они вдруг превратились в тыкву. Голосовое управление для твоей дачи и деревянного сортира, которое ты хотел реализовать на основе этого, придется отложить на попозже - надо новые модели натренировать. Ты нахмурился, выбросил старые модели в тот сортир, напрягся, потратил еще кучку человекочасов (как в 21м веке на даче прожить без управляемого голосом деревянного уличного туалета?)... Потом выходит ветка 0.7, еще в два раза более быстрая, но снова с этой небольшой поправкой - "несовместимая"? Снова модели выбрасываешь (блин, так отхожее место быстро переполнится)...
Я правильно всё понял или заблуждаюсь?
Правильно, если исключить твои фантазии про туалет. Добро пожаловать в Agile world.
Так ради этого туалета всё голосовое управление и затевалось. Бедная у тебя фантазия. На даче нет ничего важнее сортира. Разве что ещё туалетная бумага в нем.
Не обновляй ПО туалета. Глядишь, без новых свистелок и перделок проживёшь.
А собсна зачем? Бубнить *ок гугл* в лису? ну ващще..
Бесполезно без понимания программой контекста