1.3, Аноним (3), 12:32, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| –3 +/– |
открыл себе такой новость, а тебе хором четыре семпла с порога в уши долбят
| |
|
2.12, Шарп (ok), 13:08, 17/02/2025 [^] [^^] [^^^] [ответить]
| +2 +/– |
яшка.браузер. Автоматически ничего не воспроизводится. У тетя там lynx?
| |
|
1.7, Аноним (7), 12:45, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +7 +/– |
> Поддерживается синтез на английском, японском, китайском, французском
> и немецком языках.
этот терминатор бракованный, мою маму не обманет, несите следующего.
| |
|
2.16, X86 (ok), 13:20, 17/02/2025 [^] [^^] [^^^] [ответить]
| –1 +/– |
эти все лезут регулировать то, в чем не разбираются. Потом будут в OpenAI GPT свой "браузер" продвигать)
| |
|
|
4.33, Смузихлёб (ok), 13:53, 17/02/2025 [^] [^^] [^^^] [ответить]
| +2 +/– |
> Le Chat от Mistral AI
Который недавно стал платным. Раньше годный продукт был, часто использовал, теперь оно даже более упоротое по лимитам, если сравнивать с чатгпт.
| |
|
3.34, Смузихлёб (ok), 13:56, 17/02/2025 [^] [^^] [^^^] [ответить]
| +4 +/– |
Это тот редкий случай, когда лучше зарегулировать. И чем раньше, тем лучше.
| |
|
|
5.84, Аноним (84), 04:39, 18/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Еще лет 5 назад читал статью, где представили сетку, клонирующую голос за 5 секунд
| |
|
6.86, Андрей (??), 11:39, 18/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Real-Time-Voice-Cloning на гитхабе. На самом деле подвох прост - всё это черри-пикинг, т.к. что прошлая, что данная модель дают уверенный результат только на 5% голосов, причём чем ближе к выборке, тем лучше. В реальных же применениях всё это как правило работает очень грустно. Касательно 30 секунд вместо 5 - оправдаю авторов тем, что RTVC делала клонирование в лоб(более примитивной моделью) и не учитывала многих качеств голоса, собственно обратите внимание на схему с моделью, где по меньшей мере упомянуты эмбеддинги для 'Speaker ID', 'Emotion', 'Pitch', а на деле там сидит ещё несколько, поэтому улучшение есть, но цена и сложность модели растут сильнее, чем качество и простота адаптации.
| |
|
|
4.67, Аноним (67), 19:46, 17/02/2025 [^] [^^] [^^^] [ответить]
| +1 +/– |
Ты зарегулируешь, а китай, хакеры и пр не зарегулируют и будут пользоваться. Только у тебя не будет профита от этого потому что тебе запретили. А у них будет.
| |
|
5.68, Аноним (68), 19:55, 17/02/2025 [^] [^^] [^^^] [ответить]
| +1 +/– |
Если кто-то откажется, тем надо выписывать санкции по самое небалуйся. И регулировать не всё подряд, а например, только этот момент с генерацией голоса, фоток и видео людей.
| |
|
|
|
|
1.10, поле Name (?), 13:05, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| –1 +/– |
Ну не знаю, из 4х семплов мне меньше всех понравился сабж. Слишком звучит как робот из колцентра, а добавленное мычание
звучит принужденно. Fish хороший.
| |
1.17, Аноним (17), 13:21, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
А синтезатор, который можно заставить говорить мультяшным голосом, кто-нибудь может посоветовать?
Предполагаемое использование: глупый попугай, повторяющий на разные лады одну и ту же выученную фразу в рекламных роликах.
Magic Goody почти подходит, но этот голос заезженный и несвободный.
| |
|
2.28, Аноним (27), 13:50, 17/02/2025 [^] [^^] [^^^] [ответить]
| +5 +/– |
> мультяшным голосом
Для этого не нужны нейросети. Просто увеличь скорость воспроизведения на своём катушечном бобиннике.
| |
2.37, Аноним (37), 14:22, 17/02/2025 [^] [^^] [^^^] [ответить]
| +2 +/– |
Мультяшный голос делали из обычного ещё в дремучие годы, ускоряя плёнку.
| |
|
3.39, Аноним (17), 14:26, 17/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
> Мультяшный голос делали из обычного ещё в дремучие годы, ускоряя плёнку.
Я неправильно выразился. Тут нужен скорее не столько мультяшный, сколько "птичий" голос. Или трескучий, или "петушиный" голос, с резким различием высоты тона для ударных и безударных слогов. Примерно как espeak с задранным значением -P:
espeak -v Storm -p 99 -P 199 "Senior citizens, have, priority!"
| |
|
4.41, Аноним (17), 14:31, 17/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
>> Мультяшный голос делали из обычного ещё в дремучие годы, ускоряя плёнку.
> Я неправильно выразился. Тут нужен скорее не столько мультяшный, сколько "птичий" голос.
> Или трескучий, или "петушиный" голос, с резким различием высоты тона для
> ударных и безударных слогов. Примерно как espeak с задранным значением -P:
> espeak -v Storm -p 99 -P 199 "Senior citizens, have, priority!"
Или еще лучше:
espeak -w /tmp/input.wav -v Storm -p 99 -P 199 "Senior citizens, have, priority!"
sox /tmp/input.wav /tmp/output.wav pitch 300
aplay /tmp/output.wav
| |
|
|
|
|
2.20, Аноним (-), 13:29, 17/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Тенденция чтобы могло, если не сейчас и не у них так у других, и если не сейчас так позже.
| |
2.25, Аноним (27), 13:45, 17/02/2025 [^] [^^] [^^^] [ответить]
| +5 +/– |
Могут уже достаточно чтобы разводить людей мошенниками. Таких случаев полно уже не первый год. Особенно, когда звонят "родственники", которые оказались в сложном положении своим 80-летним бабушкам, которые бегут снимать миллионы. Одна южная "страна" очень хорошо в этом преуспела.
| |
|
1.24, Аноним (27), 13:43, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +5 +/– |
> Для работы рекомендуется наличие GPU NVIDIA как минимум серии 3000 с 6 Гб видеопамяти.
Т.е. недоступно для большинства людей.
А бесплатно онлайн есть?
| |
|
2.38, Аноним (9), 14:22, 17/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
>недоступно для большинства
Ну самые доступные с 6gb gddr6 это GeForce RTX 3050, также есть Intel Arc A380.
| |
2.72, Аноним (72), 21:08, 17/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
> А бесплатно онлайн есть?
А сам-то как думаешь, будет ли кто-то держать кучу серваков с мощными GPU за бесплатно?
Вам прогу написали, натренировали, под открытой лицензией на блюдечке выложили, а вы "хочу бесплатно!". Совсем уже зажрались...
| |
|
3.103, Аноним (27), 20:42, 18/02/2025 [^] [^^] [^^^] [ответить]
| +1 +/– |
Это действительно большие деньги даже для Москвы. Просто кто-то умеет их считать, а кто-то спускает всё в кофе\бары\рестораны\игрушки\железо и живёт 29 дней в месяце на дошираке.
| |
|
4.104, Аноним (102), 21:36, 18/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Видеокарту не каждый день покупают. И «спустить» раз в пару-тройку лет 300$ на видеокарту — не значит жить на дошираке, даже для РФ, даже для провинции (кстати, на дошираке жить крайне невыгодно).
| |
|
5.114, Аноним (27), 05:22, 19/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
> на дошираке жить крайне невыгодно
На фриганство перешел? По контейнерам лазишь? Хмм... а стоит ли оно того, чтобы ради видеокарты так опускаться по социальной лестнице)
| |
|
6.117, Аноним (102), 12:15, 19/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Если вам из-за покупки видеокарты за триста баксов приходится лазить по контейнерам — с социальной лестницы падать уже некуда.
| |
|
|
|
|
|
1.31, mustai (ok), 13:53, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +1 +/– |
> монотонной (как в аудиокнигах)
Такие аудиокниги невозможно долго слушать.
| |
1.47, Аноним (47), 16:16, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +3 +/– |
всё это кончиться : "Мама, ты позвонила и сказала если придёт дядя Петя - передать ему деньги.. дядя Петя приходил , я деньги передала . дядя просил передать тебе спасибо!"
| |
1.48, Ivan7 (ok), 16:20, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +2 +/– |
Т.е. нам нужно минимум GPU RTX 4080 для работы в реальном времени, и при этом комп будет греться и шуметь как не в себя)) Т.е. надо ставить мини электростанцию рядом! Спасите планету!!!
| |
|
|
3.99, Аноним (68), 14:48, 18/02/2025 [^] [^^] [^^^] [ответить]
| +2 +/– |
> Аудиокниги начитывать
У вас для аудиокниг, а у кого-то для обмана доверчивых пожилых людей.
| |
|
4.115, Андрей (??), 08:26, 19/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
>> Аудиокниги начитывать
> У вас для аудиокниг, а у кого-то для обмана доверчивых пожилых людей.
Так и что - не будет этой штуки останутся другие тысяча и один способ "обмана пожилых людей". Тут уж извините, но тут ничем не помочь, кроме как разъяснительными беседами с пожилыми людьми и доведения до них информации о том, что нужно быть осторожными или вовсе убеждать в том, что нельзя поднимать звонки с незнакомых номеров и пр. Поэтому конечно крутые нейронки увеличивают риски, но с другой стороны я бы рекомендовал больше за LLMки беспокоится, ибо голос ещё нужно скопировать, а вот в ролевую LLMку уже сейчас можно вгрузить фотки и инфу из соц сетей, так, что она в "вайбере", "ватцапе" может дурить родственников, так, что с трудом получится отличить от оригинала, не переходя на совсем уж личные темы. Ну и в целом, опять же - чтобы не дурили по телефону, нужно просто на белые списки переходить, дабы у и без того "непонятно кого", даже возможности не было предложить каверзные услуги или обмануть как-то иначе.
| |
|
|
|
1.53, Аноним (53), 16:58, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
> "Для работы рекомендуется наличие GPU NVIDIA как минимум серии 3000 с 6 Гб видеопамяти!"
А как же владельцы карт от AMD?
| |
|
2.54, Аноним (54), 17:03, 17/02/2025 [^] [^^] [^^^] [ответить]
| –3 +/– |
Им для начала надо стать владельцами ВИДЕОКАРТЫ, а не Радеона.
| |
|
3.61, ЛщЛ (?), 18:03, 17/02/2025 [^] [^^] [^^^] [ответить]
| +4 +/– |
> Им для начала надо стать владельцами ВИДЕОКАРТЫ, а не Радеона.
А они и так самые настоящие владельцы видеокарт, а не комбаина для майнинга крипты и нейронок.
| |
|
2.89, Андрей (??), 11:44, 18/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Ну готовый докер образ разворачивает докеровский pytorch под cuda - под ocl/vulkan pytorch придётся разворачивать самому
| |
2.111, Аноним (111), 01:09, 19/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Переписывать под себя, естественно.
cuda на амд будет никогда, так что ручками всё, ручками
| |
|
1.60, Аноним (62), 18:00, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
"Для работы рекомендуется наличие GPU NVIDIA как минимум серии 3000 с 6 Гб видеопамяти."
А чо, рыксы от AMD совсем в пролёте? А как жи рыксы опенсорснее и лучше под линуксами?
Или опенсорс такой дружный, что не может договориться друг с другом?
| |
|
2.63, Аноним (63), 18:27, 17/02/2025 [^] [^^] [^^^] [ответить]
| +2 +/– |
Ну так ты попробуй разобраться. Потыкать по ссылочкам, увидеть torch, нагуглить, работает ли он с AMD ROCm
| |
|
1.70, Аноним (68), 19:57, 17/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +1 +/– |
Главное чтоб не вышло, когда что-то делают во благо или ради интереса, а потом это попадает в злые руки. В общем, опасная тенденция.
| |
|
2.80, Аноним (80), 03:06, 18/02/2025 [^] [^^] [^^^] [ответить]
| –4 +/– |
Мне почему-то печально немного видеть такие комменты на wannabe-технарском сайте. Если тут такое происходит, то что ждать от простого населения, не жаждущего tech-stuff.
Или это такая интервенция политиков в it. Со страхов сноса правительств, и старых схем управления они пошли строчить комменты нейросетками по всему интернету.
| |
|
3.96, Аноним (68), 14:41, 18/02/2025 [^] [^^] [^^^] [ответить]
| +1 +/– |
Если бы ты не был таким приземлённым и думал не только о ближайших месяцах, то понял бы, почему умные люди беспокоятся о будущем — о годах и даже десятилетиях.
| |
|
2.90, Андрей (??), 11:55, 18/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Почти любую вещь можно использовать как во зло так и во благо - вопрос только меры и воспитания.
| |
|
|
2.76, Аноним (72), 22:56, 17/02/2025 [^] [^^] [^^^] [ответить]
| +1 +/– |
> Давайте угадаем с одного раза завезли ли русский язык
Давайте будем читать дальше заголовка.
| |
|
1.78, Аноним (79), 01:34, 18/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +4 +/– |
Хорошо что таки "опасные" вещи выкладываются в паблик, ибо они разрушают штуки куда более опасные, например аутентификацию голосом.
| |
|
2.82, Аноним (80), 03:17, 18/02/2025 [^] [^^] [^^^] [ответить]
| –3 +/– |
Представляете, как можно сегодня влиять на общественное мнение подобными разработками. Раньше-то было это не так сложно всё устроить. Тем, у кого есть ресурсы, конечно.
Идет всё ко "входу в интернет по паспорту", и "ограничению иностранного влияния в нашем сегменте"
| |
|
3.97, Аноним (68), 14:44, 18/02/2025 [^] [^^] [^^^] [ответить]
| +1 +/– |
> входу в интернет по паспорту
И это правильно, так и должно быть. Это для твоего же блага, потому что слишком много свободы — это плохо, и если бы ты немного подумал, то сам бы всё понял.
| |
|
2.94, Аноним (94), 13:44, 18/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Аутенртификация голосом вообще ужасная идея с точки зрения опсека, как и все биометрические формы в прочем, из которых голосом - худшая.
| |
|
3.112, prokoudine (ok), 02:33, 19/02/2025 [^] [^^] [^^^] [ответить]
| –2 +/– |
Иные биометрические формы "взломать" можно только методом ректального криптоанализа. Что прекрасно работает и с другими формами аутентификации.
| |
|
|
|
2.92, Андрей (??), 12:01, 18/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Там была более примитивная модель, которая выдавала качественный результат по сути только на черрипиках, а по сути только на удачном тексте и достаточно похожем на голоса из выборки, в противном случае получалось очень плохо. Собственно говоря это как был так и пока остаётся только хороший маркетинг, но на деле обобщающие способности моделей довольно так себе. Собственно в данном случае ведь не случайно подсовывают голос трампа в примерах, ровно как пару лет назад на конференции Путина тоже показывали перетюненый фейк, но что пять лет назад, что сейчас пока модели довольно средние. Единственное, что удивляет - это поющая suno, в ней реально генерятся довольно крутые вещи, в том числе с голосом.
| |
2.98, Аноним (68), 14:46, 18/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
Оно работало чуть более, чем никак. Так, просто пруф оф концепт.
| |
2.101, Аноним (101), 17:41, 18/02/2025 [^] [^^] [^^^] [ответить]
| +/– |
В этих 5 секундах, ложечка дегтя. И там же в видео говорится, что они достигли этого за счёт "тонны" аудио образцов с речью людей.
Если данная технология Zonos использует меньший объём тренировочных данных, но за счёт более умного алгоритма выруливает отсутствие такого же количества образцов, но она более передовая.
| |
|
1.116, Аноним (116), 09:39, 19/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Kokoro TTS звучит приятней, и работает практически на всём, ресурсов жрет минимум
| |
1.118, Аноним (118), 17:19, 19/02/2025 [ответить] [﹢﹢﹢] [ · · · ]
| +/– |
Ну все теперь не определишь бот тебе звонит или спамер. Спамер человек плохо, но это хотя бы человек. Бот может 24/7 этим заниматься.
| |
|