URL: https://www.opennet.dev/cgi-bin/openforum/vsluhboard.cgi
Форум: vsluhforumID3
Нить номер: 127321
[ Назад ]

Исходное сообщение
"Новый выпуск системы синтеза речи Silero"
Отправлено opennews , 22-Апр-22 15:25

Доступен новый публичный выпуск нейросетевой системы синтеза речи Silero Text-to-Speech. Проект в первую очередь нацелен на создание современной высококачественной системы синтеза речи, не уступающей коммерческим решениям от корпораций и доступной для всех желающих без использования дорогого серверного оборудования...
Подробнее: https://www.opennet.dev/opennews/art.shtml?num=57061

Содержание

Новый выпуск системы синтеза речи Silero,dullish, 15:25 , 22-Апр-22
- Новый выпуск системы синтеза речи Silero,Первая буква, 14:59 , 23-Апр-22
- Новый выпуск системы синтеза речи Silero,Аноним, 01:02 , 25-Апр-22
  - Новый выпуск системы синтеза речи Silero,dullish, 01:46 , 25-Апр-22
    - Новый выпуск системы синтеза речи Silero,Александр, 09:44 , 26-Апр-22
      - Новый выпуск системы синтеза речи Silero,dullish, 18:14 , 26-Апр-22
Новый выпуск системы синтеза речи Silero,Аноним, 15:38 , 22-Апр-22
- Новый выпуск системы синтеза речи Silero,Аноним, 01:03 , 25-Апр-22
Новый выпуск системы синтеза речи Silero,Аноним, 15:52 , 22-Апр-22
- Новый выпуск системы синтеза речи Silero,Аноним, 10:01 , 23-Апр-22
Новый выпуск системы синтеза речи Silero,keydon, 16:07 , 22-Апр-22
- Новый выпуск системы синтеза речи Silero,Аноним, 16:54 , 22-Апр-22
- Новый выпуск системы синтеза речи Silero,Аноним, 16:58 , 22-Апр-22
  - Новый выпуск системы синтеза речи Silero,Александр, 09:48 , 26-Апр-22
Новый выпуск системы синтеза речи Silero,Аноним, 16:13 , 22-Апр-22
Новый выпуск системы синтеза речи Silero,Аноним, 18:55 , 22-Апр-22
- Новый выпуск системы синтеза речи Silero,Аноним, 19:29 , 22-Апр-22
  - Новый выпуск системы синтеза речи Silero,Аноним, 19:55 , 22-Апр-22
    - Новый выпуск системы синтеза речи Silero,Александр, 09:50 , 26-Апр-22
Новый выпуск системы синтеза речи Silero,Аноним, 19:15 , 22-Апр-22
Новый выпуск системы синтеза речи Silero,Аноним, 20:39 , 22-Апр-22
- Новый выпуск системы синтеза речи Silero,Аноним, 10:46 , 23-Апр-22
  - Новый выпуск системы синтеза речи Silero,Александр, 09:49 , 26-Апр-22
Новый выпуск системы синтеза речи Silero,prokoudine, 01:04 , 23-Апр-22
Новый выпуск системы синтеза речи Silero,Аноним, 00:14 , 27-Апр-22
Новый выпуск системы синтеза речи Silero,Пятьюшестьвеник, 20:12 , 10-Ноя-22
Новый выпуск системы синтеза речи Silero,Пятьюшестьвеник, 17:04 , 12-Ноя-22
- Новый выпуск системы синтеза речи Silero,Дмитрий, 20:52 , 15-Ноя-22
Новый выпуск системы синтеза речи Silero,Пятьюшестьвеник, 16:24 , 23-Ноя-22

Сообщения в этом обсуждении

"Новый выпуск системы синтеза речи Silero"
Отправлено dullish , 22-Апр-22 15:25

Прям вот отличные голоса! Но, пока не будет апэкашек для андроида, не взлетит.

"Новый выпуск системы синтеза речи Silero"
Отправлено Первая буква , 23-Апр-22 14:59

Чем отличные? Заложенным носом?

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 25-Апр-22 01:02

> развивающая проект компания не раскрывает механизм тренировки моделей.
> Для запуска можно использовать PyTorch
Чемодан батареек и внешнюю видяху сначала докупи.

"Новый выпуск системы синтеза речи Silero"
Отправлено dullish , 25-Апр-22 01:46

> Чемодан батареек и внешнюю видяху сначала докупи.
Разрабы говорят, что, в теории, андроид потянет, но у них лапки. Да и во всех современных смартах, включая бюджетники есть какой-никакой "нейроускоритель". Если его каким-то макаром прицепить, то, возможно, чемодан батареек не понадобится.

"Новый выпуск системы синтеза речи Silero"
Отправлено Александр , 26-Апр-22 09:44

Мы явно указываем, что наши модели запускаются и вменяемо работают даже на 1 потоке процессора.
Откуда все эти сказки про обязательность видеокарт - вероятно понятно только автору таких комментариев.

"Новый выпуск системы синтеза речи Silero"
Отправлено dullish , 26-Апр-22 18:14

> Мы явно указываем, что наши модели запускаются и вменяемо работают даже на
> 1 потоке процессора.
> Откуда все эти сказки про обязательность видеокарт - вероятно понятно только автору
> таких комментариев.
Как я понимаю, речь идёт об одном потоке сферического зиона в вакууме. Да и критерий "вменяемости" немного расплывчатый. Отсюда и странные толкования.

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 22-Апр-22 15:38

Время TTS на десктопах приближается.

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 25-Апр-22 01:03

Все это было уже лет 20. И их главная проблема была вовсе не в качестве как таковом.

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 22-Апр-22 15:52

> Решены "детские проблемы": нестабильность и пропуск слов;
У меня в детстве таких проблем не было.

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 23-Апр-22 10:01

Да, ладно!

"Новый выпуск системы синтеза речи Silero"
Отправлено keydon , 22-Апр-22 16:07

> Вопреки сложившемуся тренду решения Silero успешно запускаются даже на 1 потоке x86 процессора Intel c инструкциями AVX2. На 4 потоках процессора синтез позволяет синтезировать от 30 до 60 секунд в секунду в режиме синтеза 8 kHz, в режиме 24 kHz - 15-20 сек., а в режиме 48 kHz - около 10 сек.
Как будто на школьный утренник попал где считают что "1 поток процессора" это неизменная величина по которой можно судить о быстродействии софта.

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 22-Апр-22 16:54

судя по этой страничке https://github.com/snakers4/silero-models/wiki/Performance-B...
там CPU - Intel i7-6800K CPU @ 3.40GHz

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 22-Апр-22 16:58

или
All of the below benchmarks and estimates were run on 6 cores (12 threads) of AMD Ryzen Threadripper 1920X 12-Core Processor (3500 МHz).

"Новый выпуск системы синтеза речи Silero"
Отправлено Александр , 26-Апр-22 09:48

Не совсем понимаю, в чем здесь претензия.
Если софту достаточно одного потока процессора для работы - это огромное достижение, с учетом того, что большинство современных публикаций по синтезу вообще мягко намекают, что нужны карточки уровня V100 для работы их синтеза.
То, что вы нашли никак не связанный с новым релизом бенчмарк старых моделей STT и натянули ее на глобус, тоже вызывает скорее только ухмылку.
Понятно, что чем слабее процессор, тем медленнее будет работать, но весь этот хейт на пустом месте кажется просто курам насмех, с учетом того, что "модные" сетки не запускаются на карточках с менее чем 16 GB VRAM.

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 22-Апр-22 16:13

Ребята молодцы, крутая штука!

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 22-Апр-22 18:55

наверни торч
наверни сабж
выкачай модель
накидай пихтоноскрипт
ты же хочешь просто книжки почитать как icebook reader c digalo nikolai во времена winxp, да?

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 22-Апр-22 19:29

Это буквально в 2 клика. На то, чтобы найти варезник с ice book reader, сегодня куда больше времени потратишь. Да и качество там такое себе было.

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 22-Апр-22 19:55

>буквально в 2 клика
>ERROR: Could not find a version that satisfies the requirement torchaudio==0.10.0 (from silero)
>ERROR: No matching distribution found for torchaudio==0.10.0

"Новый выпуск системы синтеза речи Silero"
Отправлено Александр , 26-Апр-22 09:50

Такой вопрос лучше задать в репозитории.
Но вообще для синтеза torchaudio не нужен.
Просто посмотрите standalone примеры в приложенном колаб-ноутбуке.

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 22-Апр-22 19:15

>но развивающая проект компания не раскрывает механизм тренировки моделей
Засуньте в https://github.com/lutzroeder/netron

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 22-Апр-22 20:39

У них второй год просят докер-образ сделать с RestAPI каким-нибудь, а воз и ныне там ((
Прям хоть самому изучить пайтон и сделать...

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 23-Апр-22 10:46

можно быть спокойным за то, что ни ты, ни другое трепло с опеннета этим не займется

"Новый выпуск системы синтеза речи Silero"
Отправлено Александр , 26-Апр-22 09:49

У коммерческой версии такой докер-образ естественно есть.
Если вы хотите сервис - будьте добры купить лицензию.

"Новый выпуск системы синтеза речи Silero"
Отправлено prokoudine , 23-Апр-22 01:04

> Модели стали в 10 раз быстрее и, например, в режиме 24 kHz позволяют синтезировать до 20 секунд аудио в секунду на 4 потоках процессора;
Перешли на HiFi-GAN что ли?

"Новый выпуск системы синтеза речи Silero"
Отправлено Аноним , 27-Апр-22 00:14

Как ЭТО установить не пойму?

"Новый выпуск системы синтеза речи Silero"
Отправлено Пятьюшестьвеник , 10-Ноя-22 20:12

Работает!
Я впихнул pytorch в embedded python 3.10 - на win10 это нормально прокатывает ;) Скачал модель.
На основе примеров соорудил питон-скрипт, делящий текст на части < 1000 символов и озвучивающий их. И чтобы ffmpeg на лету переводила wav -> mp3.
Получилась переносимая сборка - на флешку помещается. Запускал на ноуте с i7, threads=4, rate=48000. Книжка средних размеров переводится в аудио минут за 30..40 :))

"Новый выпуск системы синтеза речи Silero"
Отправлено Пятьюшестьвеник , 12-Ноя-22 17:04

Читает шикарно ;)

"Новый выпуск системы синтеза речи Silero"
Отправлено Дмитрий , 15-Ноя-22 20:52

Приветствую. Так будь же добрым человеком, расшарь где нить для ламеров свой вариант для флэшки!!!! Я бы, например, был тебе очень благодарен...

"Новый выпуск системы синтеза речи Silero"
Отправлено Пятьюшестьвеник , 23-Ноя-22 16:24

На форуме https://mytts-info.ucoz.net/
есть свободный доступ аж к 3 сборкам разных авторов :)
В теме Программы, использующие синтез речи в Windows » другие программы
От Pin240: https://t.me/myttsinfo/287
(Инициатор создания сборки для Silero, свою всё еще дорабатывает)
Oт tonio_k: сообщение #47: https://mytts-info.ucoz.net/forum/20-159-4
ссылки на скачивание + инструкция. Стартовал вторым - но на финише первый, сборка - рабочая.
Последним спохватился я: https://disk.yandex.ru/d/9oyIVwAzQJH5Cg
Экспериментальная сборка, содержит модели Silero для 6 языков, в т.ч. русский.
Подробности: http://aloys.narod.ru/sof/1/demagog.htm#18
параграф Demagog-x64 + SileroTTS. Там же прямая ссылка и на сборку tonio_k.