The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Mozilla развивает инструментарий для распознавания речи Whisperfile"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Mozilla развивает инструментарий для распознавания речи Whisperfile"  +/
Сообщение от opennews (??), 23-Авг-24, 13:45 
Компания Mozilla развивает инструментарий распознавания речи Whisperfile, включающий независимую высокопроизводительную реализацию модели машинного обучения Whisper, разработанной и открытой организацией OpenAI. Инструментарий создан на основе whisper.cpp, реализации модели Whisper на C/C++, созданной Георгием Гергановым  (автор llama.cpp).  Код написан на языке С++ и распространяется под лицензией MIT...

Подробнее: https://www.opennet.dev/opennews/art.shtml?num=61750

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения [Сортировка по времени | RSS]


1. "Mozilla развивает инструментарий для распознавания речи Whis..."  –6 +/
Сообщение от Аноним (1), 23-Авг-24, 13:45 
По сути никаких нововведений, просто очередной GUI-лаунчер к консольному Whisper.
Ответить | Правка | Наверх | Cообщить модератору

2. "Mozilla развивает инструментарий для распознавания речи Whis..."  +9 +/
Сообщение от Аноним (2), 23-Авг-24, 14:00 
Это такой GUI на скриншоте?
Ответить | Правка | Наверх | Cообщить модератору

19. "Mozilla развивает инструментарий для распознавания речи Whis..."  –1 +/
Сообщение от Аноним (1), 23-Авг-24, 16:00 
Новость о том, что развивают, а не что выпустили. На скриншоте оригинальная консольная прога.
Ответить | Правка | Наверх | Cообщить модератору

3. "Mozilla развивает инструментарий для распознавания речи Whis..."  +2 +/
Сообщение от Аноним (3), 23-Авг-24, 14:00 
А что-нибудь лучше julius-speech уже придумали? Почему любое эффективное распознавание только на сервере у дяди в 2024 году?
Ответить | Правка | Наверх | Cообщить модератору

6. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от anonymmmeer (?), 23-Авг-24, 14:31 
А как ещё тебя заставить платить подсписку?
Ответить | Правка | Наверх | Cообщить модератору

7. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (7), 23-Авг-24, 14:34 
Через госуслуги.
Ответить | Правка | Наверх | Cообщить модератору

65. "Mozilla развивает инструментарий для распознавания речи Whis..."  –1 +/
Сообщение от YetAnotherOnanym (ok), 24-Авг-24, 11:28 
Кинь ссылку, где на Госуслугах оплата распознавания речи у дяди на сервере. Очень нужно, срочно.
Ответить | Правка | Наверх | Cообщить модератору

21. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (21), 23-Авг-24, 16:17 
Потому что тратили миллионы на сбор семплов и обучение нейронки на кластере с топовыми GPU не для того, чтобы отдать тебе бесплатно
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

62. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Бывалый Смузихлёб (ok), 24-Авг-24, 09:52 
Или не миллионы. Ещё неизвестно какая там себестоимость
Ответить | Правка | Наверх | Cообщить модератору

36. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от userd (ok), 23-Авг-24, 20:24 
с julius-speech не знаком. С vosk баловался - https://alphacephei.com/vosk/index.ru
вполне приемлемо работает без сервера "у дяди".
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

70. "Mozilla развивает инструментарий для распознавания речи Whis..."  +1 +/
Сообщение от prolabrusemail (?), 24-Авг-24, 14:36 
Он поддерживает русский язык? В репозитории только японский и английский вроде бы
Ответить | Правка | К родителю #3 | Наверх | Cообщить модератору

8. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Wed (??), 23-Авг-24, 14:34 
Жаль, что у меня нет GPU, иначе я бы протестировал это.


Ответить | Правка | Наверх | Cообщить модератору

16. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (16), 23-Авг-24, 15:41 
Для этого с виду консольного приложения нужен GPU?
Ответить | Правка | Наверх | Cообщить модератору

50. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (50), 23-Авг-24, 22:56 
Ты наверно не знаешь что бывает видеокарты без выидео-выхода
Ответить | Правка | Наверх | Cообщить модератору

17. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (17), 23-Авг-24, 15:49 
Гпу и не нужно, просто скорость медленная будет.
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

60. "Mozilla развивает инструментарий для распознавания речи Whis..."  +2 +/
Сообщение от Аноним (60), 24-Авг-24, 02:35 
Родительский проект Whisper.cpp спокойно работает на CPU. "Спокойно" в смысле "неспешно", но работает.
Ответить | Правка | К родителю #8 | Наверх | Cообщить модератору

10. "Mozilla развивает инструментарий для распознавания речи Whis..."  +1 +/
Сообщение от Аноним (10), 23-Авг-24, 14:45 
У меня у одного такое, после обновления до 129.0.2 одно ядра CPU уходит в 100% и в Firefox начинаются страшные тормоза.  Debian 12.6  
Ответить | Правка | Наверх | Cообщить модератору

12. "Mozilla развивает инструментарий для распознавания речи Whis..."  +1 +/
Сообщение от Аноним (3), 23-Авг-24, 14:51 
> У меня у одного такое, после обновления до 129.0.2 одно ядра CPU
> уходит в 100% и в Firefox начинаются страшные тормоза.  Debian
> 12.6

У меня таб зависает и выжирает память пока не будет прибит. Замечал, что может быть связано с частичной выгрузкой жирного таба в своп (и возможно vaapi), непонятно только, почему через рандомные периоды случается и ничего не пишет в лог.

Ответить | Правка | Наверх | Cообщить модератору

14. "Mozilla развивает инструментарий для распознавания речи Whis..."  +2 +/
Сообщение от Аноним (17), 23-Авг-24, 15:10 
Кому вообще пришло в голову вставлять в файл для llm сам движок для её запуска, так ещё и в виде машинного кода? Это звучит как что-то максимально небезопасное, я уверен, что если провести хотя бы пару часов в репозиториях можно будет наклепать эксплоитов, и закинуть их доверчивым любителям переложить написание кода на компьютер. К тому же это всё крутится вокруг хака, позволяющего запускать машинный код без изменения на нескольких платформах (Что как хак, конечно, очень интересно, но, вопрос, кто додумался это использовать как серьёзное решение?)
Ответить | Правка | Наверх | Cообщить модератору

15. "Mozilla развивает инструментарий для распознавания речи Whis..."  +1 +/
Сообщение от Ося Бендер (?), 23-Авг-24, 15:21 
Ясен пень, тому, кому это позарез нужно...
Ответить | Правка | Наверх | Cообщить модератору

18. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (18), 23-Авг-24, 15:50 
Это, вроде бы, два разных вопроса.

Прошить веса ллм прямо в файл, вроде бы, не проблема?

То есть, xbm/xpm это и есть Си.

А вот "космополит" это уже другой вопрос.

Ответить | Правка | К родителю #14 | Наверх | Cообщить модератору

23. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (17), 23-Авг-24, 16:55 
>Прошить веса ллм прямо в файл, вроде бы, не проблема?

Так проблема не в весах, а в том, что они в файл модели вставляют движок для её запуска, который уже на этой самой библиотеке и работает, и это всё подаётся под видом простого способа распространять модели. Так вот, проблема в том, что любой вася может просто в когда llama.cpp вставить малварь, это всё собрать, и распространять как обычный файл - и никто ничего не заметит, пока слишком поздно не будет. А про космополита это уже вопрос к стабильности, решение выглядит мягко говоря зыбким.

Ответить | Правка | Наверх | Cообщить модератору

30. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (30), 23-Авг-24, 18:58 
Вася и в саму модель может встроить малварь: https://www.opennet.dev/opennews/art.shtml?num=60691
Ответить | Правка | Наверх | Cообщить модератору

38. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (17), 23-Авг-24, 21:05 
Для того, чтоб такого не было придумали сейфтенсорс. И то, что есть одна уязвимость не оправдывает то, что они придумали один огромный вектор атаки. Да и ладно бы вектор, хрен бы с ним, так они ещё это позиционируют как лёгкий способ их распространять и запускать - ну прям самое то, чтоб всякие очень добрые граждане всяким блондинкам вшивали туда малвари.
Ответить | Правка | Наверх | Cообщить модератору

27. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (27), 23-Авг-24, 18:25 
> я уверен, что если провести хотя бы пару часов в репозиториях можно будет наклепать эксплоитов

так в чём проблема? пострать пару часов, наклепай эксплойтов, и продай их кому-нибудь за B$$$$$$$. всяко полезнее, чем комменты строчить...

Ответить | Правка | К родителю #14 | Наверх | Cообщить модератору

39. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (17), 23-Авг-24, 21:07 
Я вам вектор атаки написал сверху - все максимально очевидно. Мне же лень этим заниматься, да и вшивать пока туда нечего.
Ответить | Правка | Наверх | Cообщить модератору

56. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (7), 24-Авг-24, 00:11 
А почему ты сам это не сделаешь тебе доллары на нужны? Так отдай их мне.
Ответить | Правка | К родителю #27 | Наверх | Cообщить модератору

25. "Mozilla развивает инструментарий для распознавания речи Whis..."  +1 +/
Сообщение от Аноним (25), 23-Авг-24, 18:04 
> ... может выводить коэффициенты достоверности, позволяющие ...

Это то, что про ИИ нужно знать в первую очередь: ИИ выдаёт решения неверные, но с низкой вероятностью.

Т.е. это та штука, которую нельзя использовать для точных ответов или точных оценок. Т.к. оно по своей природе не даёт 100% верных ответов.

Ответить | Правка | Наверх | Cообщить модератору

28. "Mozilla развивает инструментарий для распознавания речи Whis..."  –1 +/
Сообщение от Аноним (3), 23-Авг-24, 18:30 
На практике человек куда меньше верных и тем более точных ответов выдаёт. Это хороший инструмент, но важно осознавать его ограничения. Капиталистический подход заменить бесполезных людей ещё более бесполезными нейронками это тупик.
Ответить | Правка | Наверх | Cообщить модератору

29. "Mozilla развивает инструментарий для распознавания речи Whis..."  –1 +/
Сообщение от Аноним (29), 23-Авг-24, 18:54 
Один AI-апологет мне задвигал, что в странах первого мира всем Universal Basic Income будет после полной автоматизации. А, соответственно, отсталые будут ещё больше загнивать и прозябать чем сейчас, с таким-то технологическим отрывом.

Даже жаль, что из генераторов обтекаемых бредотекстов такой революции не вышло. Было бы интересно.

Ответить | Правка | Наверх | Cообщить модератору

32. "Mozilla развивает инструментарий для распознавания речи Whis..."  –2 +/
Сообщение от Аноним (3), 23-Авг-24, 19:25 
GPT4 впечатляющая модель. Она умнее и догадливее большинства людей в интернете. Ограничения достаточно очевидны, но, если избавятся от галлюцинаций как-нибудь, научат сообщать о неспособности выдать приемлемый результат, самостоятельно фильтровать булшит, и будут дообучать в некоторых угольных случаях (таких, как программирование и современные технологии), она вполне сгодится на роль ассистента, значительно повышающего продуктивность работников. Конкуренты, конечно, грязь, и весь интернет заполнен результатами их "трудов".
Ответить | Правка | Наверх | Cообщить модератору

34. Скрыто модератором  +/
Сообщение от Аноним (34), 23-Авг-24, 20:14 
Ответить | Правка | Наверх | Cообщить модератору

52. "Mozilla развивает инструментарий для распознавания речи Whis..."  +6 +/
Сообщение от Ногоед (?), 23-Авг-24, 23:32 
> если избавятся от галлюцинаций как-нибудь

GPT не может без галлюцинаций. Чтобы их не было, нужна концепция, которая не является Generative Pre-Trained Transformers.

Ответить | Правка | К родителю #32 | Наверх | Cообщить модератору

37. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от мшефд (?), 23-Авг-24, 20:52 
>в странах первого мира всем Universal Basic Income будет после полной автоматизации.

При нынешней поведенческой модели человека, основанной на животных инстинктах, а не на разуме, человечество проср..т любые блага.

Ответить | Правка | К родителю #29 | Наверх | Cообщить модератору

45. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (45), 23-Авг-24, 22:16 
А ты попробуй жить разумом когда большой метеорит упадет на Землю. Или закончится нефть вместе с редкоземельными металлами.  
Ответить | Правка | Наверх | Cообщить модератору

63. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (63), 24-Авг-24, 10:14 
А ведь ты действительно, фактически не имеешь понятия про то, о чём пишешь на публичном форуме... Не пиши больше, миру не нужна твоя юношеская наивная дезинформация. И вдогонку вопрос: а в котором часу в море закончится вот прям таки весь уран?
Ответить | Правка | Наверх | Cообщить модератору

51. "Mozilla развивает инструментарий для распознавания речи Whis..."  +5 +/
Сообщение от Ногоед (?), 23-Авг-24, 23:30 
> На практике человек куда меньше верных и тем более точных ответов выдаёт.

Но человек знает 100%, что 2х2 будет равно 4. А нынешний псевдо ИИ лишь предполагает, пусть и с 99.99999999...%. Думаю, вы поняли мысль.

Ответить | Правка | К родителю #28 | Наверх | Cообщить модератору

64. "Mozilla развивает инструментарий для распознавания речи Whis..."  –2 +/
Сообщение от Аноним (64), 24-Авг-24, 10:47 
> Но человек знает 100%, что 2х2 будет равно 4.

Потому что в школе так сказали.

Ответить | Правка | Наверх | Cообщить модератору

31. "Mozilla развивает инструментарий для распознавания речи Whis..."  +3 +/
Сообщение от Аноним (31), 23-Авг-24, 19:25 
А браузер поразвивать Мозилла не желает?
Ответить | Правка | Наверх | Cообщить модератору

35. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (35), 23-Авг-24, 20:24 
Нет и не будет.
Ответить | Правка | Наверх | Cообщить модератору

49. "Mozilla развивает инструментарий для распознавания речи Whis..."  +1 +/
Сообщение от Аноним (49), 23-Авг-24, 22:50 
>Mozilla развивает инструментарий распознавания речи

... чтобы вставить его в Firefox и подслушать как пользователи Firefox'а  матерят Мозиллу

Ответить | Правка | Наверх | Cообщить модератору

54. "Mozilla развивает инструментарий для распознавания речи Whis..."  +1 +/
Сообщение от Полиглот (?), 23-Авг-24, 23:40 
ФФ со встроенным переводчиком с русского переводит,а обратно нет. Не хотят поделиться как факать каждый предмет.
Ответить | Правка | Наверх | Cообщить модератору

57. "Mozilla развивает инструментарий для распознавания речи Whis..."  +1 +/
Сообщение от мявemail (?), 24-Авг-24, 01:47 
говорят, либревульф умеет и на русский
Ответить | Правка | Наверх | Cообщить модератору

58. "Mozilla развивает инструментарий для распознавания речи Whis..."  +1 +/
Сообщение от Аноним (58), 24-Авг-24, 02:16 
Мозилла продолжает двигать кровати ...
кастрированная субоптимальная программа ... для запуска большой языковой модели ... на ворохе платформ из одного бинарника ... через кривые хаки, сносящие нахрен как производительность, так и митигаци уровня ОС... под авторством транса....

Ну молодцы, Мозилла. Вместо нормального браузера какое-то буллшит-бинго. Извини, если мне потребуется whisper, то я его сам скомпилю. Только есть проблема: этот whisper столько оперативы жрёт, что его нигде, кроме топовых железок, крутить нельзя.

Ответить | Правка | Наверх | Cообщить модератору

66. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от Аноним (66), 24-Авг-24, 11:31 
Несколько гигабайт потребляет всего.
Ответить | Правка | Наверх | Cообщить модератору

75. Скрыто модератором  +/
Сообщение от Аноним (75), 24-Авг-24, 18:18 
Ответить | Правка | Наверх | Cообщить модератору

59. "Mozilla развивает инструментарий для распознавания речи Whis..."  +1 +/
Сообщение от Аноним (58), 24-Авг-24, 02:17 
Хозяйке на заметку: парсер формата GGUF для вороха ЯП: https://github.com/kaitai-io/kaitai_struct_formats/pull/698
Ответить | Правка | Наверх | Cообщить модератору

72. "Mozilla развивает инструментарий для распознавания речи Whis..."  –2 +/
Сообщение от Nochiemail (?), 24-Авг-24, 15:23 
Лучше бы занялись добавлением функций, и улучшением дизайна, а то многое вырезали с браузера..
Ответить | Правка | Наверх | Cообщить модератору

76. Скрыто модератором  –1 +/
Сообщение от Аноним (-), 24-Авг-24, 19:31 
Ответить | Правка | Наверх | Cообщить модератору

79. "Mozilla развивает инструментарий для распознавания речи Whis..."  +/
Сообщение от xsignal (ok), 02-Сен-24, 16:05 
А для немецкого что-то похожее есть?
Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру