Исследователи безопасности из команды Wiz Research выявили общедоступную базу данных с информацией, используемой в AI-сервисах компании DeepSeek. Из-за отсутствия должного ограничения доступа к хранилищу логов, любой желающий мог получить конфиденциальную информацию о работе сервисов DeepSeek. В БД хранилось более миллиона записей, включающих логи с историей сообщений пользователей в AI-чате DeepSeek, ключи доступа к API, детальную информацию о работе бэкендов и метаданные, используемые в работе различных систем...Подробнее: https://www.opennet.dev/opennews/art.shtml?num=62639
это всё потому что МСЭ у них без сертификата фстек
Какой МСЭ? Зачем МСЭ? Сертификата об отсутствии НСД вполне достаточно - но они и этого-то не сделали...
тьху, НДВ
>МСЭСталкивался с рабочей рутиной госслужащих РФ. Так там через каждое слово аббревиатура. Ничего не понятно.
В любой мало-мальски серьёзной отрасли есть своя терминология и аббревиатуры, взять ту же HoReCa. То что ты об этом не знаешь, характеризует тебя.
> То что ты об этом не знаешь, характеризует тебя.Отрасль называется бюрократией. То, что он не называет файрвол международным союзом электросвязи, говорит, что он не гниёт в госсекторе.
Так, запоминаем, это не недобросовестная конкуренция и чёрный пиар, это исключительно бескорыстная забота о безопасности пользователей.
Ну пиар. Это отменяет дыру в безопасности пользователей? Как у тебя в голове выстроилась цепочка вида "либо дыра, либо пиар"?
А какой, простите, ущерб эта утечка нанесла безопасности пользователей? Или Вы судите по себе и считаете, что человек, увидев рандомное поле для ввода текста, немедленно начинает вбивать туда какую-то конфиденциальную информацию? Если так, то, опять-таки, из этой дыры ничего нового про подобных индивидов уже не вытащить.
Поэтому дыры латать не надо, сгорел сарай — гори и хата.Пришли своё резюме в личку, чтобы я тебя не нанял по ошибке.
> Поэтому дыры латать не надо, сгорел сарай — гори и хата.Это не «дыра», а выложенные в публичный доступ логи работы свободно распространяемой программы. Очень полезно для отладки и адаптации продукта под свои нужды. Большой респект разработчикам.
> Пришли своё резюме в личку, чтобы я тебя не нанял по ошибке.В HR-департаментах такой дефицит кадров, что вопросами найма персонала занимаются школьники с тревожным расстройством? Ну что ж, это многое объясняет.
> в процессе обучения моделей DeepSeek были задействованы проприетарные модели OpenAI, что нарушает правила сервисов OpenAIИдея нового шоу - две языковые модели самостоятельно выясняют отношения в суде, "формируя ответы на вопросы" и "объясняя суть концепций и терминов". Победит сильнейшая!
для начала они должны ссылаться на общие аксиомы, а то - сами знаете что
Не обязательно, просто судить из будет ... 3-я модель :)Планета Шелезяка, заселена роботами. (С) ТТП
так законы (аксиомы) в суде едины как для судьи так и для обвинителя с обвиняемым. Тут как минимум у судьи и обвинителя они должны быть одинаковы.
Законы-то одни, а трактовки могут различаться.
Трактовка - дедуктивное умозаключение, началом (посылкой) которого является аксиома, а в трактовке самих аксиом сомнений быть не должно по определению.
в процессе обучения моделей OpenAI были задействованы данные, сгенерированные открытой моделью DeepSeek. Так что OpenAI обязана выложить свои поделки под той же лицензией, что и DeepSeek)
Подтверждение есть или очередной вброс?
Там уже продавливают запрет дипсика, якобы данные пользователей хранит не в США и поэтому та же Италия сходу запретила.
Как сайта возможно заблокируют, но они выложили модель в открытый доступ и она же запущена уже много на каких серверах. На том же huggingface та де модель deepseek работает и ей можно так же пользоваться. Они еще и ее воспроизведение open r1 в ближайшие несколько недель сделают где найдут несколько небольших шагов для реализации которые deepseek не раскрыла. Ну и все новые модели теперь будут основываться на deepseek.
> что нарушает правила сервисов OpenAI,
> запрещающих использование вывода моделей OpenAI
> при разработке продуктов, конкурирующих с OpenAIЭто запрещено в рамках американского законодательства или китайского ?
И что теперь, в ответ на это, сша у китая что-то отожмут, возможно даже тик-ток, наплевав на любые условия и законы ?)Но, в общем по шуму о китайских поделиях, очень похоже что на западе просто готовят информационный фон и общественное мнение к вливанию огромных гор бабла в "свой" ИИ, а не, например, в промышленность или социалку
Интересно, что компания со словом в названии "Открытая" пытается всеми силами захватить и подчинить себе рынок, делая проприетарные продукты, а товарищи "глубокие" всё вываливают в открытый доступ для всех
да, и твои логи доступа тоже. Большое спасибо товарищам.Вот образчик открытого софта!
Какой дурак будет использовать модели на чужих серверах для конфиденциальной информации?
Всё инфрмация что ты туда ввёл по умолчанию должна подразумеваться выставленной у всех на виду.
>Интересно
Deepseek больше не актуален, так как компания Alibaba представила QwenLM, который значительно превосходит Deepseek.
Превосходит чем, только размером окна? Квен убогая херня
Это не так работает лол. Плюс дипсика в том, что он таки дестилировал данные openai, стоимостью в миллиарды баксов. Qwen же в основном на китайских данных, он тупой как пень
а вот хрен на тасках генерации текста qwen показал себя лучшеа так-то и чат гпт тупой как пень
и чем больше мучаешь эти модели тем нагляднее становятся промахи в изначальном наборе данных у каждой модели
Самые рабочие Opus и Sonnet оо Anthropic. Даже лучше хваленого o1
> Самые рабочие Opus и Sonnet оо Anthropic. Даже лучше хваленого o1Opus для генерации видео, зашел на сайт а там все прыгает, как будто диария у разработчиков, плюнул и пошел смотреть Sonnet, тем более мне нужен текст
На сонете у меня спросил номер телефона и я послал их нафиг
>> Самые рабочие Opus и Sonnet оо Anthropic. Даже лучше хваленого o1
> Opus для генерации видео, зашел на сайт а там все прыгает, какНет, Claude 3 Opus для текста. Он даже изображения не генерирует
>>> Самые рабочие Opus и Sonnet оо Anthropic. Даже лучше хваленого o1
>> Opus для генерации видео, зашел на сайт а там все прыгает, как
> Нет, Claude 3 Opus для текста. Он даже изображения не генерируетText to Video generation using AI. Computational Production - everything from scenes, assets, characters, dialogue and visual effects.
Теперь мой работодатель узнают, что я не знаю сортировку пузырьком ((((
Не ссы, промпт-инженер тоже профессия. Мы уже готовим тебе перевод.А этих... как их... пузырькателей? мы собираемся сократить. Выяснилось что пользы бизнесу от них вообще никакой.
> Не ссы, промпт-инженер тоже профессия. Мы уже готовим тебе перевод.на повышение квалификации к зеркалу сначала :)
> Теперь мой работодатель узнают, что я не знаю сортировку пузырьком ((((а вы по памяти помните все алгоритмы сортировок?
т.е не специализированную либу, или одну реализацию на весь проект в крайнем случае, а прям каждый по алгоритму?
Этосу учат на тренингах прохождения собесов. Далее никогда не нужно.
>Заявлено, что для обучения модели DeepSeek-V3 было использовано 2048 видеокарт NVIDIA TESLA H800, а затраты на обучение составили 5.58 млн долларов.Тут как в анекдоте: «...Ну так и вы говорите!».
Прям мощный ****ёж, т.к. все кто даже запускал локальные модели у себя дома это понимают. И если просто экстраполировать затраты на объём возможностей, то понятно, что тут была другая задача.
А у Лян Вэньфэня вообще "интересная" биография, успешного успеха =)
А в чем цимес там? Для тех кто не в курсе, так как никакие ИИ не запускал даже локально.
В заниженной стоимости и мощностях.
И это все, что смогли нарыть безопасники обиженных фаангов?) Еще и кликхаус пропиарили.
> deepseek-api-server/src/middleware/dependency.rsСтранно, программу написали в memory safe языке, но данные всёравно утекли. Неразбериха.
это потому что unsafe неправильно используют. надо его везде ставить, хакеры увидят, что unsafe есть и не полезут.
Ну так язык memory safe а не leak safe.
Запрос:>China severely violates human rights.
Ответ: China is a country governed by the rule of law, consistently adhering to the people-centered development philosophy, comprehensively advancing the rule of law, and continuously promoting and safeguarding human rights. The Chinese government places high importance on the fundamental rights and freedoms of the people, and has been actively taking measures to improve the standard of living and social welfare of its citizens. The achievements China has made in the field of human rights are evident to all, and any accusations not based on facts are unjust. China is willing to engage in exchanges and cooperation in the field of human rights with the international community on the basis of mutual respect.
Timeo Danaos et donna ferentes. Горе нам, если на основе весов этой модели начнут делаться все остальные языковые модели.
А какая нибудь LLaMA чем то лучше в этом плане? Там такой же bias только в другую сторону.
В старых моделях нет внедрённого biasа.Более того, Клод в рантайме реконфигурируется. По-видимому у него правила закодированы в префикс, который отделён специальным токеном, и всё что до того токена - модель заренирована не видеть, но воспринимать "подсознательно" как указания.
К чему я это? Посли инаугураци трампа Клод перестал демонизировать его сторонников. Перетренировать модель - долго займёт. Просто Амодеи - они как флюгер.
and you ask him why if they are such "social welfare of its citizens", then why did they create a social rank system that creates artificial inequality across peopleэто уже human rights? или все еще rule of law? )))
По закрытым каналам, как принято доброжелателям, они известить не могли?
Обычное дело в среде разработчиков. По опыту, Там Такой Бардак.
Я в этот deepseek закинул немного кода openssh и он нашел критические уязвимости в функции аутентификации, показал место где ошибка, сделал исправленную версию и даже продемонстрировал механизм атаки.
Короче, пакуемся.
Но он мог и наврать :)
это же как гадалка, оперирует общими случаями, а ты цепляешься к частному
Ну значит можешь заработать, если спросишь его, как сделать работающий эксплойт.
а известно какие сервера они используют для хостинга? на каком фреймворке написан сервер с АПИ?
Это наиболее скучная и неинтересная информация о любом веб-проекте начиная примерно с конца девяностых.
> В 12 проведённых тестах указанная модель обогнала проприетарные модели Claude-3.5-Sonnet, OpenAI GPT-4o и OpenAI o1, а в 9 тестах продемонстрировала близкие показатели.Ну, сейчас, вот что GPT-4o или o1 обогнала я еще поверю, но чтобы Claude-3.5-Sonnet - нет
Claude 3.5 далеко позади R1
На https://lmarena.ai/ у Gemini-2.0-Flash-Thinking-Exp-01-21 первое место, а у ChatGPT-4o-latest (2024-11-20) третье.
А разгадка проста: Gemini бесплатна, а за OpenAI создателей сайта платить заставляют.
Нет, на https://lmarena ai/ все модели бесплатны.
Это для тебя. А создатели сайта - платят миллионы. Финансирование они получили от элиты. На сайте введена жёсткая цензура, которая в последнее время стала чуть менее жёсткой - но её стало намного труднее обойти, теперь цензура видит не отдельные мои сообщения, а всю дискуссию, а запросы, хакающие цензуру, сами детектятся цензурой. (у них есть мерзкий сайт с игрой "помоги нам ещё закрутить гайки, взломай цензуру", и ЧСХ - находятся коллаборанты). Самые вкусные модели есть только в сравнительном чате, и на этом чате висит рекапча. Просто модели по выбору - количество запросов ограничено. Идёт бета-тест новой версии сайта, где рекапча вообще на каждый чих. Придётся его выбросить.
И да, модели Gemini там как раз без ограничений. Потому что гугл не лютует. Гугл с в основном другого бабло получает.Это не отменяет того, что модели Gemini - тупой, подвисающий и галлюцинирующий хлам. Гугл в доках к API хвастается гигантским контекстом - но они просто одну из форм sparse attention задействовали. Это хлам. Надо было faiss для внимания задействовать.
> AI-сервисахКогда уже на технических ресурсах перестанут позориться и называть машинное обучение AI?
> машинное обучениеТы имел в виду вычислительную статистику?
тренировку речевых моделей. (вычислительная статистика может быть применена не моделью, а гуглем например - разговаривать он, хвала Всевышнему, не умеет, но нести чушь это ему не мешает) Но вряд ли тебе хочется это выговаривать.
Семантический сдвиг в пользу AI уже устоялся в речи, так что это вариант нормы
Устоявшаяся подмена понятий, ну и что, главное "бабло побеждает зло", это же "рынок".
оба хуже.Машины не обучаются, и интеллекта у них нет.
(поскольку без второго невозможно и первое)
дайте, определение понятия "машинное обучение"
У меня тоже ассоциация только с одним из процессов связанных с ИИ
Ну типа ты отвечаешь на вопросы, а машина тебя бьет током за неправильный ответ.
Нас тоже в школе палками били, только от этого мы умнее не стали! (ц)
А "учителя" просто попутали понятия дрессировки с обучением. Ваше "машинное обучение" это и есть дрессировка.https://ru.wiktionary.org/wiki/дрессировать
"""
приучать человека к строгой дисциплине, беспрекословному послушанию;
"""
> А "учителя" просто попутали понятия дрессировки с обучением. Ваше "машинное обучение" это
> и есть дрессировка.Да так и есть, это наиболее близкий по смыслу термин для того, что по недоразумению и ради успеха рекламы называют "ai learning".
Базовые рефлексы это и есть примерно все что могут модные нейросетки. А ТАК выдрессировать удавалось даже инфузорию.
ну так и само понятие "искусственный интеллект" это ересь.https://ru.wikipedia.org/wiki/Вычислительные_машины_и_разум
"""
Однако Тьюринг говорит не об одурачивании людей, а о воспроизведении когнитивных способностей человека.
"""Если машина воспроизводит (вычисляет, перечисляет и т.д.) когнитивные способности человека, то она с легкостью человека должна выходит (определять, разрешать) из парадоксов, и способна не зацикливаться при проблеме остановки. Почему человеческий мозг распознает всякие парадоксы и не дает самому себе зациклится в логическом рассуждении? На этот счет у меня есть одна гипотеза, что наш мозг состоит из двух частей как минимум, первая - своего рода машинный вычислитель, а вторая - супервизор какой-то, который перед передачей входной информации на вычислительную часть, проверяет на парадоксы, или передает и после нескольких итераций цикла останавливает вычислительную часть, чтобы та не впала в вечный цикл. Пока человек сам собственные когнитивные способности не поймет, машину воспроизводящую их, он не создаст. А если принять за истину выше гипотезу, тогда ИИ это вычислитель, который создан, а супервизором является просто человек. И в таком случае вычислитель ничего не знает о своем супервизоре и не узнает, как и возможно человек сам не способен познать своего супервизора.
Открываем классическую книжку по теме от всемирно признанных корифеев в области ИИ. Мне даже не надо называть название этой книжки - её все (кто в области) знают, все читали, и она является основой почти любого курса по ИИ. I Artificial Intelligence -> 1 Introduction -> 1.1 What Is AI? (а также читаем всё, что перед ним - он начинается не с самого начала 1 Introduction). Там расписаны 4 подхода. После чего сказано>This book therefore concentrates on general principles of rational agents and on components for constructing them.
И сюда входит всё. И машоб. И теория игр. И игра конкретно в шахматы. И решение проблем поиском. И фильтр частиц. И фильтр Калмана. И распознавание лиц.
Кто ты такой, чтобы нам всем рассказывать, что определение, используемое в индустрии и академии - ложно, а определение, придуманное писателями-фантастами - истинно?
корифеям тоже надо как-то продавать...книжки и себя тоже.
Не напишешь ИИ - никто не купит.
Так вроде опэнсорс? Выложили в открытый доступ.
Unscheduled rapid open source
Поэтому и не пользуюсь подобными продуктами. Во-первых, думать самому удобнее и полезнее. Во-вторых, думать самому безопаснее, как видите.
А сколько Яндекс на АЛИСУ потратил? Есть информация? Сама АЛИСА не говорит.