Вариант для распечатки |
Пред. тема | След. тема | ||
| Форум Разговоры, обсуждение новостей | |||
|---|---|---|---|
| Изначальное сообщение | [ Отслеживать ] | ||
| "Раздел полезных советов: Борьба с web-ботами через запрет HTTP/1.1" | +/– | |
| Сообщение от auto_tips (??), 09-Мрт-26, 19:01 | ||
Как один из вариантов борьбы с AI-скрапперами, создающими огромную паразитную нагрузку на сервер, [[https://sheep.horse/2026/3/blocking_http1.1_-_some_results.html предложено]] ограничить доступ к сайту по протоколу HTTP/2 и полностью отключить поддержку HTTP/1.0 и HTTP/1.1. Логика подобного решения в том, что все современные браузеры поддерживают HTTP/2, а боты почти всегда обращаются к сайтам по HTTP/1.1 и пока не пытаются использовать HTTP/2 в случае невозможности отправить запрос на HTTP/1.1. | ||
| Ответить | Правка | Cообщить модератору | ||
| Оглавление |
| Сообщения | [Сортировка по времени | RSS] |
| 1. "Борьба с web-ботами через запрет HTTP/1.1" | +1 +/– | |
| Сообщение от Аноним (1), 09-Мрт-26, 19:01 | ||
Так себе идея, не учитывающая много исключений. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 2. "Борьба с web-ботами через запрет HTTP/1.1" | +1 +/– | |
| Сообщение от Гость (??), 09-Мрт-26, 20:58 | ||
С ботами из сети Tencent как? оттуда валится столько запросов и входящего трафика, что лучше из банить до http сервера. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 4. "Борьба с web-ботами через запрет HTTP/1.1" | +1 +/– | |
| Сообщение от Аноним (1), 10-Мрт-26, 06:52 | ||
С ними проще - можно банить прям подсетями. Брать из BGP списки подсетей принадлежащие AS Tencent, Alibaba, Huawei cloud и пр. и закидывать пачками в ipset/netfilter. Простенький скрипт в кроне раз в неделю | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 3. "Борьба с web-ботами через запрет HTTP/1.1" | +/– | |
Сообщение от S_Paul (??), 09-Мрт-26, 21:55 | ||
Вложенные "if"'ы наверное можно map'ами сделать. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 5. "Борьба с web-ботами через запрет HTTP/1.1" | +1 +/– | |
| Сообщение от Аноним (5), 11-Мрт-26, 08:42 | ||
Все нормальные скрейперы давно мимикрируют под браузер не только заголовком user-agent, но и протоколами. Продвинутые же скрейперы используют настоящий браузер. "Памяти всегда докупить можно (тм)". Сейчас у смузихлёбов на гитхабе тенденция - вообще всё делать через Microsoft Playwright (который через WebDriver работает с живой страницей), и не заморачиваться с реверсингом и кастомными скрейперами. Тьфу. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 6. "Борьба с web-ботами через запрет HTTP/1.1" | +/– | |
| Сообщение от Аноним (5), 11-Мрт-26, 08:44 | ||
Вообще всё - это когда этот playwright вообще ни к селу ни к месту. Но у Американских Высокооплачиваемых Скрейперописателей рабочее время слишком дорого для этого, дешевле оперативки докупить, оперативка ведь один раз покупается, а скрейпер писать - каждый раз надо. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 8. "Борьба с web-ботами через запрет HTTP/1.1" | +/– | |
| Сообщение от Аноним (8), 12-Мрт-26, 17:50 | ||
Меня как-то с работы попёрли за то, что я долго писал скрейпер с обвязкой на C и JS и полной автоматизацией. Джун, который за меня переписал другой мой скрейпер на вебдрайвере, который до этого был написан через реверсинг приложения, по шапке не получил. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 7. "Борьба с web-ботами через запрет HTTP/1.1" | +/– | |
| Сообщение от Аноним (7), 12-Мрт-26, 16:06 | ||
скоро боты поразмыслят и заявят о дискриминации. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 9. "Борьба с web-ботами через запрет HTTP/1.1" | +/– | |
| Сообщение от Gremlin_Rage (ok), 12-Мрт-26, 22:49 | ||
Гуглбот фигачит данные в Гемини, а в РФ он не подсказывает | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
| 10. "Борьба с web-ботами через запрет HTTP/1.1" | +/– | |
| Сообщение от Аноним (10), 13-Мрт-26, 10:01 | ||
AI Overviews в поиске и google.com/ai в РФ работают. | ||
| Ответить | Правка | Наверх | Cообщить модератору | ||
|
Архив | Удалить |
Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема |
|
Закладки на сайте Проследить за страницей |
Created 1996-2026 by Maxim Chirkov Добавить, Поддержать, Вебмастеру |