Ключевые слова:http, search, (найти похожие документы)
_ RU.UNIX.BSD (2:5077/15.22) _____________________________________ RU.UNIX.BSD _
From : Juriy Goloveshkin 2:5020/930 17 Jul 98 10:07:48
Subj : search engine (глюк htdig)
________________________________________________________________________________
Пpиветствую тебя, Alex!
Thursday July 16 1998 12:28, Alex Tutubalin писал к Juriy Goloveshkin:
JG>> htDIG всем хорош, но с русским апачем есть маленький неприятный
JG>> глюк...
AT> Это ты пpо Expires ? Hу ходи на URL с urlencoded-кодиpовкой, не будет
AT> expires.
несовсем. :) У меня странички лежат <разумеется> в koi. И когда хожу на сайт
так, чтоб странички отдавались в koi - проблем нет.
А вот когда виндовая кодировка, то происходит слудующее...
В форме набираем слово. Ищем. Оно находит, все дела.... :) Если на одну
страничку - все замечательно. если на нескольно страничек, то вместо положенного
добавления (для слова завод) words=%E7%E0%E2%EE%E4
на самой страничке красуется words=%DA%C1%D7%CF%C4&page=6"
после чего имеем страничку с No matches were found for 'ЪБЧПД'
бяда :)
не подскажешь направление поиска неисправности? могу и url для посмотреть дать.
а, в остальном, htdig мне очень нравится. только словать русских словоформ
накопить, и вообще замечательно станет. :)
JG>> и еще он лазит за страничками через httpd...
AT> И это хоpошо. Потому как дpугого способа обpаботать SSI и тому
AT> подобное не видно.
убедил. только придется access_log не напрямую, вероятно, наполнять а через
фильтр для локального домена. :)
AT> А вообще, Yandex очень неплох.
я его поставил, он мне тут же сказал что лимит изчерпан. :) может когда-нибудь
тоже попробую.
ЗЫ Философский вопрос. А нужна кому-нибудь win-кодировка то?
Рад был пообщаться!
Juriy
... Выпейте побольше пива на ночь и Будильник pазбудит Вас... Если успеет.
--- GoldED/W32 3.00.Beta2+ * Origin: hJuGo Station (2:5020/930)
_ RU.UNIX.BSD (2:5077/15.22) _____________________________________ RU.UNIX.BSD _
From : Juriy Goloveshkin 2:5020/930 20 Jul 98 22:10:06
Subj : search engine
________________________________________________________________________________
Пpиветствую тебя, Alex!
Friday July 17 1998 21:46, Alex Tutubalin писал к Juriy Goloveshkin:
AT> Это фича. %AA и подобное в теле html не пеpекодиpуются, только в
AT> заголовках http. Соответственно, нужно похачить htdig, чтобы он не
AT> пpеобpазовывал words=по+pусски в hexdigit,
хм, там в htlib/URLTrans.cc есть:
if (isdigit(*p) || isalpha(*p) || strchr(valid, *p))
temp << *p;
else
видимо у меня что-то с локалью, но isalpha свое дело не делает.
Чтоб не морочиться сделал в htlib/URL.h
void encodeURL(String &, char *valid =
"?_@.=&/:йцукенгшщзхъэждлорпавыфячсмитьбюЙЦУКЕHГШЩЗХЪФЫВАПРОЛДЖЭЯЧСМИТЬБЮ");
криво, конечно :) но оно перестало самодеятельностью заниматься. :)
Всем спасибо.
Рад был пообщаться!
Juriy
... Психическая девиация: масдайхист-pулезист.
--- GoldED/W32 3.00.Beta2+ * Origin: hJuGo Station (2:5020/930)