>и еще: как сделать так, что бы сайты с www и без,
>показывались как один? ищем в lightparser.pl
#simplified some common banner system & counters
$url=$Lurl;
$url =~ s/([a-z]+:\/\/)??.*\.(spylog\.com)/$1www.$2/o;
$url =~ s/([a-z]+:\/\/)??.*\.(yimg\.com)/$1www.$2/o;
$url =~ s/([a-z]+:\/\/)??.*\.(adriver\.ru)/$1www.$2/o;
$url =~ s/([a-z]+:\/\/)??.*\.(bannerbank\.ru)/$1www.$2/o;
$url =~ s/([a-z]+:\/\/)??.*\.(mail\.ru)/$1www.$2/o;
$url =~ s/([a-z]+:\/\/)??.*\.(adnet\.ru)/$1www.$2/o;
$url =~ s/([a-z]+:\/\/)??.*\.(rapidshare\.de)/$1www.$2/o;
$url =~ s/([a-z]+:\/\/)??.*\.(rapidshare\.com)/$1www.$2/o;
ну и по шаблону дописуем нужное ...
c колличеством надо смотреть, что нужно, и как оно повлияет на скорость парсинга
$site=~ s{(.*?)\.vkontakte\.ru}{vkontakte\.ru}o;
$site=~ s{(.*?)\.vkadre\.ru}{www\.vkadre\.ru}o;
$site=~ s{(.*?)\.top\.list\.ru}{1\.top\.list\.ru}o;
$site=~ s{(.*?)\.myspacecdn\.com}{www\.myspacecdn\.com}o;
$site=~ s{(.*?)\.youtube\.com}{www\.youtube\.com}o;
$site=~ s{(.*?)\.imageshack\.us}{www\.imageshack\.us}o;
$site=~ s{(.*?)\.photobucket\.com}{www\.photobucket\.com}o;
$site=~ s{u\d+\.eset\.com}{updates\.eset\.com}o;
$site=~ s{ts\d+\.eset\.com}{updates\.eset\.com}o;
$site=~ s{89\.202\.157\.13[5-9]}{updates\.eset\.com}o;
$site=~ s{(.*?)\.depositfiles\.com}{www\.depositfiles\.com}o;
$site=~ s{(.*?)\.odnoklassniki\.ru}{www\.odnoklassniki\.ru}o;
$site=~ s{(.*?)\.facebook\.com}{www\.facebook\.com}o;
$site=~ s{download\d+\.avast\.com}{download\.avast\.com}o;
$site=~ s{.\d+\.radikal\.ru}{cdn\.radikal\.ru}o;
$site=~ s{.*?\.foto\.radikal\.ru}{cdn\.foto\.radikal\.ru}o;
$site=~ s{khm\d+\.google.com}{maps\.google\.com}o;
$site=~ s{kh\d+\.google.com}{maps\.google\.com}o;
$site=~ s{mt\d+\.google.com}{maps\.google\.com}o;
$site=~ s{tbn\d+\.google.com}{tbn\.google\.com}o;
$site=~ s{mlt\d+\.google.com}{mlt\.google\.com}o;
$site=~ s{(.*?)\.ifolder\.ru}{www\.ifolder\.ru}o;
$site=~ s{(.*?)\.mystat-in\.net}{www\.mystat-in\.net}o;
$site=~ s{(.*?)\.photosight\.ru}{www\.photosight\.ru}o;
$site=~ s{(.*?)\.mylivepage\.com}{www\.mylivepage\.com}o;
$site=~ s{(.*?)\.imagevenue\.com}{www\.imagevenue\.com}o;
$site=~ s{(.*?)\.adskape\.ru}{www\.adskape\.ru}o;
$site=~ s{(.*?)\.tbn\.ru}{www\\.tbn\.ru}o;
$site=~ s{(.*?)\.fotki\.com}{www\.fotki\.com}o;
$site=~ s{(.*?)\.deviantart\.com}{www\.deviantart\.com}o;
$site=~ s{(.*?)\.rutube\.ru}{rutube\.ru}o;
список из текущих экспериментов, так что смотрите внимательно
будет утиль для построцессига, чтоб можно было в уже существующем отчете объеденить такие сайты ...