Добрый день сообществу! Случилась такая не очень приятная история: в одном из филиалов стоял старенький сервачок в качестве inet-gw (bind, squid, socks5, dhcpd, sendmail, openvpn) uname -a FreeBSD xxxxxxxx 6.3-PRERELEASE FreeBSD 6.3-PRERELEASE #1: Tue Oct 30 04:56:47 EET 2007 root@xxxxxxxx:/usr/obj/usr/src/sys/XXXXXXXX i386 отрывок из dmesg: CPU: Pentium II/Pentium II Xeon/Celeron (334.09-MHz 686-class CPU) Origin = "GenuineIntel" Id = 0x660 Stepping = 0 Features=0x183f9ff<FPU,VME,DE,PSE,TSC,MSR,PAE,MCE,CX8,SEP,MTRR,PGE,MCA,CMOV,PAT,PSE36,MMX,FXSR> real memory = 67108864 (64 MB) avail memory = 56102912 (53 MB) Понимаю, что никакая машинка, но ставилось это еще году в 2005... Для обмена файлами позже в процессе работы на него была еще установлена в один прекрасный день samba-3.0.21b,1, из-за некоторых особенностей работы винды. Все это работало вполне терпимо, состав народа менялся от 3 до 10 +-3 человек, но сервер стал периодически падать. Чтобы не мучить дедушку и отправить его на заслуженный отдых, в период, когда народа стало больше 10 человек, была выделена новая машинка: CPU: Intel(R) Celeron(R) CPU 1.70GHz (1699.95-MHz 686-class CPU) Origin = "GenuineIntel" Id = 0xf13 Stepping = 3 Features=0x3febfbff<FPU,VME,DE,PSE,TSC,MSR,PAE,MCE,CX8,APIC,SEP,MTRR,PGE,MCA,CMOV,PAT,PSE36,CLFLUSH,DTS,ACPI,MMX,FXSR,SSE,SSE2,SS,HTT,TM> real memory = 259981312 (247 MB) uname -a FreeBSD xxxxxxxx_new 7.2-STABLE FreeBSD 7.2-STABLE #8: Wed Sep 23 16:22:06 EEST 2009 root@xxxxxxxx_new:/usr/obj/usr/src/sys/XXXXXXXX i386 На нее перетащили почти все сервисы, из-за замудреной конфигурации на старом ящике оталась только почта для дальнейшего переноса в спокойной вдумчивой обстановке. Самое удивительное, что "дедушка" стал реже перегружаться, а новый сервер стал падать с периодичностью, примерно, как раньше "дедушка". В последнее время ребуты участились. Эксперимент показал, что попытки залить на шару большой файл практически гарантированно приводит к ребуту или, иногда, вмертвую вешает сервер - не работает даже консоль. Проверялось на исталляторе OpenOffice.org 3.2 win - чуть больше 150 метров. В то же самое время, по ssh эти файлы залились без всяких тараканов. С шары сливаются тоже без проблем. Самбу пересобирал - сейчас стоит 3.0.37. /usr/local/etc/smb.conf: [global] workgroup = INTRANS netbios name = xxxxxxxx security = user hosts allow = 192.168.0. 127. load printers = no guest account = nobody log file = /var/log/samba/log.%m max log size = 500 socket options = TCP_NODELAY SO_KEEPALIVE SO_BROADCAST SO_RCVBUF=4096 SO_SNDBUF=4096 interfaces = rl0 local master = yes os level = 60 preferred master = yes dns proxy = no display charset = koi8-u unix charset = koi8-u dos charset = UTF-8 max open files = 25000 [common] comment = Обменник path = /var/samba/common read only = No create mask = 0770 directory mask = 0770 browseable = yes writable = yes guest ok = yes Если ставить security = user - частота падений увеличивается. В log.smbd периодически падает такое: [2010/02/17 09:48:02, 0] lib/util_sock.c:set_socket_options(261) Failed to set socket option TCP_NODELAY (Error Connection reset by peer) [2010/02/17 09:48:02, 0] lib/util_sock.c:get_peer_addr(1224) getpeername failed. Error was Socket is not connected [2010/02/17 11:35:57, 0] smbd/server.c:open_sockets_smbd(531) open_sockets_smbd: accept: Software caused connection abort в log.nmbd - в основном отчеты о том, что самба занимается выборной деятельностью, хотя случается и такое: [2010/02/15 15:08:37, 0] libsmb/nmblib.c:send_udp(793) Packet send failed to 192.168.0.14(137) ERRNO=No buffer space available [2010/02/15 15:08:37, 0] nmbd/nmbd_packets.c:reply_netbios_packet(992) reply_netbios_packet: send_packet to IP 192.168.0.14 port 137 failed [2010/02/15 15:08:37, 0] libsmb/nmblib.c:send_udp(793) Packet send failed to 192.168.0.14(137) ERRNO=No buffer space available [2010/02/15 15:08:37, 0] nmbd/nmbd_packets.c:reply_netbios_packet(992) reply_netbios_packet: send_packet to IP 192.168.0.14 port 137 failed [2010/02/15 15:08:37, 0] libsmb/nmblib.c:send_udp(793) Packet send failed to 192.168.0.21(137) ERRNO=No buffer space available [2010/02/15 15:08:37, 0] nmbd/nmbd_packets.c:reply_netbios_packet(992) reply_netbios_packet: send_packet to IP 192.168.0.21 port 137 failed [2010/02/15 15:12:05, 0] nmbd/nmbd.c:main(723) в /var/log/messages полно записей такого плана: Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: getpeername failed. Error was Socket is not connected Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: [2010/02/18 10:19:43, 0] lib/access.c:check_access(327) Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: [2010/02/18 10:19:43, 0] lib/util_sock.c:get_peer_addr(1224) Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: getpeername failed. Error was Socket is not connected Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: Denied connection from (0.0.0.0) Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: [2010/02/18 10:19:43, 0] lib/util_sock.c:get_peer_addr(1224) Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: getpeername failed. Error was Socket is not connected Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: Connection denied from 0.0.0.0 Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: [2010/02/18 10:19:43, 0] lib/util_sock.c:write_data(562) Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: write_data: write failure in writing to client 0.0.0.0. Error Broken pipe Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: [2010/02/18 10:19:43, 0] lib/util_sock.c:send_smb(761) Feb 18 10:19:43 xxxxxxxx_new smbd[5669]: Error writing 5 bytes to client. -1. (Broken pipe)Машин с адресом 0.0.0.0 в сети нет, tcpdump трафика с такими адресами не показывает. Есть у мну подозрение, что завелся какой-то новый зверь из вирусни, но ни drweb, ни касперский ничего не находят... В другом филиале стоит похожая конфигурация с аптаймом до двух-трех месяцев, если свет не отрубают... Если у кого-нибудь есть мысли по данной ситуации - буду очень признателен за помощь.
|