Не буду рассказывать, какими судьбами, но пришлось взяться за FreeBSD 5.4, на которой крутятся два портала с общей посещаемостью порядка 3-5 тысяч хостов в сутки. Железо: мамка на i865G (конкретнее пока не скажу), Pentium-4 2,8 (HT), 1Gb RAM, 80 Gb HDD. сетевушка Marvell Yukon, но к ней претензий не имею.
Софт: FreeBSD 5.4, apache 1.3.37, mysql 4.1.22. до кучи стоит postfix, но он себе живет и не мешает.
Теперь проблема: Порталы периодически отваливаются. При обращении - то "нет соединения с БД", то просто висим, ждем с моря погоды.
last pid: 10414; load averages: 55.43, 162.59, 182.873 up 0+04:42:48 15:23:06
153 processes: 34 running, 118 sleeping, 1 zombie
CPU states: 59.1% user, 0.0% nice, 40.9% system, 0.0% interrupt, 0.0% idle
Mem: 278M Active, 152M Inact, 172M Wired, 30M Cache, 110M Buf, 357M Free
Swap: 2048M Total, 8852K Used, 2039M Free
PID USERNAME PRI NICE SIZE RES STATE TIME WCPU CPU COMMAND
10293 mysql 20 0 357M 75124K kserel 1:41 70.77% 70.56% mysqld
10395 www 4 0 21380K 12268K sbwait 0:00 0.17% 0.10% httpd
10407 www 130 0 21176K 12072K RUN 0:00 0.19% 0.10% httpd
10406 www 123 0 19456K 10344K select 0:00 0.19% 0.10% httpd
10404 www 4 0 21380K 12280K sbwait 0:00 0.10% 0.05% httpd
813 root 96 0 3084K 1096K select 0:04 0.00% 0.00% master
тут еще более-менее вразумительно - мускул кушает все, до чего дотянулся.
однако бывает и так:
last pid: 10526; load averages: 70.15, 95.71, 144.30 up 0+04:47:57 15:28:15
260 processes: 96 running, 163 sleeping, 1 zombie
CPU states: 57.0% user, 0.0% nice, 42.6% system, 0.4% interrupt, 0.0% idle
Mem: 467M Active, 159M Inact, 179M Wired, 31M Cache, 110M Buf, 153M Free
Swap: 2048M Total, 8852K Used, 2039M Free
PID USERNAME PRI NICE SIZE RES STATE TIME WCPU CPU COMMAND
10293 mysql 20 0 410M 98748K kserel 6:31 28.17% 28.17% mysqld
10102 root 4 0 4252K 2088K select 0:01 0.39% 0.39% virtual
10502 www 112 0 21640K 12452K RUN 0:00 0.26% 0.20% httpd
10392 www 4 0 21664K 12452K sbwait 0:00 0.10% 0.10% httpd
10495 www 131 0 21268K 12184K RUN 0:00 0.06% 0.05% httpd
10512 www 4 0 19544K 10408K accept 0:00 0.08% 0.05% httpd
813 root 96 0 3084K 1096K select 0:04 0.00% 0.00% master
тут уж вообще не понимаю... проц скушан весь, а кем - неизвестно.
в логах http стабильно присутствует "httpd: exited with signal 11", правда время там не указано :( чаще всего кпоминается про "аппаратные ошибки", но вот уж никак на это не похоже. трапается только apache и только под нагрузкой.
Включал отслеживание "медленных запросов" в mysql, но там детский сад... простенький запрос из таблички в 10 записей выполняется по две секунды и то, что туда постится, не должно ТАК грузить систему.
Ну и наконец вопрос: что мне еще поглядеть, чтоб хоть понять, что происходит?