Вход на сайт
Навигация
- Cisco
- FreeBSD
- Colorize - подсвечивание ключевых слов
- Munin — мониторинг сервера на основе FreeBSD
- Postfix + Postgrey. Небольшой пример того, как можно бороться со спамом.
- Roudcube. Установка и настройка.
- VPN между FreeBSD и Windows. Установка mpd4.
- Блокируем TeamViewer
- Выполнение mount из-под прав обычного пользователя
- Добавление базы и пользователя в MySQL
- Как узнать серийный номер винчестера в FreeBSD
- Модули Apache22 (Apache22 modules)
- Мониторинг винтчестеров (HDD/жестких дисков) с помощью SMART (smartmontools)
- Мониторинг загрузки канала (MRTG)
- Мониторинг загрузки сетевых интерфейсов в реальном времени
- Мониторинг нагрузки процессора (SNMP MRTG CPU Monitoring)
- Настройка DNS сервера named
- Настройка сервера времени NTP
- Настройка фаервола (firewall ipfw) на ОС FreeBSD
- Обновление FreeBSD. Краткий мануал.
- Обновление портов (CVSup)
- Обновление портов. Portupgrade.
- Организация VPN между 3-мя офисами
- Повышаем безопасность FreeBSD
- Проблема после обновление SpamAssassin
- Работа с .htaccess и .htpasswd
- Скрипты
- Тестирование MySQL
- Управление дуплексным режимом и скоростью подключения к порту.
- Установка MySQL сервера
- Установка связки Apache22+php5+mysql5
- Шейпер на ipfw
- Подсказки по редактированию
Мониторинг винтчестеров (HDD/жестких дисков) с помощью SMART (smartmontools)
Zmej чт, 05/01/2012 - 11:34
S.M.A.R.T. (англ. Self-Monitoring, Analysis and Reporting Technology) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.
Я думаю нет ни одного администратора в мире, который бы не хотел знать, что происходит с его дисками. Попробую расказать, как это можно сделать.
11:49 user@ns [/etc]#cd /usr/ports/sysutils/smartmontools11:49 user@ns [/usr/ports/sysutils/smartmontools]#make install clean
Переходим в порты, и устанавливаем програмное обеспечение
.....To check the status of drives, use the following:/usr/local/sbin/smartctl -a /dev/ad0 for first ATA drive/usr/local/sbin/smartctl -a /dev/da0 for first SCSI driveTo include drive health information in your daily status reports,add a line like the following to /etc/periodic.conf:daily_status_smart_devices="/dev/ad0 /dev/da0"substituting the appropriate device names for your SMART-capable disks.To enable drive monitoring, you can use /usr/local/sbin/smartd.A sample configuration file has been installed as/usr/local/etc/smartd.conf.sampleCopy this file to /usr/local/etc/smartd.conf and edit appropriatelyTo have smartd start at bootecho 'smartd_enable="YES"' >> /etc/rc.conf===> Installing rc.d startup script(s)===> Compressing manual pages for smartmontools-5.39.1===> Registering installation for smartmontools-5.39.1===> Cleaning for smartmontools-5.39.111:52 user@ns [/usr/ports/sysutils/smartmontools]#
После окончания установки, Вы увидите приблизительно такое. Сделаем теперь так, как нас просят.
11:53 user@ns [/usr/ports/sysutils/smartmontools]#/usr/local/sbin/smartctl -a /dev/ad6smartctl 5.39.1 2010-01-28 r3054 [FreeBSD 7.3-RELEASE i386] (local build)Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net=== START OF INFORMATION SECTION ===Model Family: Western Digital Caviar Green familyDevice Model: WDC WD10EADS-00L5B1Serial Number: WD-WCAU4D985822Firmware Version: 01.01A01User Capacity: 1,000,204,886,016 bytesDevice is: In smartctl database [for details use: -P show]ATA Version is: 8ATA Standard is: Exact ATA specification draft version not indicatedLocal Time is: Sat Jun 26 11:53:38 2010 EESTSMART support is: Available - device has SMART capability.SMART support is: Enabled=== START OF READ SMART DATA SECTION ===SMART overall-health self-assessment test result: PASSEDGeneral SMART Values:Offline data collection status: (0x84) Offline data collection activitywas suspended by an interrupting command from host.Auto Offline Data Collection: Enabled.Self-test execution status: ( 0) The previous self-test routine completedwithout error or no self-test has everbeen run.Total time to complete Offlinedata collection: (22800) seconds.Offline data collectioncapabilities: (0x7b) SMART execute Offline immediate.Auto Offline data collection on/off support.Suspend Offline collection upon newcommand.Offline surface scan supported.Self-test supported.Conveyance Self-test supported.Selective Self-test supported.SMART capabilities: (0x0003) Saves SMART data before enteringpower-saving mode.Supports SMART auto save timer.Error logging capability: (0x01) Error logging supported.General Purpose Logging supported.Short self-test routinerecommended polling time: ( 2) minutes.Extended self-test routinerecommended polling time: ( 255) minutes.Conveyance self-test routinerecommended polling time: ( 5) minutes.SCT capabilities: (0x303f) SCT Status supported.SCT Feature Control supported.SCT Data Table supported.SMART Attributes Data Structure revision number: 16Vendor Specific SMART Attributes with Thresholds:ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 03 Spin_Up_Time 0x0027 163 163 021 Pre-fail Always - 68084 Start_Stop_Count 0x0032 100 100 000 Old_age Always - 115 Reallocated_Sector_Ct 0x0033 200 200 140 Pre-fail Always - 07 Seek_Error_Rate 0x002e 100 253 000 Old_age Always - 09 Power_On_Hours 0x0032 098 098 000 Old_age Always - 169610 Spin_Retry_Count 0x0032 100 253 000 Old_age Always - 011 Calibration_Retry_Count 0x0032 100 253 000 Old_age Always - 012 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 9192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Always - 6193 Load_Cycle_Count 0x0032 200 200 000 Old_age Always - 11194 Temperature_Celsius 0x0022 130 107 000 Old_age Always - 20196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Always - 0197 Current_Pending_Sector 0x0032 200 200 000 Old_age Always - 0198 Offline_Uncorrectable 0x0030 100 253 000 Old_age Offline - 0199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Always - 0200 Multi_Zone_Error_Rate 0x0008 200 200 000 Old_age Offline - 0SMART Error Log Version: 1No Errors LoggedSMART Self-test log structure revision number 1Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error# 1 Short offline Completed without error 00% 1682 -# 2 Short offline Completed without error 00% 1658 -# 3 Short offline Completed without error 00% 1634 -# 4 Short offline Completed without error 00% 1610 -# 5 Short offline Completed without error 00% 1586 -# 6 Short offline Completed without error 00% 1562 -# 7 Extended offline Completed without error 00% 1543 -# 8 Short offline Completed without error 00% 1538 -# 9 Short offline Completed without error 00% 1514 -#10 Short offline Completed without error 00% 1490 -#11 Short offline Completed without error 00% 1466 -#12 Short offline Completed without error 00% 1442 -#13 Short offline Completed without error 00% 1418 -#14 Short offline Completed without error 00% 1394 -#15 Extended offline Completed without error 00% 1375 -#16 Short offline Completed without error 00% 1370 -#17 Short offline Completed without error 00% 1346 -#18 Short offline Completed without error 00% 1322 -#19 Short offline Completed without error 00% 1299 -#20 Short offline Completed without error 00% 1275 -#21 Short offline Completed without error 00% 1251 -SMART Selective self-test log data structure revision number 1SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS1 0 0 Not_testing2 0 0 Not_testing3 0 0 Not_testing4 0 0 Not_testing5 0 0 Not_testingSelective self-test flags (0x0):After scanning selected spans, do NOT read-scan remainder of disk.If Selective self-test is pending on power-up, resume after 0 minute delay.11:53 user@ns [/usr/ports/sysutils/smartmontools]#11:53 user@ns [/usr/ports/sysutils/smartmontools]#/usr/local/sbin/smartctl -a /dev/da0smartctl 5.39.1 2010-01-28 r3054 [FreeBSD 7.3-RELEASE i386] (local build)Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.netDevice: Areca ARC-1120-VOL#00 Version: R001Serial number: 0000000031434338Device type: diskTransport protocol: Fibre channel (FCP-2)Local Time is: Sat Jun 26 11:55:11 2010 EESTDevice supports SMART and is EnabledTemperature Warning Disabled or Not SupportedSMART Health Status: OKCurrent Drive Temperature: 30 CDrive Trip Temperature: 25 CManufactured in week 30 of year 2002Specified cycle count over device lifetime: 4278190080Accumulated start-stop cycles: 256Elements in grown defect list: 0Error counter log:Errors Corrected by Total Correction Gigabytes TotalECC rereads/ errors algorithm processed uncorrectedfast | delayed rewrites corrected invocations [10^9 bytes] errorsread: 0 0 0 0 0 0.000 0write: 0 0 0 0 0 0.000 0Non-medium error count: 0Device does not support Self Test logging11:55 user@ns [/usr/ports/sysutils/smartmontools]#
У Вас может отличатся по количеству винтов, либо еще по каким то параметрам. Идем дальше.
11:55 user@ns [/usr/ports/sysutils/smartmontools]#cp /usr/local/etc/smartd.conf.sample /usr/local/etc/smartd.conf
Создаем конфигурационный файл smartd.conf
11:56 user@ns [/usr/ports/sysutils/smartmontools]#cat /usr/local/etc/smartd.conf# Домашняя страница: _http://smartmontools.sourceforge.net# $Id: smartd.conf,v 1.45 2006/11/12 23:39:04 dpgilbert Exp $# smartd будет перечитывать конфигурационный файл, если он получает сигнал HUP# signal# Файл предоставляет список устройств для мониторинга используемого smartd,# с одним устройством в каждой строке. Текст после решетки (#) игнорируется,# и вы можете использовать пробелы и табуляцию для свободного пространства.# Вы можете использовать '\' для продолжения линии.# Вы можете определить, какие обычно жесткие дискови есть на компьютере,# Заглянув в /proc/ide и /proc/scsi. (повеяло линусячиной =) )# Переменная DEVICESCAN заставит игнорировать оставшиеся линий в этом# конфигурационном файле: и укажет для smartd сканировать все# ATA и SCSI устройств. DEVICESCAN может следовать любое из# Для найденных устройств будут применены нижеперечисленные директивы.# Для большинства пользователей рекомендуется закомментировать DEVICESCAN# и четко вывести список устройств, которые вы хотели бы контролировать.#DEVICESCAN# Альтернативные настройки для игнорирования температуры и включения числа# часов, проведённых во включенном состоянии записываемых отчетов в syslog.#DEVICESCAN -I 194 -I 231 -I 9# Альтернативные настройки отчетов с более полезным значений температуры# записываемого в syslog#DEVICESCAN -R 194 -R 231 -I 9# Альтернативные настройки для отчетов значения изменения# температуры >= 5 по Цельсию и мин/макс температуры.#DEVICESCAN -I 194 -I 231 -I 9 -W 5# Первый (primary) ATA/IDE жесткий диск. Следить за всеми атрибутами, позволяющие# автоматически онлайново собирать данные, автоматическое автосохранение# атрибутов, и запуском короткой самодиагностики каждый день с 2-3 утра# , и полный тест в субботам с 3-4 утра.#/dev/hda -a -o on -S on -s (S/../.././02|L/../../6/03)# Мониторинг SMART статуса, ATA журнала ошибок, Self-Test# (короткой самодиагностики) журнала, а также отслеживать# изменения всех атрибутов, за исключением атрибута 194#/dev/hdb -H -l error -l selftest -t -I 194# Мониторинг всех атрибутов, кроме нормированной температуры (обычно 194),# но отслеживать изменения температуры >= 4 по Цельсию, отчет температуры# >= 45 по Цельсию, а изменения в Raw значения Reallocated_Sector_Ct (5).# И отправлять письмо об отказах SMART или при температуре >= 55 по Цельсию.#/dev/hdc -a -I 194 -W 4,45,55 -R 5 -m admin@example.com# Диск ATA может выглядеть как устройства SCSI в операционной системе.# Если к SCSI ATA перевода (SAT) слой между ОС и устройство, а затем# Это может быть помечено "-d sat 'опцией. Эта ситуация может# стать общей с дисками SATA в SAS и FC среды.# /dev/sda -a -d sat# Тихий тест. Рапортует лишь в случае, если SMART выдает# ошибку. И шлёт рапорт на почту.#/dev/hdc -H -C 0 -U 0 -m admin@example.com# Первых два SCSI диска. Это будет следить за всем, что может smartd# проверить. Начать расширенный тест по средам с 6-7 вечера и# воскресенье 1-2.#/dev/sda -d scsi -s L/../../3/18#/dev/sdb -d scsi -s L/../../7/01# Мониторинг 4х ATA дисков, подключенных к контроллеру 3Ware 6/7/8000 которая# использует 3W-XXXX драйвер. Начало длинного теста по воскресеньям с 1-2,# 2-3, 3-4 и 4-5 часов утра.#/dev/sdc -d 3ware,0 -a -s L/../../7/01#/dev/sdc -d 3ware,1 -a -s L/../../7/02#/dev/sdc -d 3ware,2 -a -s L/../../7/03#/dev/sdc -d 3ware,3 -a -s L/../../7/04# Мониторинг 4х ATA дисков, подключенных к контроллеру 3Ware 9000, который# использует 3W-9xxx драйвера (Linux, FreeBSD)# Начало длинного теста по вторникам с 1-2 и 3-4 утра.#/dev/twa0 -d 3ware,0 -a -s L/../../2/01#/dev/twa0 -d 3ware,1 -a -s L/../../2/03# То же самое для Windows. Опция "-d 3ware,N 'не является необходимым,# Диск (порт) номер, указанный в имени устройства.# ПРИМЕЧАНИЕ: В Windows DEVICESCAN работает также для контроллеров 3Ware.#/dev/hdc,0 -a -s L/../../2/01#/dev/hdc,1 -a -s L/../../2/03# Мониторинг 3 ATA диски напрямую связано с HighPoint RocketRAID.# Начало долгого теста по воскресеньям с 1-2, 2-3 и 3-4 утра.#/dev/sdd -d hpt,1/1 -a -s L/../../7/01#/dev/sdd -d hpt,1/2 -a -s L/../../7/02#/dev/sdd -d hpt,1/3 -a -s L/../../7/03# Мониторинг 2х ATA дисках, подключенных к той же PMPort которые связаны с# HighPoint RocketRAID. Начало большого теста по вторникам между 1-2 и 3-4 м.#/dev/sdd -d hpt,1/4/1 -a -s L/../../2/01#/dev/sdd -d hpt,1/4/2 -a -s L/../../2/03# Добавляем свои диски/dev/da0 -a -I 194 -W 4,45,55 -R 5 -m zmej@zmej.org.ua -o on -S on -s (S/../.././22|L/../../6/23)/dev/ad6 -a -I 194 -W 4,45,55 -R 5 -m zmej@zmej.org.ua -o on -S on -s (S/../.././22|L/../../6/23)# Вот список директив в этом файле конфигурации.# См. smartd.conf и man для деталей## -d TYPE Тип устройства: ata, scsi, marvell, removable, 3ware,N, hpt,L/M/N# -T TYPE допустимое отклонение: normal, permissive# -o VAL Включает/выключает автоматические оффлайн тесты (on/off)# -S VAL Включает/выключает автосохранение атрибутов (on/off)# -n MODE Не проверять. Один из режимов: never, sleep, standby, idle# -H Мониторить SMART статус, уведомлять только при ошибках.# -l TYPE Мониторить SMART логи. Режимы: error, selftest# -f Монитор отказа для любых атрибутов 'Usage'# -m ADD Письмо с варнингами на ADD для -H, -l error, -l selftest, and -f# -M TYPE Изменение поведения отсыла е-майлов (см. ман)# -s REGE Запустить тест когда дата совпадает с регулярным выражением (см. ман)# -p Сообщать о изменениях в 'Prefailure' атрибутах# -u ообщать о изменениях в 'Usage' атрибутах# -t Эквивалентно -p и -u директивам# -r ID Также сообщать 'RAW' значения атрибутов ID с -p, -u или -t# -R ID Следить за изменениями в атрибуте ID 'Raw' значения -p, -u or -t# -i ID Игнорировать атрибут ID для -f директивы# -I ID Игнорировать атрибут ID для -p, -u или -t директивы# -C ID Рапортовать если счётчик `ждущих` секторов не равен нулю# -U ID Рапортовать если счётчик `некорректируемых` секторов не равен нулю# -W D,I,C Monitor Temperature D)ifference, I)nformal limit, C)ritical limit# -v N,ST Mодифицировать метку для атрибута N (для нестандартных атрибутов)# -a Дефолт: эквивалентно -H -f -t -l error -l selftest -C 197 -U 198# -F TYPE Для ошибок в прошивке. Значения: none, samsung# -P TYPE Предустановки для диска: use, ignore, show, showall# # Комментарии: текст после него игнорируется# \ Продолжения строки# Идентификатор атрибута является десятичное целое число 1 <= ID <= 255# за исключением -C и -U, где ID = 0 выключает их.# Все биты -d, -m и -M директивы реализуются только для устройств ATA.
Идем дальше. Добавляем в автозагрузку.
12:05 user@ns [/usr/ports/sysutils/smartmontools]#cat /etc/rc.conf | grep smartsmartd_enable="YES"smartd_flags="-l local2 --interval=300"
Указываем, чтоб велось логирование
12:05 user@ns [/usr/ports/sysutils/smartmontools]#cat /etc/syslog.conf | grep smart!smartd*.* /var/log/smartd.log
Создаем файл, в котором будут хранится логи
12:07 user@ns [/usr/ports/sysutils/smartmontools]#touch /var/log/smartd.log
Добавляем данные в /etc/periodic.conf согласно требованиям
12:51 user@ns [/usr/local/etc]#cat /etc/periodic.conf | grep smartdaily_status_smart_devices="/dev/ad6 /dev/da0"
Стартуем демон и проверяем, все ли запустилось
12:08 user@ns [/usr/ports/sysutils/smartmontools]#/usr/local/etc/rc.d/smartd startStarting smartd.12:08 user@ns [/usr/ports/sysutils/smartmontools]#ps aux | grep smartroot 33948 0.0 0.2 4360 2020 ?? S 12:08PM 0:00.01 /usr/local/sbin/smartd -p /var/run/smartd.pid -l local2 --interval=300
А так же, смотрим логи
12:37 user@ns [/usr/local/etc]#tail -f /var/log/smartd.logJun 26 12:37:29 ns smartd[34549]: Device: /dev/ad6, found in smartd database.Jun 26 12:37:29 ns smartd[34549]: Device: /dev/ad6, is SMART capable. Adding to "monitor" list.Jun 26 12:37:29 ns smartd[34549]: Device: /dev/da0, openedJun 26 12:37:29 ns smartd[34549]: Device: /dev/da0, does not support SMART Self-Test Log.Jun 26 12:37:29 ns smartd[34549]: Device: /dev/da0, is SMART capable. Adding to "monitor" list.Jun 26 12:37:29 ns smartd[34549]: Device: /dev/pass1, openedJun 26 12:37:29 ns smartd[34549]: Device: /dev/pass1, Bad IEC (SMART) mode page, err=5, skip deviceJun 26 12:37:29 ns smartd[34549]: Monitoring 1 ATA and 1 SCSI devicesJun 26 12:37:29 ns smartd[34551]: smartd has fork()ed into background mode. New PID=34551.Jun 26 12:37:29 ns smartd[34551]: file /var/run/smartd.pid written containing PID 34551Jun 26 12:42:30 ns smartd[34551]: Device: /dev/ad6, SMART Usage Attribute: 194 Temperature_Celsius changed from 129 to 130Jun 26 12:47:29 ns smartd[34551]: Device: /dev/ad6, SMART Usage Attribute: 194 Temperature_Celsius changed from 130 to 129
Вот и все. В случае чего, Вы получите уведомление по почте.
- Войдите чтобы оставить комментарии
Новые пользователи
- Zmej
Сейчас на сайте
Пользователей онлайн: 0.

Последние комментарии