zmej.org.ua - Памятки системного администратора.  zmej.org.ua - Памятки системного администратора.

Главная » FreeBSD

Вход на сайт

  • Запросить новый пароль

Навигация

  • Cisco
    • Cisco access-list
    • Аутентификация на Cisco
    • Обновление Cisco IOS
    • Привязка MAC-адресов к портам на Cisco Catalyst 2960
    • Списки доступа (Access list) ACL Cisco
  • FreeBSD
    • Colorize - подсвечивание ключевых слов
    • Munin — мониторинг сервера на основе FreeBSD
    • Postfix + Postgrey. Небольшой пример того, как можно бороться со спамом.
    • Roudcube. Установка и настройка.
    • VPN между FreeBSD и Windows. Установка mpd4.
    • Блокируем TeamViewer
    • Выполнение mount из-под прав обычного пользователя
    • Добавление базы и пользователя в MySQL
    • Как узнать серийный номер винчестера в FreeBSD
    • Модули Apache22 (Apache22 modules)
    • Мониторинг винтчестеров (HDD/жестких дисков) с помощью SMART (smartmontools)
    • Мониторинг загрузки канала (MRTG)
    • Мониторинг загрузки сетевых интерфейсов в реальном времени
    • Мониторинг нагрузки процессора (SNMP MRTG CPU Monitoring)
    • Настройка DNS сервера named
    • Настройка сервера времени NTP
    • Настройка фаервола (firewall ipfw) на ОС FreeBSD
    • Обновление FreeBSD. Краткий мануал.
    • Обновление портов (CVSup)
    • Обновление портов. Portupgrade.
    • Организация VPN между 3-мя офисами
    • Повышаем безопасность FreeBSD
    • Проблема после обновление SpamAssassin
    • Работа с .htaccess и .htpasswd
    • Скрипты
      • Блокировка перебора SSH (по 22му порту)
      • Создание архива базы - mysqldump
    • Тестирование MySQL
    • Управление дуплексным режимом и скоростью подключения к порту.
    • Установка MySQL сервера
    • Установка связки Apache22+php5+mysql5
    • Шейпер на ipfw
  • Подсказки по редактированию

Мониторинг винтчестеров (HDD/жестких дисков) с помощью SMART (smartmontools)

Zmej —чт, 05/01/2012 - 11:34

S.M.A.R.T. (англ. Self-Monitoring, Analysis and Reporting Technology) — технология оценки состояния жёсткого диска встроенной аппаратурой самодиагностики, а также механизм предсказания времени выхода его из строя.

Я думаю нет ни одного администратора в мире, который бы не хотел знать, что происходит с его дисками. Попробую расказать, как это можно сделать.
11:49 user@ns [/etc]#cd /usr/ports/sysutils/smartmontools
11:49 user@ns [/usr/ports/sysutils/smartmontools]#make install clean
Переходим в порты, и устанавливаем програмное обеспечение
.....
To check the status of drives, use the following:
        /usr/local/sbin/smartctl -a /dev/ad0            for first ATA drive
        /usr/local/sbin/smartctl -a /dev/da0            for first SCSI drive
To include drive health information in your daily status reports,
add a line like the following to /etc/periodic.conf:
        daily_status_smart_devices="/dev/ad0 /dev/da0"
substituting the appropriate device names for your SMART-capable disks.
To enable drive monitoring, you can use /usr/local/sbin/smartd.
A sample configuration file has been installed as
/usr/local/etc/smartd.conf.sample
Copy this file to /usr/local/etc/smartd.conf and edit appropriately
To have smartd start at boot
        echo 'smartd_enable="YES"' >> /etc/rc.conf
===> Installing rc.d startup script(s)
===>   Compressing manual pages for smartmontools-5.39.1
===>   Registering installation for smartmontools-5.39.1
===>  Cleaning for smartmontools-5.39.1
11:52 user@ns [/usr/ports/sysutils/smartmontools]#
После окончания установки, Вы увидите приблизительно такое. Сделаем теперь так, как нас просят.
11:53 user@ns [/usr/ports/sysutils/smartmontools]#/usr/local/sbin/smartctl -a /dev/ad6
smartctl 5.39.1 2010-01-28 r3054 [FreeBSD 7.3-RELEASE i386] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net
 
=== START OF INFORMATION SECTION ===
Model Family:     Western Digital Caviar Green family
Device Model:     WDC WD10EADS-00L5B1
Serial Number:    WD-WCAU4D985822
Firmware Version: 01.01A01
User Capacity:    1,000,204,886,016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Sat Jun 26 11:53:38 2010 EEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
 
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
 
General SMART Values:
Offline data collection status:  (0x84) Offline data collection activity
                                        was suspended by an interrupting command from host.
                                        Auto Offline Data Collection: Enabled.
Self-test execution status:      (   0) The previous self-test routine completed
                                        without error or no self-test has ever
                                        been run.
Total time to complete Offline
data collection:                 (22800) seconds.
Offline data collection
capabilities:                    (0x7b) SMART execute Offline immediate.
                                        Auto Offline data collection on/off support.
                                        Suspend Offline collection upon new
                                        command.
                                        Offline surface scan supported.
                                        Self-test supported.
                                        Conveyance Self-test supported.
                                        Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                                        power-saving mode.
                                        Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                                        General Purpose Logging supported.
Short self-test routine
recommended polling time:        (   2) minutes.
Extended self-test routine
recommended polling time:        ( 255) minutes.
Conveyance self-test routine
recommended polling time:        (   5) minutes.
SCT capabilities:              (0x303f) SCT Status supported.
                                        SCT Feature Control supported.
                                        SCT Data Table supported.
 
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   163   163   021    Pre-fail  Always       -       6808
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       11
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       1696
 10 Spin_Retry_Count        0x0032   100   253   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   253   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       9
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       6
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       11
194 Temperature_Celsius     0x0022   130   107   000    Old_age   Always       -       20
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0030   100   253   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0
 
SMART Error Log Version: 1
No Errors Logged
 
SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      1682         -
# 2  Short offline       Completed without error       00%      1658         -
# 3  Short offline       Completed without error       00%      1634         -
# 4  Short offline       Completed without error       00%      1610         -
# 5  Short offline       Completed without error       00%      1586         -
# 6  Short offline       Completed without error       00%      1562         -
# 7  Extended offline    Completed without error       00%      1543         -
# 8  Short offline       Completed without error       00%      1538         -
# 9  Short offline       Completed without error       00%      1514         -
#10  Short offline       Completed without error       00%      1490         -
#11  Short offline       Completed without error       00%      1466         -
#12  Short offline       Completed without error       00%      1442         -
#13  Short offline       Completed without error       00%      1418         -
#14  Short offline       Completed without error       00%      1394         -
#15  Extended offline    Completed without error       00%      1375         -
#16  Short offline       Completed without error       00%      1370         -
#17  Short offline       Completed without error       00%      1346         -
#18  Short offline       Completed without error       00%      1322         -
#19  Short offline       Completed without error       00%      1299         -
#20  Short offline       Completed without error       00%      1275         -
#21  Short offline       Completed without error       00%      1251         -
 
SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 
11:53 user@ns [/usr/ports/sysutils/smartmontools]#
11:53 user@ns [/usr/ports/sysutils/smartmontools]#/usr/local/sbin/smartctl -a /dev/da0
smartctl 5.39.1 2010-01-28 r3054 [FreeBSD 7.3-RELEASE i386] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net
 
Device: Areca    ARC-1120-VOL#00  Version: R001
Serial number: 0000000031434338
Device type: disk
Transport protocol: Fibre channel (FCP-2)
Local Time is: Sat Jun 26 11:55:11 2010 EEST
Device supports SMART and is Enabled
Temperature Warning Disabled or Not Supported
SMART Health Status: OK
 
Current Drive Temperature:     30 C
Drive Trip Temperature:        25 C
Manufactured in week 30 of year 2002
Specified cycle count over device lifetime:  4278190080
Accumulated start-stop cycles:  256
Elements in grown defect list: 0
 
Error counter log:
           Errors Corrected by           Total   Correction     Gigabytes    Total
               ECC          rereads/    errors   algorithm      processed    uncorrected
           fast | delayed   rewrites  corrected  invocations   [10^9 bytes]  errors
read:          0        0         0         0          0          0.000           0
write:         0        0         0         0          0          0.000           0
 
Non-medium error count:        0
Device does not support Self Test logging
11:55 user@ns [/usr/ports/sysutils/smartmontools]#
У Вас может отличатся по количеству винтов, либо еще по каким то параметрам. Идем дальше.
11:55 user@ns [/usr/ports/sysutils/smartmontools]#cp /usr/local/etc/smartd.conf.sample /usr/local/etc/smartd.conf
Создаем конфигурационный файл smartd.conf
11:56 user@ns [/usr/ports/sysutils/smartmontools]#cat /usr/local/etc/smartd.conf
# Домашняя страница: _http://smartmontools.sourceforge.net
 
# $Id: smartd.conf,v 1.45 2006/11/12 23:39:04 dpgilbert Exp $
 
# smartd будет перечитывать конфигурационный файл, если он получает сигнал HUP
# signal
 
# Файл предоставляет список устройств для мониторинга используемого smartd,
# с одним устройством в каждой строке. Текст после решетки (#) игнорируется,
# и вы можете использовать пробелы и табуляцию для свободного пространства.
# Вы можете использовать '\' для продолжения линии. 
 
# Вы можете определить, какие обычно жесткие дискови есть на компьютере,
# Заглянув в /proc/ide и /proc/scsi. (повеяло линусячиной =) )
 
# Переменная DEVICESCAN заставит игнорировать оставшиеся линий в этом
# конфигурационном файле: и укажет для smartd сканировать все
# ATA и SCSI устройств. DEVICESCAN может следовать любое из
# Для найденных устройств будут применены нижеперечисленные директивы.
# Для большинства пользователей рекомендуется закомментировать DEVICESCAN
# и четко вывести список устройств, которые вы хотели бы контролировать. 
#DEVICESCAN
 
# Альтернативные настройки для игнорирования температуры и включения числа
# часов, проведённых во включенном состоянии записываемых отчетов в syslog. 
#DEVICESCAN -I 194 -I 231 -I 9
 
# Альтернативные настройки отчетов с более полезным значений температуры 
# записываемого в syslog
#DEVICESCAN -R 194 -R 231 -I 9
 
# Альтернативные настройки для отчетов значения изменения
# температуры >= 5 по Цельсию и мин/макс температуры. 
#DEVICESCAN -I 194 -I 231 -I 9 -W 5
 
# Первый (primary) ATA/IDE жесткий диск. Следить за всеми атрибутами, позволяющие
# автоматически онлайново собирать данные, автоматическое автосохранение
# атрибутов, и запуском короткой самодиагностики каждый день с 2-3 утра
# , и полный тест в субботам с 3-4 утра. 
#/dev/hda -a -o on -S on -s (S/../.././02|L/../../6/03)
 
# Мониторинг SMART статуса, ATA журнала ошибок, Self-Test
# (короткой самодиагностики) журнала, а также отслеживать
# изменения всех атрибутов, за исключением атрибута 194 
#/dev/hdb -H -l error -l selftest -t -I 194
 
# Мониторинг всех атрибутов, кроме нормированной температуры (обычно 194),
# но отслеживать изменения температуры >= 4 по Цельсию, отчет температуры
# >= 45 по Цельсию, а изменения в Raw значения Reallocated_Sector_Ct (5).
# И отправлять письмо об отказах SMART или при температуре >= 55 по Цельсию. 
#/dev/hdc -a -I 194 -W 4,45,55 -R 5 -m admin@example.com
 
# Диск ATA может выглядеть как устройства SCSI в операционной системе.
# Если к SCSI ATA перевода (SAT) слой между ОС и устройство, а затем
# Это может быть помечено "-d sat 'опцией. Эта ситуация может
# стать общей с дисками SATA в SAS и FC среды. 
# /dev/sda -a -d sat
 
# Тихий тест. Рапортует лишь в случае, если SMART выдает
# ошибку. И шлёт рапорт на почту.
#/dev/hdc -H -C 0 -U 0 -m admin@example.com
 
# Первых два SCSI диска. Это будет следить за всем, что может smartd
# проверить. Начать расширенный тест по средам с 6-7 вечера и
# воскресенье 1-2.
#/dev/sda -d scsi -s L/../../3/18
#/dev/sdb -d scsi -s L/../../7/01
 
# Мониторинг 4х ATA дисков, подключенных к контроллеру 3Ware 6/7/8000 которая
# использует 3W-XXXX драйвер. Начало длинного теста по воскресеньям с 1-2,
#  2-3, 3-4 и 4-5 часов утра.
#/dev/sdc -d 3ware,0 -a -s L/../../7/01
#/dev/sdc -d 3ware,1 -a -s L/../../7/02
#/dev/sdc -d 3ware,2 -a -s L/../../7/03
#/dev/sdc -d 3ware,3 -a -s L/../../7/04
 
# Мониторинг 4х ATA дисков, подключенных к контроллеру 3Ware 9000, который
# использует 3W-9xxx драйвера (Linux, FreeBSD)
# Начало длинного теста по вторникам с 1-2 и 3-4 утра. 
#/dev/twa0 -d 3ware,0 -a -s L/../../2/01
#/dev/twa0 -d 3ware,1 -a -s L/../../2/03
 
# То же самое для Windows. Опция "-d 3ware,N 'не является необходимым,
# Диск (порт) номер, указанный в имени устройства.
# ПРИМЕЧАНИЕ: В Windows DEVICESCAN работает также для контроллеров 3Ware. 
#/dev/hdc,0 -a -s L/../../2/01
#/dev/hdc,1 -a -s L/../../2/03
 
# Мониторинг 3 ATA диски напрямую связано с HighPoint RocketRAID.
# Начало долгого теста по воскресеньям с 1-2, 2-3 и 3-4 утра. 
#/dev/sdd -d hpt,1/1 -a -s L/../../7/01
#/dev/sdd -d hpt,1/2 -a -s L/../../7/02
#/dev/sdd -d hpt,1/3 -a -s L/../../7/03
 
# Мониторинг 2х ATA дисках, подключенных к той же PMPort которые связаны с
# HighPoint RocketRAID. Начало большого теста по вторникам между 1-2 и 3-4 м. 
#/dev/sdd -d hpt,1/4/1 -a -s L/../../2/01
#/dev/sdd -d hpt,1/4/2 -a -s L/../../2/03
 
# Добавляем свои диски
/dev/da0 -a -I 194 -W 4,45,55 -R 5 -m zmej@zmej.org.ua -o on -S on -s (S/../.././22|L/../../6/23)
/dev/ad6 -a -I 194 -W 4,45,55 -R 5 -m zmej@zmej.org.ua -o on -S on -s (S/../.././22|L/../../6/23)
 
# Вот список директив в этом файле конфигурации.
# См. smartd.conf и man для деталей 
#
#   -d TYPE Тип устройства: ata, scsi, marvell, removable, 3ware,N, hpt,L/M/N
#   -T TYPE допустимое отклонение: normal, permissive
#   -o VAL  Включает/выключает автоматические оффлайн тесты (on/off)
#   -S VAL  Включает/выключает автосохранение атрибутов (on/off)
#   -n MODE Не проверять. Один из режимов: never, sleep, standby, idle
#   -H      Мониторить SMART статус, уведомлять только при ошибках.
#   -l TYPE Мониторить SMART логи. Режимы: error, selftest
#   -f      Монитор отказа для любых атрибутов 'Usage'
#   -m ADD  Письмо с варнингами на ADD для -H, -l error, -l selftest, and -f
#   -M TYPE Изменение поведения отсыла е-майлов (см. ман)
#   -s REGE Запустить тест когда дата совпадает с регулярным выражением (см. ман)
#   -p      Сообщать о изменениях в 'Prefailure' атрибутах
#   -u      ообщать о изменениях в 'Usage' атрибутах
#   -t      Эквивалентно -p и -u директивам
#   -r ID   Также сообщать 'RAW' значения атрибутов ID с -p, -u или -t
#   -R ID   Следить за изменениями в атрибуте ID 'Raw' значения -p, -u or -t
#   -i ID   Игнорировать атрибут ID для -f директивы
#   -I ID   Игнорировать атрибут ID для -p, -u или -t директивы
#   -C ID   Рапортовать если счётчик `ждущих` секторов не равен нулю
#   -U ID   Рапортовать если счётчик `некорректируемых` секторов не равен нулю
#   -W D,I,C Monitor Temperature D)ifference, I)nformal limit, C)ritical limit
#   -v N,ST Mодифицировать метку для атрибута N (для нестандартных атрибутов)
#   -a      Дефолт: эквивалентно -H -f -t -l error -l selftest -C 197 -U 198
#   -F TYPE Для ошибок в прошивке. Значения: none, samsung
#   -P TYPE Предустановки для диска: use, ignore, show, showall
#    #      Комментарии: текст после него игнорируется
#    \      Продолжения строки
# Идентификатор атрибута является десятичное целое число 1 <= ID <= 255
# за исключением -C и -U, где ID = 0 выключает их.
# Все биты -d, -m и -M директивы реализуются только для устройств ATA.
Идем дальше. Добавляем в автозагрузку.
12:05 user@ns [/usr/ports/sysutils/smartmontools]#cat /etc/rc.conf | grep smart
smartd_enable="YES"
smartd_flags="-l local2 --interval=300"
Указываем, чтоб велось логирование
12:05 user@ns [/usr/ports/sysutils/smartmontools]#cat /etc/syslog.conf | grep smart
!smartd
*.*                                             /var/log/smartd.log
Создаем файл, в котором будут хранится логи
12:07 user@ns [/usr/ports/sysutils/smartmontools]#touch /var/log/smartd.log
Добавляем данные в /etc/periodic.conf согласно требованиям
12:51 user@ns [/usr/local/etc]#cat /etc/periodic.conf | grep smart
daily_status_smart_devices="/dev/ad6 /dev/da0"
Стартуем демон и проверяем, все ли запустилось
12:08 user@ns [/usr/ports/sysutils/smartmontools]#/usr/local/etc/rc.d/smartd start
Starting smartd.
12:08 user@ns [/usr/ports/sysutils/smartmontools]#ps aux | grep smart
root     33948  0.0  0.2  4360  2020  ??  S    12:08PM   0:00.01 /usr/local/sbin/smartd -p /var/run/smartd.pid -l local2 --interval=300
А так же, смотрим логи
12:37 user@ns [/usr/local/etc]#tail -f /var/log/smartd.log
Jun 26 12:37:29 ns smartd[34549]: Device: /dev/ad6, found in smartd database.
Jun 26 12:37:29 ns smartd[34549]: Device: /dev/ad6, is SMART capable. Adding to "monitor" list.
Jun 26 12:37:29 ns smartd[34549]: Device: /dev/da0, opened
Jun 26 12:37:29 ns smartd[34549]: Device: /dev/da0, does not support SMART Self-Test Log.
Jun 26 12:37:29 ns smartd[34549]: Device: /dev/da0, is SMART capable. Adding to "monitor" list.
Jun 26 12:37:29 ns smartd[34549]: Device: /dev/pass1, opened
Jun 26 12:37:29 ns smartd[34549]: Device: /dev/pass1, Bad IEC (SMART) mode page, err=5, skip device
Jun 26 12:37:29 ns smartd[34549]: Monitoring 1 ATA and 1 SCSI devices
Jun 26 12:37:29 ns smartd[34551]: smartd has fork()ed into background mode. New PID=34551.
Jun 26 12:37:29 ns smartd[34551]: file /var/run/smartd.pid written containing PID 34551
Jun 26 12:42:30 ns smartd[34551]: Device: /dev/ad6, SMART Usage Attribute: 194 Temperature_Celsius changed from 129 to 130
Jun 26 12:47:29 ns smartd[34551]: Device: /dev/ad6, SMART Usage Attribute: 194 Temperature_Celsius changed from 130 to 129
Вот и все. В случае чего, Вы получите уведомление по почте.
  • FreeBSD
  • Войдите чтобы оставить комментарии

Новые пользователи

  • Zmej

Последние комментарии

Комментарии отсутствуют.

Сейчас на сайте

Пользователей онлайн: 0.

Создано на Drupal

Downloaded from top drupal themes | Hostgator coupon