Как разбирам, когато имам проблем с някой сървър?

Инструменти
Uptime stats bvionline.eu

Чудите ли се какво може да се направи, когато бизнесът зависи от правилната и непрекъсната работа на сървъра, а вие няма как да бъдете по 24 часа пред компютъра и да следите какво се случва? За такива задачи аз използвам BetterUptime.

Това е една страхотно удобна услуга, която може да следи за работоспособността на сайтове (дали се отварят и дали няма забавяне в зареждането на страниците) и сървъри (дали работят услуги като web, sql или пощенски сървър, дали се изпълняват задачи като архивиране, обновяване, ротация на логовете) и дали системата разполага с достатъчно ресурси (напр. усредненото процесорно натоварване е под Х% или свободното дисково пространство е над еди-колко си GiB).

Ето как изглежда един инцидент от тази сутрин (хронологията се чете отдолу нагоре):

По някаква причина (вероятно рестарт на оборудване в дата центъра), heartbeat задачата, която представлява изпращане на съобщение “Жив съм” към следящия сървър веднъж в минута, пропуска един цикъл. Пет секунди по-късно към две мои мобилни устройства се изпраща push нотификация, а след още една секунда системата инициира прозвъняване към моя телефонен номер.

От хронологията се вижда, че 16 секунди след прозвъняването аз съм вдигнал телефона и съм изслушал съобщението, след което съм потвърдил известяването (това става чрез клавиатурата на телефона). Междувременно инцидентът се беше саморазрешил, и в момента в който затворих телефона, видях и двете push нотификации — за отварянето и затварянето на задачата. Така че спокойно продължих да си пия сутрешното кафе.

Макар че в случая нямаше технически проблем (а и по принцип те са рядкост, моят uptime е над 99.95% или по-малко от 60 минути мъртво време на година…), идеята ми е да покажа, че обичайно са необходими 10-15 секунди, за да бъда информиран, ако има проблеми със сайтовете, които се хостват при мен, независимо в коя част на денонощието. Ако моите клиенти го поискат, мога да настроя монитор и за техните сайтове (независимо дали са хостнати при мен или при някой хостинг доставчик). По този начин може много добре да се контролира качеството на услугата — повечето от вас ще бъдат учудени да научат колко често например споделеният хостинг спира да работи за кратки периоди от време.

Вашият коментар