Как разбирам, когато имам проблем с някой сървър?

Чудите ли се какво може да се направи, когато бизнесът зависи от правилната и непрекъсната работа на сървъра, а вие няма как да бъдете по 24 часа пред компютъра и да следите какво се случва? За такива задачи аз използвам BetterUptime.

Това е една страхотно удобна услуга, която може да следи за работоспособността на сайтове (дали се отварят и дали няма забавяне в зареждането на страниците) и сървъри (дали работят услуги като web, sql или пощенски сървър, дали се изпълняват задачи като архивиране, обновяване, ротация на логовете) и дали системата разполага с достатъчно ресурси (напр. усредненото процесорно натоварване е под Х% или свободното дисково пространство е над еди-колко си GiB).

Ето как изглежда един инцидент от тази сутрин (хронологията се чете отдолу нагоре):

По някаква причина (вероятно рестарт на оборудване в дата центъра), heartbeat задачата, която представлява изпращане на съобщение “Жив съм” към следящия сървър веднъж в минута, пропуска един цикъл. Пет секунди по-късно към две мои мобилни устройства се изпраща push нотификация, а след още една секунда системата инициира прозвъняване към моя телефонен номер.

От хронологията се вижда, че 16 секунди след прозвъняването аз съм вдигнал телефона и съм изслушал съобщението, след което съм потвърдил известяването (това става чрез клавиатурата на телефона). Междувременно инцидентът се беше саморазрешил, и в момента в който затворих телефона, видях и двете push нотификации — за отварянето и затварянето на задачата. Така че спокойно продължих да си пия сутрешното кафе.

Макар че в случая нямаше технически проблем (а и по принцип те са рядкост, моят uptime е над 99.95% или по-малко от 60 минути мъртво време на година…), идеята ми е да покажа, че обичайно са необходими 10-15 секунди, за да бъда информиран, ако има проблеми със сайтовете, които се хостват при мен, независимо в коя част на денонощието. Ако моите клиенти го поискат, мога да настроя монитор и за техните сайтове (независимо дали са хостнати при мен или при някой хостинг доставчик). По този начин може много добре да се контролира качеството на услугата — повечето от вас ще бъдат учудени да научат колко често например споделеният хостинг спира да работи за кратки периоди от време.

АКО НАПИСАНОТО ВИ ДОПАДА…

Абонирайте се за моя блог!

Ще получавате съобщение, когато публикувам нова статия. Можете да се отпишете по всяко време.

Similar Posts