RuWeb.net Forum

Проблемы доступности
foray - 3.2.2012 в 12:41

Вот,очередной раз проблемы доступности всех сайтов...Почему в последнее время это часто происходит?Статистика в liveinternet аж в зазубринах вся из-за провалов в доступности!11 января,18 января...Сейчас вот сидел,занимался сайтом,и вдруг он перестал быть доступным....Проверил по 2ip.ru - Сайт недоступен....А вы хвалитесь 99,5% аптайм....Что-то уж слабо в это верится,в эти проценты....

Собсно,вопрос:чего вас колбасит-то?Надолго это?Или теперь всегда так будет?...А то я у вас сайтов клиентам понаставил,и теперь приходится краснеть...Нехорошо с вашей стороны,нехорошо...

Особенно неприятно,что сайты мои недоступны,а ваш сайт в полном порядке....Что это за отношение такое,господа?

[Отредактировано 3.2.2012 кто foray]

[Отредактировано 3.2.2012 кто foray]


kpv - 3.2.2012 в 14:34

99.5% - это 3,5 часа в месяц (обычно на регламентные работы)
Калькулятор здесь
http://www.folgmann.com/en/webapps/ha.html

запрос в тикет написали?
Если да, то приведите здесь ссылку.


kpv - 3.2.2012 в 14:40

Цитата:
что сайты мои недоступны,а ваш сайт в полном порядке..


Такое возможно, так как это разные сервера. А проверять доступность лучше проверять с разных точек, например таким сервисом http://host-tracker.com/


foray - 3.2.2012 в 15:21

Зачем запрос в техподдержку?Чем поможет техподдержка,если сайт недоступен? http://host-tracker.com/
тоже проверял.Несколько сайтов были недоступны сегодня около 20 минут.Проверял разными методами.В том числе,пришло сообщение и с Яндекс.Метрики:


Цитата:

Здравствуйте! Согласно данным мониторинга, обнаружены проблемы с доступностью сайта: http://www.rezvo.com (03 февраля в 13:35). Рекомендуем проверить работоспособность сайта.



Цитата:

Здравствуйте! Согласно данным мониторинга, начал работать в нормальном режиме сайт: http://www.rezvo.com (03 февраля в 14:05). Настроить уведомления о результатах мониторинга Вы можете на странице "Мои счётчики" http://metrika.yandex.ru/list?).


В принципе,ничего страшного.Просто раньше не было так часто.Поэтому и беспокоюсь.


kpv - 3.2.2012 в 15:36

Смысл запроса в том, что дежурный ответит причину недоступности сервиса.

И заодно скажет, что 20 минут - это не время недоступности, а интервал проверки Метрики. Если бы метрика проверяла Ваш сайт ежеминутно, ты Вы бы увидели, что перерыв в предоставлении услуг был пять минут - упал апач с ошибкой и дежурный в течении пяти минут ситуацию исправил. И всё это я увидел в логах Вашего сайта.

Пять минут простоя сервиса в месяц - это 99.9998% аптайма
можете, подсчитать на калькуляторе по вышеприведённой ссылке.


95.108.129.207 - - [03/Feb/2012:12:29:58 +0400] "GET / HTTP/1.0" 200 32412 "-" "Mozilla/5.0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots)"
95.108.129.207 - - [03/Feb/2012:13:02:41 +0400] "GET / HTTP/1.0" 200 32412 "-" "Mozilla/5.0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots)"
95.108.129.207 - - [03/Feb/2012:14:05:28 +0400] "GET / HTTP/1.0" 200 32412 "-" "Mozilla/5.0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots)"
95.108.129.207 - - [03/Feb/2012:14:13:52 +0400] "GET / HTTP/1.0" 200 32412 "-" "Mozilla/5.0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots)"
95.108.129.207 - - [03/Feb/2012:14:34:07 +0400] "GET / HTTP/1.0" 200 32412 "-" "Mozilla/5.0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots)"


foray - 3.2.2012 в 17:07

Ясно.Будем надеяться на лучшее.


foray - 27.2.2012 в 23:40

Вот,опять последние пол-часа не могу на сайт попасть...И как назло,постоянно это происходит тогда,когда я его администрирую...Или уже такое частое это явление,что не так-то и сложно попасть на сайт в то время,когда он недоступен?

Отчёты трекеров уж не буду прилагать...Или у Вас всё в порядке?

p.s. Уж второй час пошёл...И саппорт молчит,как партизаны...Что,плохи дела?...Новых юзеров к Вам подключать можно,или не стоит пока?...Итак перегружены?...

[Отредактировано 27.2.2012 кто foray]

[Отредактировано 27.2.2012 кто foray]


Anonymous - 28.2.2012 в 00:25

Подтверждаю. Явные проблемы с аптаймом шареда уже дней семь. Новый тикет создал полтора часа назад, пока ответа нет. Расскажите хоть, в чем дело.


foray - 28.2.2012 в 00:37

Так и не дождался ответа саппорта...Ну,что ж,значит,вопрос сурьёзный-на такие вопросы втечение суток саппорт ответы ищет...Юзера попросил подождать до утра...Если будет всё плохо-что ж,не рувебом единым...:(


kpv - 28.2.2012 в 08:10

Вижу что техподдержка Вам ответила через 48 минут после решения вопроса.


foray - 28.2.2012 в 09:52

Цитата:

Сейчас должно работать. Приносим извинения за доставленные неудобства.


Лаконично...Мы не имеем права знать,что это было с Вашим сервисом втечении 2-х часов?

Необъяснение причины вызывает плохие подозрения...


kpv - 28.2.2012 в 11:36

У нас больше сотни серверов, если дежурный будет каждому подробно расписывать что именно случилось на сервере, тогда время ожидания на Ваши вопросы и решения задач многократно возрастут. Дежурный администратор исправил ситуацию на сервере и решает дальше заявки клиентов. Вам придётся выбрать что-то одно - или быстрое решение проблем или быстрый ответ в тикетовку.


foray - 28.2.2012 в 16:03

Мне очень не нравится только одно-что падения Ваших серверов стали для меня заметны и существенны.Раньше такого не было....Сужу по последним шести годам,что я с Вами...

[Отредактировано 28.2.2012 кто foray]


kpv - 28.2.2012 в 17:15

В тикетовке от Вас последний запрос был 212 days назад. Один запрос в этой теме, когда была перезагрузка апача в течении пяти минут (а не двадцать) мы разобрали. Где остальные запросы в тикетовку по так называемым "падениям"?
Сервер работает в штатном режиме, никаких падений не наблюдается.


foray - 28.2.2012 в 19:05

В первом посте было описано несколько проблем...В этом месяце тот-же liveinternet зафиксировал уже три падения...я не пытаюсь сейчас Вам что-то предъявлять-всего лишь хочу обратить Ваше внимание на то,что падения стали наблюдаться чаше,чем раньше...У Вас у самих есть для показа график диаграмма доступности Ваших серверов хотя бы за 2012 год?


kpv - 28.2.2012 в 20:20

Да, наши сервера на мониторинге и в нагиосе можно посмотреть графики всех процессов происходящих на сервере. За последние два месяца было несколько ддосов на сайты клиентов на этом сервере, в течении 15-30 минут атаки отфильтровывал системный администратор.

Цитата:
В этом месяце тот-же liveinternet зафиксировал уже три падения

Если хотите узнать точные причины, то пишите точное время. А так мы ходим вокруг да около проблемы без какой-либо конкретной информации.

Если Вас беспокоят 5 минутные простои сервера, то рекомендуем Вам переехать на кластерный хостинг - там работает несколько серверов одновременно и в случае каких-то неисправностей одного сервера вместо него работает горячий резерв.

На единичных серверах на время проведения регламентных работ и неисправностей он будет недоступен и с этим ничего не поделать.


foray - 29.2.2012 в 09:35

Я специально не мониторил время,когда спйты были недоступны.
Вы уж поймите меня правильно,ведь я уже не один десяток клиентов к Вам привёл,и при падении их сайтов они мне звонят и теребят.Вот я и хочу выяснить-для себя и наших с Вами клиентов-какого характера эти проблемы у Вас.

Если ддос-атаки-это одно,если перегружена аппаратура и нет средств на расширение-это совсем другое.

И в любом случае с Вашей помощью хочу выработать форму ответа своим клиентам,когда они звонят и жалуются,что их сайт недоступен.

Ещё: если наступил форс-мажор,то Ваши спецы обычно быстро выясняют причину,не так ли? Так почему ж оперативно не уведомить об этом своих клиентов!Или хотя б реселлеров!Мне б не парили мозги,я б Вам мозг не выносил...Isn't it?


kpv - 29.2.2012 в 09:52

Здесь http://ruweb.net/?page=info Вы можете посмотреть нагрузку любого shared сервера и состав аппаратного обеспечения - всё в открытом доступе и мы не скрываем никакой информации. Но если Вы не напишите тикет с запросом, то каким образом мы Вам эту информацию передадим?
С каждым сервером за месяц происходит примерно 10 крупных или мелких инциндентов - этот спам никому не интересен из клиентов. Если проблема возникает, то её сразу начинает решать специалист.

Если вместо решения проблемы специалист сядет писать Вам письмо о том, что проблема обнаружена и составлять подробное описание этой проблемы - это только затянет её решение. Зачем Вам это надо?


foray - 29.2.2012 в 10:54

Да не надо мне лично!

Вы можете на странице информации о серверах сделать какую-нибудь отметку,чтобы можно было посмотреть реал-тайм состояние сервера?Типа флажка "Регламент с 2 до 3","DDos-атака","Курите бамбук".Вы ж поймите,у нас и наш пров работает не идеально-вечные проблемы с DNS, иногда бывает пол-интернета недоступно.Вот.например.звонит мне юзер,жалуется,я смотрю у вас на сайте-есть ли проблема.Если нет-то посылаю клиента к прову,если есть-тоже неплохо:сервис знает о проблеме и устраняет её..Реально?

(Только не отсылайте в техподдержку-при форс-мажорах они действительно заняты,а ждать 45 минут (как в предыдущем случае) перед экраном монитора ответа "Теперь всё должно работать" не имею возможности...)

[Отредактировано 29.2.2012 кто foray]


kpv - 29.2.2012 в 11:08

Если у нас даунттайм больше двух часов - рассылаем клиентам информацию по почте. Писать о пяти-десяти-двадцати минутных даунтаймах намного дольше, чем решить данную информацию.
Информер в биллинге и тикетовке запланирован.
Но не всегда сразу же можно написать в чём причина, большая часть времени уходит на выяснение проблемы. Например сервер был 15 минут недоступен. 14 минут из которых администратор потратил на поиск неисправности и одну минуту - на её устранение.
Информер, в итоге, повесим уже к тому времени, когда сайт нормально заработает. Это равноценно запросу в тикет и получении информации по результату решения проблемы.

У нас никто не сидит 45 минут проста смотря в монитор и ожидая, когда проблема решиться самостоятельно. То что проблема есть, Вы можете проверить состояние сайта любым другим сторонним сервисом, например http://host-tracker.com

Если какая-то проблема возникает - то она сразу начинает решаться. Этой информации для Ваших клиентов недостаточно?


foray - 29.2.2012 в 11:57

Цитата:

Информер в биллинге и тикетовке запланирован.


Достаточно будет информера без указания причины.Просто-технические неполадки.Я это пытаюсь Вам объяснить на протяжении нескольких постов.

Понимаете,юзер мне звонит и говорит:"Почему сайт,который ты мне сделал,недоступен?" Я-последняя миля,отвечаю за всё! И мне нужно что-то уверенно и оптимистично ответить! Но не врать!