RuWeb.net Forum

Общее падение UpTime (апрель 2006)
Artyom - 28.4.2006 в 07:45

Добрый день,

Последнее время волнует (и достаточно сильно) вопрос работы хостинга.

Будучи ресселером располагающим сайты на сервере #3 (NAC) испытал нескольно неприятных часов, иногда минут связанных с участившимися падениями сервера, в часности 24-го и 28 апреля.

Сами подумайте:
В начале рабочего дня (для нас) вдруг падают серваки и опять нечего сказать клиенту...

Раньше была мысль перенести на Российские площадки, как более надежные, но посмотрев в раздел Информация - что-то совсем расхотелось этого делать:

у большинcтва серверов UPTIME на уровне 99.83% - 99.86%,

на 13-м сервере 99,71% :)

Если коротко:
"Раньше было лучше" ...

Вот.

Возможно есть какие-либо уважительные причины происходящего ?

И последнее (тоже коротко):
хостинг вообще-то всегда нравился


kpv - 28.4.2006 в 13:55

у нас все сервера одинаково любимые и одинаково бережно мы за ними
"ухаживаем". цифры downtime имеют несколько составляющих
1) апгрейд ПО, которое требует перезагрузки сервера
2) недоступность каналов связи
3) аварийная недоступность сервера

1. делаем обычно ночное время (по MSK) от 2. и 3. не застрахован
практически никто, но у нас специальная служба круглосуточно мониторит
сервера и старается исправить ситуацию как можно в короткие сроки.

повышение стабильности до 100% требует значительных
капитальных вложений (кластерных и других дублирующих решений).
Менять сервер, поймите меня правильно, в таких условиях неверное
решение.
Да, сейчас есть какие-то аппаратные проблемы с третьим сервером, мы их постараемся решить как можно быстрее, сейчас разбираемся с проблемой.

То что на нашем сайте стоят картинки стороннего трекера аптайма - лишнее подтверждение тому, что мы от своих клиентов ничего не скрываем, показываем реальное состояние наших серверов. Насчёт цифр аптайма - много ли компаний может "похвастаться" такими цирами для обычного (некластреного) шаред хостинга?
в месяце около 700 часов и при указанной цифре сумарный простой составляет около 2 часов.


kpv - 28.4.2006 в 14:09

Цитата:
сообщение Artyom
сервера, в часности 24-го и 28 апреля.

24 числа датацентр переносил сервер в другую стойку, возникла незапланированная задержка при переносе. Возможно, текущее поведение сервера как-то связано с этим переносом.
Еще по цифрам аптайма - на мониторинг этим трекером прошлым летом поставлено, за весь этот период цифры по сереврам именно такие: от 99.7 до 99.9.
Приносим свои извинения нашим клиентам по работам, проводящимся на третьем сервере. Повторюсь ещё раз - проблему решаем.


Artyom - 2.5.2006 в 06:37

...опять лежит...


Artyom - 2.5.2006 в 07:37

Цитата:
kpv


Вы поймите меня правильно - у меня 9 ... 10 часов утра... начало рабочего дня... и сервак падает уже 3-й раз..

клиенты звонят...

возможно конечно... в США сейчас наоборот ... вечер... нагрузка меньше - самое время "подкрутить гайки" на сервере.


vea - 2.5.2006 в 07:53

Я, можно сказать товарищ по несчастью. Сейчас сервер 3 скорее не работает, чем работает. Последний простой 30 минут. Последний аптайм - 20 минут...


Anonymous - 2.5.2006 в 12:49

Присоединяюсь. В последнее время что-то участилось. Вчера на совещании презентовали один из сайтов, который как раз хостится на 3 сервере. Ну прям как специально... Буду переводить сайт в Москву.


Artyom - 2.5.2006 в 13:17

Уважаемые администраторы !

Если есть какая-нибудь информация - выкладывайте... сегодня целый день бардак на сервере...


vea - 2.5.2006 в 13:51

Бардак это мягко сказано. Где-то наши администраторы пропадают... Ни слуху ни духу...


kpv - 2.5.2006 в 13:58

никто никуда не пропадает. все работают. В ночь на первое мая датацентр заменил память. поиск несиправности продолжается.


vea - 2.5.2006 в 14:11

Так ведь сегодня уже не первое мая. Сколько можно "продолжать поиск неисправностей". За прошедшее время можно было собрать и настроить сервак с нуля, а не то что найти неисправность! Понимаю, что в данном случае от Вас мало что зависит, американцы там наверно еще не закончили отмечать праздник, но нам то, простым пользователям, что делать? Сжать зубы и терпеть? Или может Вы попробуете как то разрешить эту ситуацию?


kpv - 2.5.2006 в 14:31

Если за такое время Вы готовы поднимать сервера в датацентре НАКа, да и влюбом другом - пишите в саппорт, может быть даже на работу Вас возьмем :-)
2All, да именно этим сейчас и занимаемся.
Сначала техническая служба занимается поиском возможных неисправностей в ПО сервера, мониторинг нагрузки. Комплектующие сервера, вызывающие подозрения на предмет сбоев, меняются датацентром. А что для этого надо сделать? посреди рабочего дня сервер остановить на два и более часа? Выбирается оптимальное время для работ на сервере (work time для нашего опытного специалиста, night time для нагрузки на сервер, work time затребованное датацентром) и работы проводятся.
Поменяли (последний раз замена памяти была в ночь на первое мая).
Тестируем. Опять сбоит.
В данный момент по нашей заявке датацентр поменял всё железо кроме винта.
Опять наблюдаем.


Artyom - 2.5.2006 в 15:06

Хорошо,

но на вопросы о судьбе сервера support@ruweb.net не отвечает, в ICQ тоже никого нет, телефона - нет.

Нам необходимо получать информацию о том, что происходит.

Поэтому если есть возможность (а она должна быть) - публикуйте её на Форуме.

Все-таки возникшие проблеммы уже тянуться почти целый день - это очень ощутимо...

Удачи в работе, поднимайте его быстрее....


kpv - 2.5.2006 в 15:17

мы стараемся отвечать на все письма, в которых есть какие-то вопросы.
с какого Вы адреса писали и в какое время?
Если есть какая либо информация - мы её сразу выдаём, если информации в данный момент нет, или она неясная(непроработанная) - мы сначала работаем над проблемой, а потом результаты работы Вам сообщаем.
сейчас:
========
В данный момент по нашей заявке датацентр поменял всё железо, кроме винта.
Опять наблюдаем.
========


kpv - 2.5.2006 в 15:21

телефон у нас есть, но техподдержку по телефону мы не оказываем - практически бестолковое и дорогое занятие. Только по организационным и общим вопросам.
пишите в активную асю, на форум,
http://support.ruweb.net, или
лучше всего на support@ruweb.net.
так будет точнее и оперативнее.


Artyom - 3.5.2006 в 07:29

Да,... по "мылу" техподдержка работает хорошо...
меня как раз на эту ветку и отправили с вопросом о 3-м сервере.


Сервер еще переодически вылетает.

Есть какая нибудь информация о том что и как сейчас ?


Artyom - 3.5.2006 в 11:26

?


vea - 3.5.2006 в 20:04

Затаили дыхание... Пока дышит... Тьфу-тьфу-тьфу..


Anonymous - 3.5.2006 в 20:14

Сегодня вроде более-менее стабильно работал.. Но сейчас упал опять..


Anonymous - 3.5.2006 в 20:18

Уже поднялся..


vea - 3.5.2006 в 21:52

С утра нестабильно было. После обеда сбоев небыло. Пока полет нормальный. Кстати вечером uptime сбоев тоже не засек!


Anonymous - 4.5.2006 в 10:50

Опять сбоит.. Уже 3 день нету нормальной работы на 3 сервере.
Когда его починят ?


Artyom - 4.5.2006 в 11:38

ХЗ, у RuWeb-а запарки видимо...

я уже двигаю особо важные сайты с 3-го на VDS...


vea - 4.5.2006 в 15:13

По моим логам сбои начались аж 26-го числа. Т.е уже 9-й день идет, а результаты пока неважные.


Anonymous - 4.5.2006 в 21:26

Ну вот опять...
Такое ощущение что у сервера не третий номер, а тринадцатый.
Как он уже меня достал!


Anonymous - 4.5.2006 в 21:35

Друзья, кто с 26-го мая ставил на своих сайтах новые скрипты или ковырялся в старых? Возможно дело не в железе, а просто это у кого-то скрипт криво работает и валит сервер, может такое быть?


Anonymous - 4.5.2006 в 21:37

Вернее с 26-го апреля


support - 4.5.2006 в 22:05

Да вроде не похоже... Никаких признаков проблем с ПО обнаружить не удалось. Сегодня ночью попытаемся заменить последнее что осталось от старого железа - жесткий диск.


vea - 5.5.2006 в 08:07

Сегодня 8:54 мск упал 8:59 мск поднялся. Если замена диска была, выходит и она не помогла :(


Unlock - 5.5.2006 в 10:55

Я конечно терплю уже более недели, но все таки, когда это закончится? Если бы до этого больше года не было проблем, точно ушел бы. Понятно что суппорт делает все что можно, но владельцев сайтов тоже поймите пожалуйста.

[Изменено 5.5.2006 от Unlock]


support - 5.5.2006 в 10:59

Нет, диск еще не заменили. Никак докопировать не можем... Замена диска переносится на следующую ночь.


Anonymous - 5.5.2006 в 11:07

Но сайты то пока "лежат"... :((


Unlock - 5.5.2006 в 11:16

Блин, ну ладно 1-2 минуты, но уже минут 20 лежат сайты и сколько это продлится, не понятно....


Artyom - 6.5.2006 в 14:57

Super Administrator -ы

Огласите результаты работ по наладке сервака,... чем все закончилось ?


vea - 9.5.2006 в 09:32

Ну чего, может уже воткнем крест в третий сервак и посыпем его землей, а? А потом сядем вокруг него и выпьем горькую??? Или сколько Вы еще собираетесь смотреть на его мучения, товарищи суперадмины?!


Member - 9.5.2006 в 18:31

Цитата:
сообщение vea
Ну чего, может уже воткнем крест в третий сервак и посыпем его землей, а?

Похоже другого выхода нет.
Кстати, вопрос к админам, как можно перейти с 3-го на 1-й или 5-й сервер?


support - 9.5.2006 в 21:23

В субботу был куплен новый сервер на замену.
2 последних дня пытаемся согласовать с датацентром перенос старого диска на новый сервер, т.к. на старой машине с него копировать данные невозможно совершено - машина постоянно вылетает (вероятно проблема всеже в жестком диске)
Дата-центр пока тормозит...


Anonymous - 9.5.2006 в 22:04

А что с данными и когда сервер заработает?


vea - 9.5.2006 в 23:02

Любопытно! А на старом серваке диск обычный, одиночный что-ли стоял? Даже не raid???


Anonymous - 10.5.2006 в 12:58

Вроде все поменяли, так как у меня на сайте навернулась кодировка в базе данных. Весь форум тепер в знаках вопроса кроме латиницы.


vea - 10.5.2006 в 13:14

А у меня ничего не работает.


support - 10.5.2006 в 13:43

У кого вообще ничего не открывается - надо ждать пока у провайдера ДНСы обновятся чтобы домен на IP нового сервера начал указывать.

Скоро все данные докопируется и будем разбираться с кодировками и прочими проблемами, если они возникнут.


vea - 10.5.2006 в 14:02

Какой IP у нового сервера?


Anonymous - 10.5.2006 в 14:18

С кодировкой уже разобрался. Просто сразу после конекта к базе указал
mysql_query("SET CHARACTER SET 'cp1251'", $link);

Пока все работает хорошо. Тьфу-тьфу :)


support - 10.5.2006 в 14:25

66.246.229.24

проблему с кодировкой исправили


vea - 10.5.2006 в 14:27

Спасибо.


Member - 10.5.2006 в 20:52

Время на сервере поправьте, плиз :)


Anonymous - 10.5.2006 в 21:47

я ресселер... у меня более 35 сайтов и мои сайты до сих пор не видны...клиенты очень недовольны... мягко говоря...
может быть для ресселеров выделить специальный сервер который не так падает?


kpv - 10.5.2006 в 22:15

пишите что за реселлер, какие сайты. нам по нику "Аноним" трудно догадаться кто Вы...
все сервера одиноково "хорошо" падают ("железо" оно и в Соединённых Штатах Америки тоже ломается, как ни странно), и как я уже неоднократно писал - нет у нас разделения ни по серверам ни по кастам, то есть реселлерам - за всеми серверами надзор одинаковый, и одинаково хороший будем стараться поддерживать в дальнейшем. Надеемся на Ваше понимание.
Сервер запущен в работу, у кого что не работает - пишите, лучше на support@ruweb.net и желательно с подробным описанием что и где именно не работает.


Тем, кто всё таки хочет переехать на другой сервер, общая процедура следующая:
1. в биллинге заказываете новый аккаунт (сейчас процессим сервер#12 http://ruweb.net/?page=info http://host12.ruweb.net/phpInfo.php http://host12.ruweb.net/perldiver.cgi http://host12.ruweb.net/MySQL.cgi)
2. после выполнения заявки, переносите данные на него
3. проверяете работу сайта и если всё нормально перенеслось, меняете dns домена
4. в течении 72 часов dns обновятся и все обращения пойдут к новому аккаунту
5. в биллинге старый аккаунт удаляете - все неиспользованные средства (за исключением текущего расчётного периода) вернуться на баланс в биллинге.


kpv - 10.5.2006 в 22:20

если есть база данных или другие изменяемые данные - позаботесь о синхронизации данных при переносе на время обновления dns


Artyom - 11.5.2006 в 14:32

как будет время наладте ссылку http://host3.ruweb.net/phpSysInfo/
которая находиться в разделе "Информация"


Unlock - 11.5.2006 в 19:43

Как-то подозрительно долго ДНС обновляются... Вторые или третьи сутки пошли. Вы уверен что у вас с настройками все нормально? И еще вопрос такой, по сути, последние примерно две недели сайты толком не работали, может будет логично добавить 1-2 недели бесплатно всем, кто пострадал. Дело тут не в деньгах, т.к. при плате в 1$ в месяц, я потерял минимум 20$ на падениях, дело просто в этике поведения компании.


kpv - 11.5.2006 в 20:29

какой сайт(ы)? пишите - посмотрим, практически у всех, кто не делал привязки к ip адресам, обновление прошло (в том числе и мой личный сайт работает нормально - я даже не притрагивался к нему, просто ждал когда сервер "поставят на ноги";). Компенсацию дадим, по предварительным данным дополнительный бесплатный месяц, только сейчас решим как это сделать правильно.


Unlock - 11.5.2006 в 23:52

Приношу извинения, это у меня файервол закешировал старые ДНС, а я еще думал, что-то долго обновление идет.


Anonymous - 12.5.2006 в 02:59

А web-интерфейс к почте у всех не работает или только у меня?


Member - 12.5.2006 в 21:43

Что-то у меня запуск php-файла через cron вида
php -f /home/ХХХ/domains/YYY.net/public_html/ZZZ.php >MAILTO=""
перестал работать на новом сервере, хотя я ничего не менял...


kpv - 12.5.2006 в 22:36

у кого что не работает - пишите подробнее.
не работает web-интерфейс - как он не работает, что показывает на экране что, или у Вас просто почты в почтовом ящике нет?
вебпочту вчера отремонтировали - если что-то ещё не работает, конкретизируйте.

перестал работать крон - как он перестал, какой крон, что в системном почтовом ящике или куда Вы его хотите перенаправить?


Anonymous - 12.5.2006 в 23:29

вебпочту отремонтировали, спасибо. За день до этого писал на support - ни ответа, ни привета.


Member - 13.5.2006 в 08:58

Цитата:
сообщение kpv
перестал работать крон - как он перестал, какой крон, что в системном почтовом ящике или куда Вы его хотите перенаправить?

Перестал выполняться php файл, запускаемый кроном после замены 3-го сервера. Последний успешный запуск 10/05/2006 06:42:27

В системный ящик приходит сообщение от Cron Daemon: php: not found


Anonymous - 14.5.2006 в 22:49

Проверьте 3 сервер !
Cайты на php начали загружатся в plain text !
А если в файле htaccess инструкции php_value - то ошибка 500 .
Ещё час назад все работало.


cosupport - 14.5.2006 в 23:21

смотрим


Anonymous - 14.5.2006 в 23:29

Похоже опять лежит сервак.


Anonymous - 18.5.2006 в 11:35

Опять лежит.... :(


Anonymous - 19.5.2006 в 07:01

host10 (kappa) лежит...


Anonymous - 19.5.2006 в 09:34

host10 вроде поднялся...


kpv - 19.5.2006 в 09:44

на host10 проверка диска (fsck), запущенная датацентром по нашей заявке, растянулась на полтора часа.
приносим свои извинения за возможные неудобства.


Anonymous - 19.5.2006 в 11:10

На сайтах на сервере # 10 потеряно много. Денег недополучил не мало. Саппорт на мои письма ни разу не ответил. Хотя раньше отвечали оперативно. Сегодня вообще хана. То работает, то не работает. Большей частью не работает. Надоело, переношу сайты к другому хостеру.


Anonymous - 19.5.2006 в 11:12

19.5.2006 в 08:10 - мой пост.

# 10 потеряно много трафика. Пропустил слово. Подобная ситуация наблюдается уже как минимум неделю.


cosupport - 19.5.2006 в 11:19

Всем на все отвечаем.
Если не отвечаем есть - скорее всего чейто спам фильтр режет ответы. Для таких случаев есть http://support.ruweb.net

Что у вас не работает и работает?


cosupport - 19.5.2006 в 11:19

И кто вы? Извините, но елепатов у нас в штате пока, увы нет.


Anonymous - 19.5.2006 в 11:26

>И кто вы? Извините, но елепатов у нас в штате пока, увы нет.
Аккаунт #3458


cosupport - 19.5.2006 в 11:38

И как вы нам сообщали о своих проблемах?


Anonymous - 19.5.2006 в 13:18

2 письма. Больше не писал, т.к. на эти ответов не было.

info@ruweb.net тормоза жуткие в последнее время 12 Мая 1 Кб
support@ruweb.net mysql лежит 09 Мая 1 Кб


cosupport - 19.5.2006 в 13:20

Сегодня вроде 19
С тормозами разбираемся.
MySQL стоит


cosupport - 19.5.2006 в 13:25

Пожалуйста, ставьте поддержку в известность. Мы не всемогущи и не всевидящи.
Мониторинг может отловить падение сервесов, но не их плохую работу и битую табличку на вашем аккаунте.


Anonymous - 19.5.2006 в 14:10

Наложилось все так одновременно: 9 числа нет коннекта к mysql, в этоже время пошли периодические сильные тормоза + просто нет ответа от сервера. Продолжалось это дело по сей день. Думаю причина все таки у этого одна. Так что я не считаю, что я должен был каждый день сообщать вам, что тормоза не утстранены. Мне казалось это вы должны были написать мне, что проблема решена и т.п. Поскольку мысли читать я не умею и постояно мониторить состояние сервера не могу (то работает то нет), значит проблема не решена.


cosupport - 19.5.2006 в 14:22

MySQL работал, работает и продолжает работать.
У вас табличка побилась. Вылечить ее дело одной минуты и четырех кликов. Если у вас есть желание, что бы ваша база заработал сделайте это. Нет желания, не надо говорить о том, чего нет.

Тормоза переодические были одно время на этом сервере не сильно заметными и не отлавливались (увы, увы) Сейчас увидели, смотрим, решаем.

[Edited on 19.5.2006 by cosupport]


Igiss - 19.5.2006 в 16:54

Было бы очень неплохо, если бы поскорее решилась проблема с 10-м сервером... только недавно сайт был недоступен, всего несколько минут - но пользователи уже начинают беспокоиться и пишут мне об этом. И со скоростью не всё в порядке, как уже давно заметили. Хостинг-то хороший (за исключением цен на объёмный трафик), не отравляйте удовольствие...


Anonymous - 5.6.2006 в 20:09

Лёд тронулся...
На 3 - м сервере, впервые за последнее время, неделя была со 100% аптаймом!
Ура товарищи!


Anonymous - 22.10.2006 в 16:44

Вот млин!
С 13 октября опять наблюдаются периодические падения 3-го сервера продолжительностью от 1 минуты (как например сегодня) до 1 часа (15 октября).
И все эти траблы последнее время происходят каждые два-три дня.
Что опять случилось с трёшкой?


cosupport - 22.10.2006 в 21:30

Мы в курсе. Выясняем. Пока есть подозрения на утечку памяти у одного из модулей Apache.