Ошибка в серверных процессорах серии AMD EPYC 7002 приводит к зависанию после 1044 дней работы, помогает перезагрузка ОС

[ Версия для печати ]
Добавить в Telegram Добавить в Twitter Добавить в Вконтакте Добавить в Одноклассники
Страницы: (2) [1] 2   К последнему непрочитанному [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]
kredetz
4.06.2023 - 11:10
Статус: Offline


W T F ?

Регистрация: 23.02.13
Сообщений: 1885
5
AMD сообщила, что ошибка в микрокоде серверных процессорах серии AMD EPYC 7002 приводит к зависанию рабочих серверов после 1044 дней работы (2 года и 10 месяцев). В качестве решения производитель рекомендует перезагрузка серверы чаще двух лет.

Производитель пояснил, что в этих процессорах, выпускаемых с 2018 года и построенных на базе микроархитектуры Zen 2, недавно была выявлена ошибка, в результате которой процессоры зависают после 1044 дней работы без сброса состояния (перезагрузки системы). В качестве обходных путей блокирования проблемы рекомендуется отключить поддержку энергосберегающего режима CC6 или перезагружать серверные системы чаще, чем раз в 1044 дней.

По информации AMD, зависание вызвано сбоем, возникающим при попытке выхода процессорного ядра из энергосберегающего режима CC6 (core-C6, понижает напряжение при бездействии) при достижении таймером значения в 1044 дней после последнего сброса состояния CPU (время проявления может меняться в зависимости от частоты REFCLK). Производитель не пояснил детально причины подобного сбоя.

Эксперты на Reddit предположили, что зависание процессоров происходит в том случае, когда счётчик в регистре TSC (Time Stamp Counter), отсчитывающем число рабочих циклов после сброса, при частоте 2800 МГц достигает значения 0x380000000000000 (2800x10^6x1042,5, то есть спустя 1042 дня и 12 часов).

AMD не собирается выпускать исправление для этой ошибки. Согласно информации OpenNET, проблема долгое время оставалась не замеченной, так как трёхлетние режимы работы без перезагрузки ОС в настоящее время не являются типичными для большинства серверов, которые для поддержания в актуальном состоянии периодически приходится перезапускать для установки обновлений ядра или для перехода на новый выпуск операционной системы.

Habr

Ошибка в серверных процессорах серии AMD EPYC 7002 приводит к зависанию после 1044 дней работы, помогает перезагрузка ОС
 
[^]
Чтотонетак
4.06.2023 - 11:14
1
Статус: Online


иГаГо

Регистрация: 17.10.15
Сообщений: 535
Чёрт, всё пропало.
 
[^]
slavagru
4.06.2023 - 11:23
-2
Статус: Offline


Ярила

Регистрация: 29.04.17
Сообщений: 1813
Когда обслуживал сервера - аптайма больше 90 дней не видел. Ибо лектричество вырубается часто. Но это в замкадье. В столицах может получше.

Размещено через приложение ЯПлакалъ
 
[^]
zoom70
4.06.2023 - 11:23
0
Статус: Offline


Забанен

Регистрация: 28.05.13
Сообщений: 7990
Правильно решили депутаты запретить эту ересь иностранную. Оставить только телевизор и с двумя каналами. Ну ладно, в Москве пусть будет три канала. Хорошо, четыре.

Это сообщение отредактировал zoom70 - 4.06.2023 - 11:28

Ошибка в серверных процессорах серии AMD EPYC 7002 приводит к зависанию после 1044 дней работы, помогает перезагрузка ОС
 
[^]
stas274
4.06.2023 - 11:30
0
Статус: Offline


Ярила

Регистрация: 22.06.13
Сообщений: 6378
У меня Интернет работает. Чего делать?
 
[^]
Lynxtsl
4.06.2023 - 11:37
-1
Статус: Offline


Ярила

Регистрация: 12.09.12
Сообщений: 2047
Цитата
Когда обслуживал сервера - аптайма больше 90 дней не видел. Ибо лектричество вырубается часто. Но это в замкадье. В столицах может получше.

Дата загрузки 19.01.2023

Размещено через приложение ЯПлакалъ

Ошибка в серверных процессорах серии AMD EPYC 7002 приводит к зависанию после 1044 дней работы, помогает перезагрузка ОС
 
[^]
Shanauroff
4.06.2023 - 11:47
1
Статус: Offline


Весельчак

Регистрация: 20.12.11
Сообщений: 127
Цитата
Когда обслуживал сервера - аптайма больше 90 дней не видел. Ибо лектричество вырубается часто. Но это в замкадье. В столицах может получше.

А про ИБП не слышал?

Размещено через приложение ЯПлакалъ

Ошибка в серверных процессорах серии AMD EPYC 7002 приводит к зависанию после 1044 дней работы, помогает перезагрузка ОС
 
[^]
MakeMyDаy
4.06.2023 - 11:49
0
Статус: Offline


Шутник

Регистрация: 25.05.23
Сообщений: 63
Ну 3 года - это не 3 месяца, чего возмущаться.
 
[^]
xMSEx
4.06.2023 - 11:51
4
Статус: Online


ln -s /dev/ass /dev/hands

Регистрация: 13.03.13
Сообщений: 2156
Цитата (slavagru @ 4.06.2023 - 11:23)
Когда обслуживал сервера - аптайма больше 90 дней не видел. Ибо лектричество вырубается часто. Но это в замкадье. В столицах может получше.

Вот один пример) сейчас влом искать, есть и больше.
$uptime
11:44:12 up 1822 days, 20:56, 1 user, load average: 0.00, 0.01, 0.05

во, нашел:

uptime
11:52:26 up 3698 days, 19:40, 2 users, load average: 1.09, 1.88, 1.88 - более 10 лет, так-то

Это сообщение отредактировал xMSEx - 4.06.2023 - 12:00
 
[^]
kycman
4.06.2023 - 11:54
1
Статус: Offline


Приколист

Регистрация: 14.11.13
Сообщений: 294
Свет отрубают так часто и на долго что "нормально". Ну и интел 2013 года(
 
[^]
slavagru
4.06.2023 - 11:57
0
Статус: Offline


Ярила

Регистрация: 29.04.17
Сообщений: 1813
Цитата (Shanauroff @ 04.06.2023 - 11:47)
А про ИБП не слышал?

Слышал, а кто даст денег на ИБП, которые по полдня держат?

Размещено через приложение ЯПлакалъ
 
[^]
gekom
4.06.2023 - 11:59
0
Статус: Offline


Ярила

Регистрация: 26.01.18
Сообщений: 3586
Цитата (slavagru @ 4.06.2023 - 11:23)
Когда обслуживал сервера - аптайма больше 90 дней не видел. Ибо лектричество вырубается часто. Но это в замкадье. В столицах может получше.

Про ИБП не слышали? ))
 
[^]
xMSEx
4.06.2023 - 11:59
0
Статус: Online


ln -s /dev/ass /dev/hands

Регистрация: 13.03.13
Сообщений: 2156
Цитата (slavagru @ 4.06.2023 - 11:57)
Цитата (Shanauroff @ 04.06.2023 - 11:47)
А про ИБП не слышал?

Слышал, а кто даст денег на ИБП, которые по полдня держат?

Некоторые костылят к ИБП автомобильные АКБ, но только на разряд, зарядить он их не сможет.
 
[^]
slavagru
4.06.2023 - 12:00
0
Статус: Offline


Ярила

Регистрация: 29.04.17
Сообщений: 1813
Цитата (gekom @ 04.06.2023 - 11:59)
Про ИБП не слышали? ))

Выше ответил. Денег не давали на ИБП которые выдерживали отключение на 5-8 часов.

Размещено через приложение ЯПлакалъ
 
[^]
gekom
4.06.2023 - 12:00
0
Статус: Offline


Ярила

Регистрация: 26.01.18
Сообщений: 3586
Цитата (slavagru @ 4.06.2023 - 11:57)
Цитата (Shanauroff @ 04.06.2023 - 11:47)
А про ИБП не слышал?

Слышал, а кто даст денег на ИБП, которые по полдня держат?

Ну так необязательно полдня, через пару минут можно и электростанцию включить.
Электростанция стоит копейки.
 
[^]
Nautils
4.06.2023 - 12:01
0
Статус: Offline


Злой гном

Регистрация: 17.06.15
Сообщений: 351
Цитата (xMSEx @ 4.06.2023 - 11:51)
Цитата (slavagru @ 4.06.2023 - 11:23)
Когда обслуживал сервера - аптайма больше 90 дней не видел. Ибо лектричество вырубается часто. Но это в замкадье. В столицах может получше.

Вот один пример) сейчас в лом искать, есть и больше.
$uptime
11:44:12 up 1822 days, 20:56, 1 user, load average: 0.00, 0.01, 0.05

во, нашел:

uptime
11:52:26 up 3698 days, 19:40, 2 users, load average: 1.09, 1.88, 1.88 - более 10 лет, так-то

Серваки с тамим аптаймой должны находится в идеальных условиях. Я свои раз в год (некоторые в полгода) останавливаю, чисто что бы пыль из них выдуть.
 
[^]
slavagru
4.06.2023 - 12:02
1
Статус: Offline


Ярила

Регистрация: 29.04.17
Сообщений: 1813
Цитата (gekom @ 04.06.2023 - 12:00)
Ну так необязательно полдня, через пару минут можно и электростанцию включить.
Электростанция стоит копейки.

Угу, за свой счёт можно и атомную...

Размещено через приложение ЯПлакалъ
 
[^]
gekom
4.06.2023 - 12:02
0
Статус: Offline


Ярила

Регистрация: 26.01.18
Сообщений: 3586
А вообще по нормальному, всегда ориентируются на возможности электроснабжения, охлаждения и тд при планировании размещения серверов.
Опять же вопрос к требованию бесперебойности, может у вас пару дней простоя норма.
 
[^]
xMSEx
4.06.2023 - 12:08
3
Статус: Online


ln -s /dev/ass /dev/hands

Регистрация: 13.03.13
Сообщений: 2156
Цитата (Nautils @ 4.06.2023 - 12:01)
Цитата (xMSEx @ 4.06.2023 - 11:51)
Цитата (slavagru @ 4.06.2023 - 11:23)
Когда обслуживал сервера - аптайма больше 90 дней не видел. Ибо лектричество вырубается часто. Но это в замкадье. В столицах может получше.

Вот один пример) сейчас в лом искать, есть и больше.
$uptime
11:44:12 up 1822 days, 20:56, 1 user, load average: 0.00, 0.01, 0.05

во, нашел:

uptime
11:52:26 up 3698 days, 19:40, 2 users, load average: 1.09, 1.88, 1.88 - более 10 лет, так-то

Серваки с тамим аптаймой должны находится в идеальных условиях. Я свои раз в год (некоторые в полгода) останавливаю, чисто что бы пыль из них выдуть.

в датацентре, два ввода питалова на стойку, сам сервак - лезвие в шасси IBM, все зарезервировано N+1, когда винты подходят, мне в телегу приходит мессага о predictive failure - значит диск скоро умрет, там зеркало, а дальше по заявке человек идет, берет нужный винт из нашей ячейки, и производит замену.
 
[^]
GS70
4.06.2023 - 12:13
0
Статус: Offline


жопа это не плохо

Регистрация: 2.05.18
Сообщений: 1288
Цитата (slavagru @ 4.06.2023 - 15:23)
Когда обслуживал сервера - аптайма больше 90 дней не видел. Ибо лектричество вырубается часто. Но это в замкадье. В столицах может получше.

у тебя обслуживание заключалось в ребуте серверов?

Это сообщение отредактировал GS70 - 4.06.2023 - 12:14

Ошибка в серверных процессорах серии AMD EPYC 7002 приводит к зависанию после 1044 дней работы, помогает перезагрузка ОС
 
[^]
slavagru
4.06.2023 - 12:22
0
Статус: Offline


Ярила

Регистрация: 29.04.17
Сообщений: 1813
Цитата
у тебя обслуживание заключалось в ребуте серверов?

Ага, посморел бы я на вас, когда за неделю 9 раз вырубалась электричество. И не час даже. Очень смешно и юморно. И экономисты в конторе хуй бабла дают на нормальные ИБП. К счастью не долго там работать пришлось)

Размещено через приложение ЯПлакалъ
 
[^]
kycman
4.06.2023 - 12:24
0
Статус: Offline


Приколист

Регистрация: 14.11.13
Сообщений: 294
Цитата
в датацентре, два ввода питалова на стойку, сам сервак - лезвие в шасси IBM, все зарезервировано N+1, когда винты подходят, мне в телегу приходит мессага о predictive failure - значит диск скоро умрет, там зеркало, а дальше по заявке человек идет, берет нужный винт из нашей ячейки, и производит замену.

научите для общего образования?
 
[^]
sonos
4.06.2023 - 12:51
0
Статус: Offline


Ярила

Регистрация: 18.07.13
Сообщений: 7736
На моей памяти максимум год работал сервак. Пока был новый. Вернее пока все настроилось, и приработалось прошел тоже год и год не вырубался. Даже обновы отключены были.
 
[^]
cobakalist
4.06.2023 - 13:45
0
Статус: Offline


Не стоит искать причины не выпить

Регистрация: 29.01.18
Сообщений: 6315
ДАНУНАХУЙ!!!! Верните деньги, горите в адууу!
 
[^]
uniJap
4.06.2023 - 20:43
0
Статус: Offline


Крокодил, крокожу и буду крокодить!

Регистрация: 15.03.12
Сообщений: 3984
Цитата (slavagru @ 4.06.2023 - 14:00)
Цитата (gekom @ 04.06.2023 - 11:59)
Про ИБП не слышали? ))

Выше ответил. Денег не давали на ИБП которые выдерживали отключение на 5-8 часов.

Для серверов, как ибп готовы к отключению, у мну дизеля есть. Медицина, если что.
 
[^]
Понравился пост? Еще больше интересного в Телеграм-канале ЯПлакалъ!
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии. Авторизуйтесь, пожалуйста, или зарегистрируйтесь, если не зарегистрированы.
1 Пользователей читают эту тему (1 Гостей и 0 Скрытых Пользователей) Просмотры темы: 1699
0 Пользователей:
Страницы: (2) [1] 2  [ ОТВЕТИТЬ ] [ НОВАЯ ТЕМА ]


 
 



Активные темы






Наверх