4 февраля прошел митап на тему "Что делать, чтобы фейлов в production было меньше", где поделились советами о путях выработки работы с инцидентами и разобрали несколько реальных кейсов по фейлам и ошибкам.
Приглашенным спикером митапа стал TeamLead в Циан Михаил Андрейков. Для начала он рассказал о кейсах Meta, Яндекс Диск и Intel, а также поделился, каким образом компании вышли из возникших ситуаций с багами. Так, к примеру, в октябре 2021 года Facebook, Instagram и WhatsApp не работали больше 5 часов из-за сбоя в сетевом протоколе. Это повлекло за собой как материальные и репутационные издержки, так и потерю пользователей, которые за это время решили уйти к конкурентам.
Спикер разобрал, что такое фейл и рассказал, как работают методы измерения работоспособности сервиса SLO-SLI-SLA. Например, SLI может показать количество авторизованных пользователей, а SLA компенсацию в процентах от стоимости подписки. Также Михаил поделился планом действий при работе с фейлами и методами борьбы с ними. Он отметил, что необходимо писать документ, в котором описывается возникший фейл и как его избежать в будущем.
Кроме того, эксперт рассказал о Rate Limiting, Retry, Circuit breaker и Dead queue. В конце Михаил ответил на вопросы и поделился советами с начинающими специалистами.
Запись митапа доступна по ссылке: https://www.youtube.com/watch?v=Un8kKSyRslw
Когда: 4 февраля
Место: IT-hub "Терриконовая Долина"
Алалыкина, 12
Данное мероприятие проведено бесплатно при поддержке “Управления информатизации, оказания государственных услуг и архивов Карагандинской области”.
Организатор: “Управление информатизации, оказания государственных услуг и архивов Карагандинской области”.
Оператор: IT-hub "Терриконовая Долина"; ТОО “Терриконовая долина”.
Приглашенным спикером митапа стал TeamLead в Циан Михаил Андрейков. Для начала он рассказал о кейсах Meta, Яндекс Диск и Intel, а также поделился, каким образом компании вышли из возникших ситуаций с багами. Так, к примеру, в октябре 2021 года Facebook, Instagram и WhatsApp не работали больше 5 часов из-за сбоя в сетевом протоколе. Это повлекло за собой как материальные и репутационные издержки, так и потерю пользователей, которые за это время решили уйти к конкурентам.
Спикер разобрал, что такое фейл и рассказал, как работают методы измерения работоспособности сервиса SLO-SLI-SLA. Например, SLI может показать количество авторизованных пользователей, а SLA компенсацию в процентах от стоимости подписки. Также Михаил поделился планом действий при работе с фейлами и методами борьбы с ними. Он отметил, что необходимо писать документ, в котором описывается возникший фейл и как его избежать в будущем.
Кроме того, эксперт рассказал о Rate Limiting, Retry, Circuit breaker и Dead queue. В конце Михаил ответил на вопросы и поделился советами с начинающими специалистами.
Запись митапа доступна по ссылке: https://www.youtube.com/watch?v=Un8kKSyRslw
Когда: 4 февраля
Место: IT-hub "Терриконовая Долина"
Алалыкина, 12
Данное мероприятие проведено бесплатно при поддержке “Управления информатизации, оказания государственных услуг и архивов Карагандинской области”.
Организатор: “Управление информатизации, оказания государственных услуг и архивов Карагандинской области”.
Оператор: IT-hub "Терриконовая Долина"; ТОО “Терриконовая долина”.