Первой в теме устойчивости мы отмечаем собственную инфраструктуру: нашу сеть дата-центров, свои инженерные решения и мощное оборудование. Но обеспечивают отказоустойчивость этой инфраструктуры, конечно, люди. Мониторинг, диагностика, поиск улучшений, прогнозирование инцидентов и сценарии их устранения — за все это отвечает наша команда. Для устойчивости мы опираемся как на надежное «железо», так и на сильную экспертизу команды. В видео Игорь рассказал, как все это устроено на практике.