Симулятор инфраструктуры крупных компаний. Роняй прод, чини инциденты, учись на ошибках — а потом расскажи об этом на собесе.
Начать в TelegramЧитал про CAP-теорему, eventual consistency и SAGA. Но никогда не дебажил race condition между 15 микросервисами в проде.
Твой самый нагруженный сервис обрабатывает 100 RPS. А на собесе спрашивают про 100K RPS и шардирование.
Тебя спрашивают "расскажите про сложный баг" — а у тебя максимум NullPointerException в логах.
Алгоритмы решаешь, а на этапе проектирования систем — "недостаточно глубины в распределённых системах".
Kubernetes, Kafka, PostgreSQL, Redis, балансировщики — всё как в настоящем бигтехе. Не схемы на доске, а живая система, которую можно пощупать и сломать.
Сценарии из жизни: DC-1, split-brain, каскадные отказы, deadlock'и на проде. То, про что спрашивают на собесах — и чего не получить в обычной компании.
Сделал DROP TABLE без WHERE? Отлично, теперь ты знаешь каково это. В DropProd последствия — только опыт и понимание, как не повторить в реальности.
Чёрная пятница, нагрузка x10. Один сервис начал таймаутить, потянул за собой остальные. Найди причину и восстанови систему.
Клиенты жалуются, что заказы "теряются". Метрики в норме, логи чистые. Проблема в конкурентном доступе к партициям Kafka.
Сервис на 50K строк без тестов. Нужно выделить критичный функционал в отдельный микросервис без даунтайма.
100M записей, нулевой даунтайм, обратная совместимость. Спроектируй и выполни миграцию.
Начни с бесплатного демо-сценария в Telegram. Сломай что-нибудь — это полезно.
Попробовать бесплатно