Abstract—
La gestión de infraestructuras de TI enfrenta una complejidad creciente debido a la nube, microservicios, IoT y Big Data. Los sistemas distribuidos a gran escala exigen alta disponibilidad, superando los métodos manuales. Este informe explora la transición necesaria del monitoreo reactivo tradicional a la prevención predictiva, impulsada por los conceptos de Computación Autónoma y las tecnologías de Inteligencia Artificial para Operaciones de TI (AIOps). Se analizan los principios de auto-gestión ("self*"), el ciclo MAPE-K, la evolución del monitoreo, las tecnologías clave de AIOps (especialmente Machine Learning), sus beneficios y desafíos, y su aplicación en arquitecturas modernas como microservicios, ejemplificado por el framework FIRM. El objetivo es proporcionar una comprensión fundamentada de esta evolución hacia una gestión de servidores más inteligente y resiliente.
Аннотация—
Управление ИТ-инфраструктурой сталкивается с растущей сложностью из-за облачных технологий, микросервисов, Интернета вещей и больших данных. Крупномасштабные распределенные системы требуют высокой доступности, превосходящей ручные методы. В этом отчете рассматривается необходимый переход от традиционного реактивного мониторинга к предиктивному предотвращению, основанный на концепциях автономных вычислений и технологиях искусственного интеллекта для ИТ-операций (AIOps). В нем анализируются принципы самоуправления, цикл MAPE-K, эволюция мониторинга, ключевые технологии AIOps (особенно машинное обучение), их преимущества и проблемы, а также их применение в современных архитектурах, таких как микросервисы, на примере фреймворка FIRM. Цель состоит в том, чтобы обеспечить обоснованное понимание этой эволюции в сторону более интеллектуального и отказоустойчивого управления серверами.
Resumo—
La gestión de infraestructuras de TI enfrenta una complejidad creciente debido a la nube, microservicios, IoT y Big Data. Los sistemas distribuidos a gran escala exigen alta disponibilidad, superando los métodos manuales. Este informe explora la transición necesaria del monitoreo reactivo tradicional a la prevención predictiva, impulsada por los conceptos de Computación Autónoma y las tecnologías de Inteligencia Artificial para Operaciones de TI (AIOps). Se analizan los principios de auto-gestión ("self*"), el ciclo MAPE-K, la evolución del monitoreo, las tecnologías clave de AIOps (especialmente Machine Learning), sus beneficios y desafíos, y su aplicación en arquitecturas modernas como microservicios, ejemplificado por el framework FIRM. El objetivo es proporcionar una comprensión fundamentada de esta evolución hacia una gestión de servidores más inteligente y resiliente.