预见AIOps:让云计算更自主、更前瞻、更全面,也更易于管理

编者按:“建立一个可供数百万人每天使用,但只需一名兼职人员管理和维护的系统。”这是吉姆·格雷(Jim Gray)在1999年获得图灵奖时对无故障服务器系统的畅想。他设想了一个自管理的“空中服务器”,可以存储大量数据,并可按需刷新或下载数据。如今,随着人工智能(AI)、机器学习(ML)、云计算的出现和快速发展,以及微软对云智能/AIOps(智能运维)的开发,我们比以往任何时候都更接近这一愿景,并有望超越这一愿景。

发布时间:2022-12-01 类型:深度文章

SPINE:高拓展性、用户友好的自动化日志解析新神器

编者按:在计算机系统与软件的实践和研究中,可靠性是至关重要且经久不衰的课题。如何自动化地分析日志所记录的系统状态并让数据“说话” ,受到了广泛研究。日志解析是自动化日志分析中的关键起步。如何将日志解析应用于大规模复杂的云环境往往面临诸多现实挑战,如数据不均衡,数据漂移等。

发布时间:2022-11-11 类型:深度文章