Atlassian宕机:以下是客户可以做的事情——以及接下来会发生什么

2023-11-03 12:08来源:大国新闻网

发生了什么事?

在Forrester,我们不太愉快的职责之一是评论数字和IT行业中严重的业务、安全或技术故障。由于它的持续时间和对一部分用户群的影响,当前的Atlassian中断上升到这个级别。

如果工具不友好且实践令人生畏,那么组织可以使用的所有最佳工具和实践都无法确保有效的云安全策略。

Atlassian正把自己的未来押在成为一家云服务提供商上——它正在将自己所有的产品转变为SaaS产品,并取消了对本地部署的大部分传统支持本周的故障使人们对其执行、赢得和维持客户信任的能力进行了严格的审查,尽管据报道受影响的客户数量很少。来自atlassian的数据显示,受影响的用户约占其云计算客户群的0.2%,该公司表示,它已经为45%的受影响用户恢复了服务,但这次恢复的持续时间使得这次SaaS中断时间异常长。

对于那些不熟悉的人来说,有400个客户在Jira、Jira service Management、Jira Work Management、Confluence、Opsgenie、Statuspage和Atlassian Access上失去了一周的服务。对一些人来说,停电预计将至少持续两周以上。

这次中断发生在Team '22年度客户会议期间,时间特别不合适。在宕机事件发生之前,分析师和市场对Atlassian的商业策略褒贬不一。虽然迁移到SaaS模式对客户有自然的好处(比如减少管理工作),但Atlassian的云计算能力的声誉受损正发生在一个特别有争议的时期。Atlassian的云迁移时间表可能会有所调整。

客户能做些什么?

在此期间,Atlassian客户应该采取以下几个步骤来应对这次中断:

  1. 验证您的所有Atlassian产品和实例是否受到影响。您可能有一个Atlassian产品在您的组织中独立运行,而不是标准IT渠道的一部分。这一发现可能有助于在未来的谈判中捆绑实例或集中管理。
  2. 如果您还没有迁移出它的服务器选项,请咨询Atlassian迁移代表大约60岁进行风险测试,看看是否有任何架构策略可以用来避免类似的中断。
  3. 如果您已经迁移到云(或开始使用云),请与您的代表联系关于停电的事。探索是否有加法您的组织可以利用的唯一保证,无论是高级SLA级别(例如Atlassian的99.9%和99.95%正常运行时间选项)还是架构策略来避免类似的影响。
  4. 看看Atlassian是如何应对宕机的:
  • Atlassian刚刚加入包括第一份无可指责的事件中期评估,并将其发布给公众评估。它的主要目标是内容是围绕沟通哪里出了问题,并正确地避免将事件缩小到单个故障点或个人。它应该伴随着加法所有的碎片跟随co事件总结概述了未来采取的行动,以确保此类事件不再发生。虽然最初的事故中期评估避免了在Atlassian做出反应时责怪某个人未来某一特定群体的责任模糊了该组织的责任所有的危险信号。这似乎不太可能,然而,它值得关注。
  • 寻找超出所需SLA的客户补偿。Atlassian是如何做到这一点的?它是否超出了修复客户信任的范围,或者它是否达到了要求ntractual极限?仅仅满足最低要求就应该引起怀疑。
  • 看看它如何执行它的发现,以及它如何采取行动防止这种情况再次发生。它是否在弹性方面投入了大量资金?它会雇佣弹性专家吗?还是习惯性地淡化此类失败再次发生的可能性?对于现有或潜在客户来说,后者就不那么令人鼓舞了。

你能使用其他工具吗?

毫无疑问,有些人会考虑Atlassian的替代品。这种方法面临的挑战是,Atlassian是一个日益广泛和集成的跨功能套件(如上所述)。最近关于Atlas、Compass和底层架构增强(如Atlassian Data Lake和Atlassian Analytics)的产品公告表明了对这一策略的明智强调。收购(尤其是Opsgenie)并未保持凝聚力和去耦性。恰恰相反,它们正被整合为整体。Atlassian越来越发现自己处于SAP或Salesforce等供应商的竞争中,由于它们的跨职能能力,替换变得困难。

接下来会发生什么?

当然,Atlassian并没有失去一切。不幸的是,高调的中断很常见。Forrester的一位分析师曾供职于一家大型美国银行,该银行遭受了一次引人注目的主机故障。客户无法访问他们的资金,影响包括一些客户没有给员工发工资。该银行仍然存在,并且那次中断的残余影响很小或没有。

下面让我们来看看云计算的领导者们是如何积累起来的,混合市场,以及运营你公司的SaaS参与者,以及他们最新的战略举措。

正如我们在弹性工程社区的朋友们喜欢指出的那样,复杂系统能够正常工作是一个奇迹——对它们的运行历史进行清晰的检查,可以揭示出清醒的和正在进行的未遂事件,这对于构建更具弹性的系统至关重要。

但阿特拉西安不会毫发无损。它正处于多个充满挑战的市场,而且它有强大的竞争对手。客户将利用这个机会要求额外的折扣和部署灵活性。要重新建立信任,就需要对弹性做出重大承诺,这样Atlassian才能成为它所寻求的工作中心。云计算的改进已经成为Atlassian团队的首要任务(正如其领导人在主舞台上举行的Team 22活动中谈到的性能改进),但必须立即进一步提高弹性,并做出财务承诺。

总之,我们希望Atlassian能够在这种情况下生存下来——大多数Atlassian务实的客户会说“我没有受到影响”,但我们预计会有更多的云迁移阻力进入市场,以及取决于Atlassian对这种情况的反应的额外后果。虽然这种不幸的情况涉及到SaaS产品,但仅凭这一点并不能成为放弃SaaS的理由。云服务通常被证明是可靠的。然而,这是一个警钟,仅仅因为您在云服务中拥有某些东西并不授予对该服务的盲目信任。不管“它”在哪里,都要努力工作。

与此同时,对于客户来说,除了上面列出的一些更基本的步骤之外,没有太多的选择来增加自己的Atlassian弹性。你可以像Brent Ellis和Naveen Chhabra在这里概述的那样,开发替代方案来降低风险。

Atlassian计划在2024年之前淘汰其Atlassian服务器选项,并正在为大型组织设计更新的本地产品Atlassian数据中心。它的时间表和该计划的细节可以在这里获得:Atlassian服务器生命周期结束(销售/支持)信息。

这篇文章由分析师威廉·麦基恩-怀特撰写,最初出现在这里。

多讯网声明:未经许可,不得转载。
汽车
地球与环境