[ 273,274 page views, 120,004 usuários nos últimos 30 dias ] - [ 6.086 assinantes na newsletter, taxa de abertura 27% ]

Pesquisar

Microsoft explica por que Office 365 ficou inacessível

A Microsoft deverá publicar ao final do dia de amanhã, 3 de outubro de 2020, um erlatório explicando o incidente que impediu no mundo inteiro que muita gente fizesse acesso e utilização do Office 365 no final da tarde da segunda-feira dia 28 de setembro. O problema, felizmenmte, não prejudicava quem já estivesse conectado. A empresa já publicou um relatório preliminar explicando que o incidente ocorreu por causa da instalação de um serviço Azure AD.

As intercorrrências ocorreram com o Office 365 e serviços associados como o Microsoft Teams, Office.com, Power Platform e Dynamics365. Ao tentarem se conectar os usuários recebiam como resposta a mensagem “AADSTS90033: Ocorreu um erro temporário. Tente novamente”.

Veja isso
Desktop as a Service para Azure, em desenvolvimento na Microsoft
Microsoft publica estratégia de dupla chave para o Office 365

Ao implantar atualizações de serviço, normalmente a Microsoft primeiro faz isso em cinco ambientes diferentes, antes que a atualização chegue ao ambiente de produção. Este procedimento permite que a Microsoft teste uma atualização nos “anéis” internos com poucos dados, antes de atingir os anéis (ou circuitos) de produção usados por seus clientes.

Porém, um bug no Processo de Implantação Seguro (SDP) da Microsoft fez com que a atualização fosse implantada em todos os anéis simultaneamente, em vez de ser implantada primeiro no anel de teste.

O relatório inicial diz que “o Azure AD foi projetado para ser um serviço distribuído geograficamente, implantado em uma configuração ativo-ativo com várias partições em vários data centers em todo o mundo, construído com limites de isolamento. Normalmente, as alterações visam inicialmente um anel de validação que não contém dados do cliente, seguido por um anel interno que contém apenas usuários da Microsoft e, por último, nosso ambiente de produção. Essas mudanças são implantadas em fases em cinco anéis ao longo de vários dias”.

“Neste caso, o sistema SDP falhou em direcionar corretamente o anel de teste de validação devido a um defeito latente que afetou a capacidade do sistema de interpretar os metadados da implantação. Consequentemente, todos os anéis foram direcionados simultaneamente. A implantação incorreta causou a degradação da disponibilidade do serviço” afirmou a Microsoft.

Com agências internacionais