Skip to content

Instantly share code, notes, and snippets.

@rodrigomaia
Created February 10, 2022 12:50
Show Gist options
  • Save rodrigomaia/2c8586021fc8f9f9868656a600f86a97 to your computer and use it in GitHub Desktop.
Save rodrigomaia/2c8586021fc8f9f9868656a600f86a97 to your computer and use it in GitHub Desktop.
MTBF, MTTR, MTTA, and MTTF
Understanding a few of the most common incident metrics
MTBF: Mean time between failures
is the average time between repairable failures of a technology product
X = (P - Td) / Fs
P: Período de análise
Td: Tempo em que o sistema ficou fora (não deve considerar manutenção programada)
Fs: Falhas ocorridas no período
A disclaimer about MTTR
The R can stand for repair, recovery, respond, or resolve
MTTR:
Mean time to repair
is the average time it takes to recover from a product or system failure
X = ∑(Tf - Ti) / Fs
Tf: Momento em que a manutenção foi concluída e o sistema está em pleno funcionamento
Ti: Momento em que a manutenção foi iniciada, não considera o início da falha
Fs: Número de interrupções para reparação no período
Mean time to recovery
is the average time it takes to recover from a product or system failure.
X = ∑(Tf - Tfi) / Fs
Tf: Momento em que a falha deixou de existir e o sistema está em pleno funcionamento
Tfi: Momento de início da falha (não deve considerar o momento do alerta e sim o momento da falha)
Fs: Falhas ocorridas no período
Mean time to resolve
is the average time it takes to fully resolve a failure
X = ∑((Tf - Tfi) + Tm) / Fs
Tf: Momento em que a falha deixou de existir e o sistema está em pleno funcionamento
Tfi: Momento de início da falha
Tm: Tempo usado para fazer a correção garantindo que a falha não volte a ocorrer
Fs: Falhas ocorridas no período
Mean time to respond
is the average time it takes to recover from a product or system failure from the time when you are first alerted to that failure.
X = ∑(Tf - Ta) / Fs
Tf: Momento em que a falha deixou de existir e o sistema está em pleno funcionamento
Ta: Momento do alerta da falha
Fs: Falhas ocorridas no período
MTTA: Mean time to acknowledge
is the average time it takes from when an alert is triggered to when work begins on the issue.
X = ∑(Tr - Ta) / Fs
Tr: Momento em que o ack acontece
Ta: Momento do alerta da falha
Fs: Falhas ocorridas no período
MTTF: Mean time to failure
is the average time between non-repairable failures of a technology products the average time it takes from when an alert is triggered to when work begins on the issue.
X = Tempo de vida de um produto
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment