Backend2024. 7. 4. 20:28[Datadog] Anomaly Detection 리서치

Anomaly Detection메트릭의 과거 트렌드, 계절별 패턴을 비교 분석하여 메트릭이 정상적인 범위를 벗어 났는지 탐지하는 데이터독 기능그래서 언제 사용?https://docs.datadoghq.com/ko/monitors/guide/anomaly-monitor/모니터링 하고자 하는 Elasticsearch 클러스터의 검색 성능과 관련된 지표에서 규칙적인 패턴이 발견됨.이상 징후 모니터를 통해 기대 하는 것 (가설)Datadog의 Anomaly Monitor를 통해 검색 지표를 모니터링 하여 비정상적인 부하를 조기에 감지하여 알람을 받을 수 있다.이상 징후 알람으로 조기 조치가 가능 해진다면 시스템 다운타임을 방지하고, 사용자 경험을 개선하는 데 도움을 줄 수 있다.설정 방법Datadog - Mon..

Backend2024. 7. 4. 20:27[Datadog] Detection Method 정리

데이터독에 전송된 메트릭은 사전에 정의한 임계값에 도달하면 알람을 받을 수 있다.Threshold Alert특정 메트릭이 설정된 임계값을 초과하거나 미달할 때 경고를 발생시키는 방법적합한 상황잘 알려진 성능 기준이나 목표가 있을 때 유용사용 케이스CPU 사용량 (`elasticsearch.node.cpu.utilization`)이 설정된 임계치 도달클러스터 상태 (`elasticsearch.cluster.health_status`)가 "yellow" 또는 "red"로 변경.단위 샤드 크기 50GB 초과ES JVM 힙 메모리 85% 이상 사용LB 응답시간 p95가 200ms 이상Change Alert메트릭 값의 변화율을 감지하고, 이 변화율이 설정한 임계치를 초과할 때 알림을 발생시킵니다.적합한 상황평소와..

image