Datadog MySQL サービスチェック mysql.can_connect に関するモニターではno_data_timeframeを1minにすると24hとして扱われる

環境

  • Datadog Agent v6.15.0
  • CentOS 7.3.1611

問題

DatadogのMySQLインテグレーションのサービスチェック mysql.can_connect に関するservice checkモニターを作成し、 ホストダウン時も通知がされて欲しかったため、notify_no_dataを有効かつno_data_timeframeを1minに設定した。

ホストが稼働している場合にmysqldがダウンしたときは即時に通知がされたが、ホストダウンの場合の通知は24h経過した後にあった。 ホストダウンした場合にもno_dataとして通知が即時にされるのを期待していたが、そうはならなかった。

解決策

公式ドキュメント docs.datadoghq.com によると、サービスチェックにおいてno_data_timeframeは2min以上を指定することが推奨されている。 今回の場合だと、1minにしてしまったので24hとして扱われてしまったようである。 2minに設定したところ期待通りにホストダウン時に即時に通知がされるようになった。 設定自体は1minにできてしまい気がつきにくいので、注意が必要である。