技術メモ

Datadogのホストダウンモニター対象のホストを削除する時はアラートが発動しないように48時間より長くMuteする

環境 CentOS 7.3.1611 Datadog Agent v6.15.0 解決方法 Datadog Agentが導入されていて、ホストダウンモニターの対象となっているホストを削除する場合、そのままDatadog Agentをアンインストールしたり、あるいは、VM自体を削除すると、no dataとしてホスト…

障害対応演習のためにDatadogへの通信を遮断してDatadogダウン状態を模倣する

環境 CentOS 7.3.1611 Datadog Agent v6.15.0 背景 障害対応演習のために外部サービスのダウン状態を模倣したかった。 今回は、Datadog がダウンしたことを再現したかった。 方法 iptables のルールを追加して、Datadogへの疎通ができない状態にする。これに…

TerraformでRSTORE Spaceを扱う

背景 TerraformでS3互換のオブジェクトストレージRSTORE Spaceを扱いたい。 方法 S3互換なのでaws プロバイダーが使えるが、いくつかオプションをデフォルト値から変える必要がある。 resource resource として扱う場合は、skip_credentials_validation, ski…

AWS RDSのSLAの英語版ドキュメントの場所

背景 aws.amazon.com にAWS RDSのSLAに関するドキュメントあるが、現時点(2021/10/16)では、「Español」と「Français 」しかない。 Englishのドキュメントを見たい。 解決策 aws.amazon.com において、右上の「日本語」を「English」に変えると英語版のSLA…

障害対応演習のために再起動からVMが復帰しない状況を意図的に作る

環境 CentOS 7.3.1611 背景 vSphere HAによってvSphereホスト障害時VMは再起動が走るが、その際に稀にVMが復帰に失敗することがあった。 この障害に対する障害対応演習を行うために、VMを再起動した際に起動に失敗する状態を再現したかった。 方法 意図的にV…

redis-cli config rewriteでpermissionエラーが発生した際も終了ステータスは0で終了する

環境 redis 6.0.10 redis-cli 6.0.10 問題 redis-cli config rewrite を実行したところ、redis.confが配置されているディレクトリにredisを実行しているユーザの書き込み権限がないために、(error) ERR Rewriting config file: Permission deniedというエラ…

Datadog MySQL サービスチェック mysql.can_connect に関するモニターではno_data_timeframeを1minにすると24hとして扱われる

環境 Datadog Agent v6.15.0 CentOS 7.3.1611 問題 DatadogのMySQLインテグレーションのサービスチェック mysql.can_connect に関するservice checkモニターを作成し、 ホストダウン時も通知がされて欲しかったため、notify_no_dataを有効かつno_data_timefr…

Datadog Agentユーザにread権限を与えずに特定ディレクトリの使用量のメトリクスを送る

環境 Datadog Agent v6.15.0 CentOS 7.3.1611 背景 Datadogに特定のディレクトリの使用量のメトリクスを送るには、 公式で提供されている以下のインテグレーションを用いることで実現できる。 docs.datadoghq.com しかし、このインテグレーションだと対象の…