« 【AWS発表】新しいSQS Client Library for Java Messaging Service (JMS) | メイン | 週刊AWS - 2015年1月12日 »

【AWS発表】Amazon EC2の自動リカバリ(Auto Recovery)機能

可用性と信頼性が高いシステムを構築する際の重要なルールは Design for Failureです。言い替えると、AmazonのCTOワーナー・ボーゲルスの言葉が言うように、「あらゆるものは何時でも壊れる」ことを設計モデルで想定すべきです。幸いにも、このルールよりも現在のデータセンター、ネットワーク、サーバは信頼性が高く、故障は例外的です。それでも、何か問題が起こった後にも自動的に復旧し、動作し続けるシステムを構築すれば、素晴らしいシステムになるでしょう。

新機能 Auto Recovery

今日、EC2の新しい機能を発表できることを嬉しく思います。特定のEC2インスタンスが動作しているハードウェアに障害が発生した場合に、要望通りに対応を行うシステムを実現することさえも簡単になります。この背景には、複数のシステムステータスチェック (この機能2012年に登場しそれ以降何度が強化されています)はインスタンスやインスタンスが期待通りに機能するのに必要な他のコンポーネントを監視します。特に、ネットワーク接続の喪失、システム電源の喪失、物理ホスト上のソフトウェア問題、物理ホスト上のハードウェア問題を見ています。

今回のリリースにより、ハードウェアレイヤーについてのシステムステータスチェックが失敗した際には自動的にEC2インスタンスを復旧するように準備できるようになりました。インスタンスは自動的に(必要があれば新しいハードウェア上で)再起動されますが、インスタンスID、IPアドレス、Elastic IPアドレス、EBSボリュームの割り当て、その他詳細設定は維持されます。復旧を完了させるには、インスタンスの初期化プロセスの一部として、サービスやアプリケーションを自動的に開始するようにする必要があります。

Auto Recoveryの設定

何回かのクリックで既存のインスンタンスの Auto Recovery を設定する事ができます(サポートされているインスタンスタイプや環境についても後ほど確認下さい)。単純に StatusCheckFailed_System メトリックにCloudWatch アラームを作成し、アクションに Recover this instance を選択して下さい。

まず、目的のインスタンスについてのメトリックを見つけて選択します。:

次に、Create Alarm ボタンをクリックします。:

(他の理由で必要でなければ)通知アクションを消し、EC2アクションを追加し、Recover this instance を選択して下さい。閾値は 1 に、StatisticMinimum に、consecutive period には適した値を指定します(1分間隔でメトリックが集計されている場合、2、3分は良いスタート地点と思います)。:

適用できるインスタンスタイプと環境

この機能は現在US East(北ヴァージニア)リージョンにあるC3、C4、M3、R3、T2のインスタンスタイプで利用できます。可能な限り素早く他のリージョンでも利用できるようにする予定です。インスタンスはVPC内で動作し、EBS-backedとなっている必要があります。ですが、占有インスタンスでは使用できません。

この機能で追加の費用はかかりません。

より詳しい内容については、ドキュメント Recover Your Instance を御覧ください!

コメント

トラックバック

この記事のトラックバックURL:
http://www.typepad.com/services/trackback/6a00d8341c534853ef01b8d0c32fc5970c

【AWS発表】Amazon EC2の自動リカバリ(Auto Recovery)機能を参照しているブログ:

Featured Event

2016年3 月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31