« 【AWS発表】Amazon ElastiCache に4つの新キャッシュノードタイプが追加! | メイン | 【AWS発表】3つの開発者向けのブログ(モバイル、Ruby、Java)がスタートしました! »

【AWS発表】Amazon S3がさらに便利に! データをAmazon Glacierに自動アーカイブできるオプションが追加!

AWSはいくつものデータストレージオプションを提供しています。今日はその中でも、Amazon S3Amazon Glacier、そしてこの二つのサービスを連携できる強力な新機能に焦点を当てたいと思っています。

S3とGlacierは両方とも、信頼性と耐久性の非常に高いオンラインストレージを提供します。Amazon S3は高速にデータの取得、配信ができるよう設計されています。一方、Glacierは料金のためにデータの取得時間を犠牲にしており、データの取得に3から5時間かかるかわりに、1ヶ月、1GBあたり、約1円でデータを保存することが可能です。

両方のいいとこどりをしたいと思ったことはありませんか? 例えば、高速なデータ取得が必要な新しいデータはS3に保存しておき、ルールに従って、自動的に、古くなったデータをよりコストの低いGlacierのストレージにアーカイブすることができたらいいと思いませんか?

なんとこれらの機能が本日よりご利用いただけます! Amazon S3のためのストレージオプションとして、Amazon Glacierを利用可能になりました!

ストレージ、アーカイブ、リスト、およびデータ取得 - この機能には4つの側面があります。順番にそれぞれ見てみましょう。

ストレージ
まず、どのオブジェクトがGlacierストレージにアーカイブされるか、そしてどんな条件でアーカイブするかをS3に伝える必要があります。この設定はライフサイクルルールに次の項目を設定することにより行えます。

  • ポリシーを適用するバケット内のオブジェクトを特定するための正規表現
  • Glacierへオブジェクトを移行するまでの期間。期間はオブジェクトの作成日を基準に解釈されます。相対(特定の日数が経過したアイテムを移行)もしくは絶対(特定の日のアイテムを移行)で指定できます。
  • S3バケットからオブジェクトが削除されるまでの期間。これはS3にオブジェクトのオリジナルをPUTしたところから測定されます。Glacierに移動した際にリセットされません。

ライフサイクルルールはAWS Management Consoleから作成可能です。

アーカイブ
毎日、S3は各バケットのライフサイクルポリシーを評価し、必要に応じてGlacierにオブジェクトをアーカイブします。 Glacierストレージオプションを使ってオブジェクトのアーカイブに成功すると、オブジェクトのデータはS3から削除されますが、インデックスエントリーはそのまま残ります。GlacierにアーカイブされているオブジェクトのS3ストレージクラスは、GLACIERに設定されます。

リスト
Amazon S3の他のストレージオプションと同様に、Glacierオプションを使って保存された全てのS3オブジェクトはユーザーが定義した名前が関連付けられています。S3のLIST APIを使用して、Glacierオプションを使って保存されたものを含む、全てのS3のオブジェクト名のリアルタイムなリストを取得することが可能です。Glacierにアーカイブされているオブジェクトを含むバケットのリストを取得すると、どうなるでしょう?

上記のように、各S3オブジェクトは関連づけられたストレージクラスを持っています。3つの取りうる値が以下になります。

  • STANDARD - 99.999999999% の耐久性。S3のデフォルトストレージオプション
  • RRS - 99.99% の耐久性。 S3の Reduced Redundancy Storage オプション
  • GLACIER - 99.999999999% の耐久性。 Glacierオプションでアーカイブされたオブジェクト

Glacierストレージオプションを使ってオブジェクトをアーカイブする場合、オブジェクトを取得する前にそのストレージクラスを確認する必要がでてきます。オブジェクトがS3のSTANDARDもしくはRRSストレージに保存されている場合は普通のGETリクエストは期待した通りに動作しますが、Glacierにアーカイブされたオブジェクトはエラー(403)を返します。この場合、S3で利用可能にするために、RESTORE操作(後述します)を行う必要があります。

データ取得
GlacierにアーカイブされたオブジェクトにアクセスするためにはS3の新しく追加されたRESTORE操作を使います。リクエストの一部として、数日の保存期間を指定する必要があります。オブジェクトのリストアにはだいたい3から5時間かかります。リストアされたオブジェクトは指定した保存期間の間、GlacierとS3のReduced Redundancyストレージ(RRS)の両方に残ります。保存期間が過ぎるとS3からオブジェクトが削除されます。オブジェクトはGlacierには残り続けます。

オブジェクトはGlacierにアーカイブされますが、Glacier APIを介してそれらを取得するこはできません。Amazon Glacier APIを使って直接Glacierに保存されたオブジェクトはリアルタイムにリスト表示することができず、ユーザーが定義した名前ではなくシステムが自動生成した識別子をもっています。Amazon S3はユーザーが定義したオブジェクト名とAmazon Glacierが自動生成した識別子のマッピングを持っているので、Amazon Glacierオプションを使って保存されたS3オブジェクトはAmazon S3 APIもしくはManagement Consoleを通してアクセス可能です。

活用事例
私達はAmazon Glacierが様々な用途にご利用いただきたいと考えています。株式会社 東芝 クラウド&ソリューション事業統括部は医療画像の保存先としてAmazonのストレージをご利用いただいております。株式会社 東芝 クラウド&ソリューション事業統括部 統括技師長の村永氏は次のように述べています。

私たちは、日本において、医療画像をクラウドに保存するサービスを提供しています。S3を介してAmazon Glacier を用いることで、大容量のデータを適切なコストで長期間にわたってアーカイブできるようになることを歓迎します。私たちは、当社のクラウドコンピューティング技術と、Amazon Glacier、Amazon S3のライフサイクル管理を組み合わせて、医療・ヘルスケアをはじめ、さまざまな分野の情報・ドキュメント・画像データなどを大量にアーカイブするサービスが提供できるようになることを期待しています。

料金
S3の新しいGlacierストレージオプションを使用して保存したデータでも利用料金は既存のスタンダードGlacierと同じです。

さらに詳しく
Amazon S3に保存したデータをGlacierへアーカイブする方法についてさらに詳しく知りたい場合は、Amazon S3 Developer GuideObject Lifecycle Managementの章をご覧いただくか、新たに公開いたしましたビデオをご覧ください。

堀内康弘 (Facebook, Twitter)

 

コメント

トラックバック

この記事のトラックバックURL:
http://www.typepad.com/services/trackback/6a00d8341c534853ef017d3da22c77970c

【AWS発表】Amazon S3がさらに便利に! データをAmazon Glacierに自動アーカイブできるオプションが追加!を参照しているブログ:

Featured Event

2016年3 月

    1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31