AWS、米や日本など大規模な障害
✍️記事要約
米IT大手アマゾン・ドット・コムのクラウドサービス「アマゾン・ウェブ・サービス」(AWS)で13日、米国や日本など世界各地で大規模な障害が発生した。アマゾン傘下のロボット掃除機「ルンバ」や、外食大手マクドナルドのアプリが正常に作動しないなどの影響が出ているとみられる。
オンライン上の障害分析サイト・ダウンディテクターによると、13日午後3時頃(米国東部時間)から障害に関する問い合わせが米国や日本などで急増した。
米メディアによれば、ニューヨーク州の交通当局やAP通信のウェブサイトなどにも影響が出ているという。アマゾンは「サービスの完全復旧に向けて取り組んでいる」とコメントしている。
◇ ◇ ◇
☘️ヤフコメ❗️ピックアップ☘️
システム障害に特別に過剰反応をする日本人も考えを変えるべきかと。
実害もないのに執拗に責任追及をしたり、システム障害を完全に予防するためのシステム対応を何重にもかけようとするのもやめたほうがいいです。
やるとするなら、システム障害があったとき、人間系でどう対応するかを決めることだと思います。その対応として「障害が回復するまで待つしかない」というものがあってもいいくらいだと思います。
✅ クラウドとはいえ、ウラでは物理的なサーバやストレージを抱えているわけだから障害はしかたがない
顧客のコストとの兼ね合いもあるが ある程度の障害は想定して複数リージョン、複数AZへの冗長構成とか 障害発生時は待機系(パイロットライトとかウオームスタンバイとか)に切り替えて縮退運転するとか設計方法はいろいろある
で、起こった障害が想定内だったのか想定外だったのか 設計が妥当だったの検証して顧客に報告することになる
無償でトラブル対応させられないように事前にしっかり合意して文書化しておくことが重要
✅ 大手クラウドに依存するようになったので、基幹でいったん障害が発生すると多くの企業が同時に障害にやられるようになりました。
しかし各社の単体レベルで見た障害発生率はオンプレ(昔の自前サーバ)からクラウドへ移行して減っています。