TOPアプリ/OS > Chaos Monkeyとカオスエンジニアリング(中)

アプリ/OS

Chaos Monkeyとカオスエンジニアリング(中)

2020/06/03

Scott Carey InfoWorld

 かつてはDVDの宅配レンタル企業だった米Netflixが、分散クラウドシステムを使った動画配信企業へと変貌を遂げる中で打ち出したのが、稼働中のシステムにわざと障害を起こすという手法と、それを実現するツール「Chaos Monkey」だ。自分たちが動かしているシステムに障害を注入して弾力性を高めるというその発想は、大小さまざまなソフトウエア開発企業で受け入れられた。

前回から続く)

Credit: Ryan McGuire

 書籍Chaos Engineeringによると、NetflixでChaos Kongを導入したばかりの頃は、これを実際のインフラで使うのは「恐怖に満ちた出来事」だった。「作戦本部室を結成して、Netflixのストリーミングサービスのあらゆる面をモニタリングする状況が何時間か続いた」という。

 2年後の2017年7月になると、Netflixは「ChAP(Chaos Automation Platform)」を発表した。実験の安全性、ペース、範囲を高めるためのプラットフォームだとブログ記事は説明している。

カオスエンジニアリングの原則

 Chaos Monkeyの基本的な手法は、Chaos Kongまで拡大して、短期間のうちに進化を遂げた後、カオスエンジニアリングとして体系化された。Netflixがカオスエンジニアリングのチームを正式に立ち上げたのは2015年のことで、トップを務めたのはBruce Wong氏だった(現在は米Stitch Fixのエンジニアリング担当ディレクター)。

 カオスエンジニアリングの原則は、Chaos Monkeyの開発に携わった人々らによって成文化されている。そこには、「カオスエンジニアリングは、分散システムにおいてシステムが不安定な状態に耐えることのできる環境を構築するための検証の規律である」と述べられている。

↑ページ先頭へ