序章
高可用性は、障害が発生した場合にアプリケーションが作業を自動的に再起動したり、別の対応可能なシステムに再ルーティングしたりできるようにするシステム設計の機能です。 サーバーに関しては、高可用性システムをセットアップするために必要ないくつかの異なるテクノロジーがあります。 作業をリダイレクトできるコンポーネントが必要であり、障害を監視し、中断が検出された場合にシステムを移行するメカニズムが必要です。
keepalived
デーモンを使用して、サービスまたはシステムを監視し、問題が発生した場合にスタンバイに自動的にフェイルオーバーすることができます。 このガイドでは、keepalived
を使用して高可用性Webサービスをセットアップする方法を示します。 2つの対応するWebサーバー間で移動できるフローティングIPアドレスを構成します。 プライマリサーバーがダウンした場合、フローティングIPは自動的に2番目のサーバーに移動され、サービスを再開できるようになります。
前提条件
このガイドを完了するには、DigitalOceanアカウントに2つのUbuntu14.04サーバーを作成する必要があります。 両方のサーバーが同じデータセンター内に配置され、プライベートネットワークが有効になっている必要があります。
これらの各サーバーでは、sudo
アクセスで構成されたroot以外のユーザーが必要になります。 Ubuntu 14.04初期サーバーセットアップガイドに従って、これらのユーザーのセットアップ方法を学ぶことができます。
開始する準備ができたら、root以外のユーザーで両方のサーバーにログインします。
Nginxをインストールして構成する
keepalived
は、ロードバランサーの監視とフェイルオーバーによく使用されますが、操作の複雑さを軽減するために、このガイドではNginxを単純なWebサーバーとして使用します。
まず、各サーバーのローカルパッケージインデックスを更新します。 次に、Nginxをインストールできます。
- sudo apt-get update
- sudo apt-get install nginx
ほとんどの場合、可用性の高いセットアップでは、両方のサーバーがまったく同じコンテンツを提供する必要があります。 ただし、わかりやすくするために、このガイドではNginxを使用して、2つのサーバーのどちらがいつでもリクエストを処理しているかを示します。 これを行うには、各ホストのデフォルトのindex.html
ページを変更します。 今すぐファイルを開きます。
- sudo nano /usr/share/nginx/html/index.html
最初のサーバーで、ファイルの内容を次のように置き換えます。
<h1>Primary</h1>
2番目のサーバーで、ファイルの内容を次のように置き換えます。
<h1>Secondary</h1>
終了したら、ファイルを保存して閉じます。
キープアライブのビルドとインストール
次に、サーバーにkeepalived
デーモンをインストールします。 Ubuntuのデフォルトリポジトリにはkeepalived
のバージョンがありますが、それは古く、構成が機能しないいくつかのバグがあります。 代わりに、最新バージョンのkeepalived
をソースからインストールします。
始める前に、ソフトウェアをビルドするために必要な依存関係を把握する必要があります。 build-essential
メタパッケージは、必要なコンパイルツールを提供しますが、libssl-dev
パッケージには、keepalived
が構築する必要のあるSSLライブラリが含まれています。
- sudo apt-get install build-essential libssl-dev
依存関係が設定されたら、keepalived
のtarballをダウンロードできます。 このページにアクセスして、ソフトウェアの最新バージョンを見つけてください。 最新バージョンを右クリックして、リンクアドレスをコピーします。 サーバーに戻り、ホームディレクトリに移動し、wget
を使用してコピーしたリンクを取得します。
- cd ~
- wget http://www.keepalived.org/software/keepalived-1.2.19.tar.gz
tar
コマンドを使用してアーカイブを展開し、結果のディレクトリに移動します。
- tar xzvf keepalived*
- cd keepalived*
次のように入力して、デーモンをビルドしてインストールします。
- ./configure
- make
- sudo make install
これで、デーモンがシステムにインストールされます。
キープアライブアップスタートスクリプトを作成する
keepalived
をインストールすると、すべてのバイナリとサポートファイルがシステム上の所定の場所に移動しました。 ただし、含まれていなかったのは、Ubuntu14.04システムのUpstartスクリプトでした。
keepalived
サービスを処理できる非常にシンプルなUpstartスクリプトを作成できます。 /etc/init
ディレクトリ内のkeepalived.conf
というファイルを開いて開始します。
- sudo nano /etc/init/keepalived.conf
内部では、keepalived
が提供する機能の簡単な説明から始めることができます。 付属のman
ページの説明を使用します。 次に、サービスを開始および停止するランレベルを指定します。 このサービスをすべての通常の状態(ランレベル2〜5)でアクティブにし、他のすべてのランレベル(たとえば、再起動、電源オフ、またはシングルユーザーモードが開始されたとき)で停止する必要があります。
description "load-balancing and high-availability service"
start on runlevel [2345]
stop on runlevel [!2345]
このサービスは、Webサービスを引き続き利用できるようにするために不可欠であるため、障害が発生した場合にこのサービスを再開します。 次に、サービスを開始する実際のexec
行を指定できます。 Upstartがpid
を正しく追跡できるように、--dont-fork
オプションを追加する必要があります。
description "load-balancing and high-availability service"
start on runlevel [2345]
stop on runlevel [!2345]
respawn
exec /usr/local/sbin/keepalived --dont-fork
終了したら、ファイルを保存して閉じます。
キープアライブ構成ファイルを作成する
Upstartファイルを配置したら、keepalived
の構成に進むことができます。
サービスは、/etc/keepalived
ディレクトリで構成ファイルを探します。 今すぐ両方のサーバーにそのディレクトリを作成します。
- sudo mkdir -p /etc/keepalived
サーバーのプライベートIPアドレスを収集する
構成ファイルを作成する前に、両方のサーバーのプライベートIPアドレスを見つける必要があります。 DigitalOceanサーバーでは、次のように入力することで、メタデータサービスを介してプライベートIPアドレスを取得できます。
- curl http://169.254.169.254/metadata/v1/interfaces/private/0/ipv4/address && echo
Output10.132.7.107
これは、iproute2
ツールで次のように入力することでも確認できます。
- ip -4 addr show dev eth1
あなたが探している価値はここにあります:
Output3: eth1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
inet 10.132.7.107/16 brd 10.132.255.255 scope global eth1
valid_lft forever preferred_lft forever
この値を両方のシステムからコピーします。 以下の構成ファイル内でこれらのアドレスを参照する必要があります。
プライマリサーバーの構成の作成
次に、プライマリサーバーで、メインのkeepalived
構成ファイルを作成します。 デーモンは、/etc/keepalived
ディレクトリ内でkeepalived.conf
というファイルを探します。
- sudo nano /etc/keepalived/keepalived.conf
内部では、vrrp_script
ブロックを開いて、Nginxサービスのヘルスチェックを定義することから始めます。 これにより、keepalived
がWebサーバーの障害を監視できるようになり、プロセスがダウンしていることを通知して、対策の回復を開始できます。
チェックはとても簡単です。 2秒ごとに、nginx
というプロセスがまだpid
を要求していることを確認します。
vrrp_script chk_nginx {
script "pidof nginx"
interval 2
}
次に、vrrp_instance
というブロックを開きます。 これは、keepalived
が高可用性を実装する方法を定義する主要な構成セクションです。
まず、keepalived
に、プライベートインターフェイスであるeth1
を介してピアと通信するように指示します。 プライマリサーバーを構成しているので、state
構成を「MASTER」に設定します。 これは、デーモンがピアに接続して選択を行うことができるまで、keepalived
が使用する初期値です。
選挙中、priority
オプションを使用して、どのメンバーが選出されるかを決定します。 決定は、この設定で最も多いサーバーの数に基づいて行われます。 プライマリサーバーには「200」を使用します。
vrrp_script chk_nginx {
script "pidof nginx"
interval 2
}
vrrp_instance VI_1 {
interface eth1
state MASTER
priority 200
}
次に、両方のノードで共有されるこのクラスターグループにIDを割り当てます。 この例では「33」を使用します。 unicast_src_ip
を以前に取得したprimaryサーバーのプライベートIPアドレスに設定する必要があります。 unicast_peer
をセカンダリサーバーのプライベートIPアドレスに設定します。
vrrp_script chk_nginx {
script "pidof nginx"
interval 2
}
vrrp_instance VI_1 {
interface eth1
state MASTER
priority 200
virtual_router_id 33
unicast_src_ip primary_private_IP
unicast_peer {
secondary_private_IP
}
}
次に、keepalived
デーモンが相互に通信するための簡単な認証を設定できます。 これは、問題のサーバーが正当であることを確認するための基本的な手段にすぎません。 authentication
サブブロックを作成します。 内部で、auth_type
を設定してパスワード認証を指定します。 auth_pass
パラメーターには、両方のノードで使用される共有シークレットを設定します。 残念ながら、最初の8文字だけが重要です。
vrrp_script chk_nginx {
script "pidof nginx"
interval 2
}
vrrp_instance VI_1 {
interface eth1
state MASTER
priority 200
virtual_router_id 33
unicast_src_ip primary_private_IP
unicast_peer {
secondary_private_IP
}
authentication {
auth_type PASS
auth_pass password
}
}
次に、keepalived
に、ファイルの先頭に作成したchk_nginx
というラベルの付いたルーチンを使用して、ローカルシステムの状態を判断するように指示します。 最後に、notify_master
スクリプトを設定します。このスクリプトは、このノードがペアの「マスター」になるたびに実行されます。 このスクリプトは、フローティングIPアドレスの再割り当てをトリガーする役割を果たします。 このスクリプトをすぐに作成します。
vrrp_script chk_nginx {
script "pidof nginx"
interval 2
}
vrrp_instance VI_1 {
interface eth1
state MASTER
priority 200
virtual_router_id 33
unicast_src_ip primary_private_IP
unicast_peer {
secondary_private_IP
}
authentication {
auth_type PASS
auth_pass password
}
track_script {
chk_nginx
}
notify_master /etc/keepalived/master.sh
}
上記の情報を設定したら、ファイルを保存して閉じます。
セカンダリサーバーの構成の作成
次に、セカンダリサーバーにコンパニオンスクリプトを作成します。 セカンダリサーバーの/etc/keepalived/keepalived.conf
でファイルを開きます。
- sudo nano /etc/keepalived/keepalived.conf
内部では、使用するスクリプトはプライマリサーバーのスクリプトとほぼ同じです。 変更する必要がある項目は次のとおりです。
state
:選択が行われる前にノードがバックアップ状態に初期化されるように、これをセカンダリサーバーで「バックアップ」に変更する必要があります。priority
:これはプライマリサーバーよりも低い値に設定する必要があります。 このガイドでは、値「100」を使用します。unicast_src_ip
:これはセカンダリサーバーのプライベートIPアドレスである必要があります。unicast_peer
:これにはプライマリサーバーのプライベートIPアドレスが含まれている必要があります。
これらの値を変更すると、セカンダリサーバーのスクリプトは次のようになります。
vrrp_script chk_nginx {
script "pidof nginx"
interval 2
}
vrrp_instance VI_1 {
interface eth1
state BACKUP
priority 100
virtual_router_id 33
unicast_src_ip secondary_private_IP
unicast_peer {
primary_private_IP
}
authentication {
auth_type PASS
auth_pass password
}
track_script {
chk_nginx
}
notify_master /etc/keepalived/master.sh
}
スクリプトを入力して適切な値を変更したら、ファイルを保存して閉じます。
フローティングIP移行スクリプトを作成する
次に、ローカルkeepalived
インスタンスがマスターサーバーになるたびに、フローティングIPアドレスを現在のドロップレットに再割り当てするために使用できるスクリプトのペアを作成する必要があります。
フローティングIP割り当てスクリプトをダウンロードする
まず、DigitalOcean APIを使用してフローティングIPアドレスをドロップレットに再割り当てするために使用できる汎用Pythonスクリプト( DigitalOceanコミュニティマネージャーによって記述された)をダウンロードします。 このファイルを/usr/local/bin
ディレクトリにダウンロードする必要があります。
- cd /usr/local/bin
- sudo curl -LO http://do.co/assign-ip
このスクリプトを使用すると、次のコマンドを実行して既存のフローティングIPを再割り当てできます。
- python /usr/local/bin/assign-ip floating_ip droplet_ID
これは、DO_TOKEN
という環境変数がアカウントの有効なDigitalOceanAPIトークンに設定されている場合にのみ機能します。
DigitalOceanAPIトークンを作成する
上記のスクリプトを使用するには、アカウントにDigitalOceanAPIトークンを作成する必要があります。
コントロールパネルで、上部の「API」リンクをクリックします。 APIページの右側で、[新しいトークンを生成]をクリックします。
次のページで、トークンの名前を選択し、[トークンの生成]ボタンをクリックします。
APIページに、新しいトークンが表示されます。
トークンnowをコピーします。 セキュリティ上の理由から、後でこのトークンを再度表示する方法はありません。 このトークンを紛失した場合は、トークンを破棄して別のトークンを作成する必要があります。
インフラストラクチャのフローティングIPを構成する
次に、サーバーに使用するフローティングIPアドレスを作成して割り当てます。
DigitalOceanコントロールパネルで、[ネットワーク]タブをクリックし、[フローティングIP]ナビゲーション項目を選択します。 「プライマリ」サーバーとして割り当てたリストからドロップレットを選択します。
アカウントに新しいフローティングIPアドレスが作成され、指定されたドロップレットに割り当てられます。
WebブラウザでフローティングIPにアクセスすると、「プライマリ」サーバーindex.html
ページが表示されます。
フローティングIPアドレスをコピーします。 以下のスクリプトでこの値が必要になります。
ラッパースクリプトを作成する
これで、正しいクレデンシャルを使用して/usr/local/bin/assign-ip
スクリプトを呼び出すラッパースクリプトを作成するために必要なアイテムができました。
次のように入力して、両方のサーバーにファイルを作成します。
- sudo nano /etc/keepalived/master.sh
内部では、作成したAPIトークンを保持するDO_TOKEN
という変数を割り当ててエクスポートすることから始めます。 その下に、フローティングIPアドレスを保持するIP
という変数を割り当てることができます。
export DO_TOKEN='digitalocean_api_token'
IP='floating_ip_addr'
次に、curl
を使用して、現在使用しているサーバーのドロップレットIDをメタデータサービスに要求します。 これは、ID
という変数に割り当てられます。 また、このドロップレットに現在フローティングIPアドレスが割り当てられているかどうかも確認します。 そのリクエストの結果をHAS_FLOATING_IP
という変数に保存します。
export DO_TOKEN='digitalocean_api_token'
IP='floating_ip_addr'
ID=$(curl -s http://169.254.169.254/metadata/v1/id)
HAS_FLOATING_IP=$(curl -s http://169.254.169.254/metadata/v1/floating_ip/ipv4/active)
これで、上記の変数を使用してassign-ip
スクリプトを呼び出すことができます。 フローティングIPがまだドロップレットに関連付けられていない場合にのみスクリプトを呼び出します。 これにより、API呼び出しを最小限に抑え、マスターステータスがサーバー間で急速に切り替わる場合にAPIへのリクエストの競合を防ぐことができます。
フローティングIPですでに進行中のイベントがある場合を処理するために、assign-ip
スクリプトを数回再試行します。 以下では、各呼び出しの間隔を3秒にして、スクリプトを10回実行しようとします。 フローティングIPの移動が成功すると、ループはすぐに終了します。
export DO_TOKEN='digitalocean_api_token'
IP='floating_ip_addr'
ID=$(curl -s http://169.254.169.254/metadata/v1/id)
HAS_FLOATING_IP=$(curl -s http://169.254.169.254/metadata/v1/floating_ip/ipv4/active)
if [ $HAS_FLOATING_IP = "false" ]; then
n=0
while [ $n -lt 10 ]
do
python /usr/local/bin/assign-ip $IP $ID && break
n=$((n+1))
sleep 3
done
fi
終了したら、ファイルを保存して閉じます。
ここで、keepalived
がスクリプトを呼び出せるように、スクリプトを実行可能にする必要があります。
- sudo chmod +x /etc/keepalived/master.sh
キープアライブサービスを起動し、フェイルオーバーをテストします
これで、keepalived
デーモンとそのすべてのコンパニオンスクリプトが完全に構成されているはずです。 次のように入力すると、両方のマシンでサービスを開始できます。
- sudo start keepalived
サービスは各サーバーで起動し、そのピアに接続して、構成した共有シークレットで認証する必要があります。 各デーモンはローカルのNginxプロセスを監視し、リモートのkeepalived
プロセスからのシグナルをリッスンします。
両方のサーバーが正常な状態で、WebブラウザーでフローティングIPにアクセスすると、プライマリサーバーのNginxページに移動する必要があります。
これで、構成のフェイルオーバー機能をテストする準備が整いました。
次のいずれかの条件が発生した場合、フェイルオーバーが発生するはずです。
- プライマリサーバーのNginxヘルスチェックでNginxが実行されていないことが示された場合。この場合、プライマリサーバーの
keepalived
デーモンは「障害」状態になります。 マスター状態に移行し、フローティングIPを要求する必要があることをセカンダリサーバーに通知します。 - セカンダリサーバーがプライマリサーバーへのキープアライブ接続を失ったとき。 セカンダリサーバーが何らかの理由でプライマリサーバーに到達できない場合、セカンダリサーバーは「マスター」状態に移行し、フローティングIPを要求しようとします。
プライマリサーバーが後で回復した場合、新しい選択が開始されるため、プライマリサーバーはマスター状態に戻り、フローティングIPを再利用します(引き続き最高の優先順位番号が付けられます)。
Nginxの失敗のテスト
プライマリサーバーでNginxサービスを停止することで、最初の条件をテストできます。
- sudo service nginx stop
Webブラウザーを更新すると、最初にページが使用できないことを示す応答が返される場合があります。
ただし、ほんの数秒後、ページを数回更新すると、セカンダリサーバーがフローティングIPアドレスを要求していることがわかります。
プライマリサーバーでNginxデーモンを再起動することで、障害から回復できます。
- sudo service nginx start
数秒後、ページを更新すると、プライマリサーバーがフローティングIPの所有権を再び取り戻したことがわかります。
サーバー障害のテスト
テストする必要があるもう1つのシナリオは、プライマリサーバーに接続できない場合に、セカンダリがマスター状態に正しく移行するかどうかです。 マスターサーバーを再起動して、これをテストできます。
- sudo reboot
繰り返しになりますが、最初はフローティングIPアドレスでサービスの中断が発生するはずです。
数秒後、セカンダリサーバーがリクエストを取得します。
しばらくして、プライマリサーバーが再起動を完了すると、IPアドレスが再利用されます。
これにより、2番目の障害シナリオが検証されます。
結論
このガイドでは、keepalived
、DigitalOcean API、およびフローティングIPアドレスを使用して高可用性Webサーバー環境を構成しました。 実際のインフラストラクチャはかなり単純でしたが、この概念は、サービスの可用性と稼働時間が重要なあらゆるタイプのインフラストラクチャに適用できます。