CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ...

27
CLUSTERPRO MC (HAシリーズ)のご紹介 2014/4/8 日本電気株式会社 システムソフトウェア事業部

Transcript of CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ...

Page 1: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

CLUSTERPRO MC (HAシリーズ)のご紹介

2014/4/8

日本電気株式会社

システムソフトウェア事業部

Page 2: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 1 © NEC Corporation 2014

本資料について

※本資料に記載されている内容はNEC製サーバExpress5800、NX7700xシリーズ(以降、NEC製サーバ)でのご利用を前提としています。一部他社機にも対応しておりますので、他社機への導入を検討されている場合は、

本資料末尾に記載されているお問い合わせ先までご相談ください。

※本資料に掲載しております価格には消費税は含まれておりません。ご購入の際に消費税が付加されますのでご承知おき願います。

※本資料に記載されている会社名、製品名は各社の商標または登録商標です。

Page 3: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

ハインリッヒの法則で例えれば・・・

業務停止

障害(業務停止の予兆)

資源未解放プロセス

データベース格納ディスクの空き不足

・ クラスタ化(サーバの冗長化)・ 障害の検出・ フェイルオーバ

業務停止の防止

・ 装置の冗長化・ 障害の予兆検出・ 障害の予防

障害の防止

監視

NECが手がけたミッションクリティカルシステムの構築、運用のノウハウを

監視製品という形でフィードバックしました。障害の予兆検出や予防を行うことにより、システムの可用性を極限まで高めます。

サーバ監視ノウハウを容易に導入ダウンタイム短縮

NEC が手がけた UNIX システムにおいて豊富な利用実績がある監視機能を Linux,Windows

システムに提供します。それらにより UNIX 並みの高可用性を実現できます。

適用効果

監視

障害の予兆

重大な事故

軽微な事故

ヒヤリ・ハット

ファイルシステム異常

ディスクのセクタエラー

I/O パスの頻繁なスイッチ

CLUSTERPRO MC(HAシリーズ)

予期せぬシステム停止を防ぐため、フェイルオーバに至る前の障害も未然に検出します。これにより、システム停止のタイミングをシステム管理者が計画的にコントロールすることを可能にします。

Page 2 © NEC Corporation 2014

CLUSTERPRO

MC (HAシリーズ) (*1)

(*1) 以降、CLUSTERPRO MC (HA)

Page 4: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 3

CLUSTERPRO と CLUSTERPRO MC (HA) の監視範囲イメージ

サーバネットワーク

ディスク OSアプリ

ケーション

CL

US

TE

RP

RO

MC

(HA

)

CL

US

TE

RP

RO

MC

(HA

)

CL

US

TE

RP

RO

MC

(HA

)

CL

US

TE

RP

RO

MC

(HA

)

CL

US

TE

RP

RO

MC

(HA

)

CLUSTERPRO は広く、浅く。CLUSTERPRO MC (HA) は狭く、深く。

© NEC Corporation 2014

Page 5: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 4

CLUSTERPRO MC (HA) 製品ラインナップ

Linux / Windows

ProcessSaver プロセス監視Linux

Windows

RootDiskMonitor 内蔵ディスク監視Linux

Windows

StorageSaver ストレージ監視Linux

Windows

ApplicationMonitor Oracle 監視 Linux

ResourceSaver OS 監視、クラスタ制御 Linux

障害監視

仮想化基盤

シングル クラスタ

© NEC Corporation 2014

Page 6: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 5

ProcessSaver

ApplicationMonitor

▐ リモート制御機能大規模構成において監視状態の一元管理と一括制御が

可能となり、運用性が向上。

Windows端末からLinuxサーバの監視を停止するなど、クロス

プラットフォームでの監視制御が可能。

▐ サービスのグループ監視機能

現在Windows版で提供しているプロセス単位でのグルーピング

に加え、サービス単位のグルーピングが可能。

▐ ESMPRO ServerAgent とのメッセージ連携機能ProcessSaverが出力するメッセージをServerManagerにインポート可能なファイルとして提供。

ServerManagerでメッセージの一元管理が容易に。

RootDiskMonitor

▐ 動作環境の拡大Oracle Database 12cに対応。

Oracle Database 12cで導入されたマルチテナント構成のデータベースの監視も可能に。

StorageSaver

▐ 動作環境の拡大Linux版で提供していた仮想OSでの物理I/Oパスの監視機能を

Windows版にも追加。

SANBoot 環境における OS ディスク監視に対応。

CLUSTERPRO MC (HA) 1.2 の強化点

© NEC Corporation 2014

Windows

Windows

Windows

▐ パトロールシーク機能強化ディスク監視(パトロールシーク機能)は、大容量ディスク(2TB)

にも対応。

Page 7: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 6 © NEC Corporation 2014

従来 新機能

▐ 監視の一時停止、再開などの制御は、ProcessSaver をインストールしている自サーバに対してのみ実行可能。

リモート制御機能(ProcessSaver)

▐ 大規模環境で業務処理を分散している状況で、

8台のサーバのアップデート作業を行う際など、

運用管理端末から一括でアップデート対象サーバ

の監視停止と再開を行うことが可能。

▐ Windows端末からWindowsサーバ/Linux

サーバの監視を停止するなど、クロスプラット

フォームでの監視制御が可能。

監視の一時停止、再開、状態表示

Page 8: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 7 © NEC Corporation 2014

仮想化環境対応強化(StorageSaver)

VMwareが管理するストレージへの物理パスの状態監視

ESXi

物理サーバ

仮想マシン

StorageSaver

仮想マシン

両パス障害

片パス障害

ストレージ

Windows に新たに対応

StorageSaver

ESXi から物理I/Oパスの状態取得

▌ 仮想OSでの物理I/Oパスの監視機能vSphere ESXi上の仮想OSから、ESXiホストに接続されているFC接続による物理I/Oパスおよび仮想ディスクの監視を実現。

▌ 仮想OS上から物理パスを自動閉塞する機能異常を検出した物理パスを閉塞可能。

▌ クラスタウェア連携機能仮想OSが使用するディスク装置へのすべての経路の異常により、ユーザーデータへのアクセスができなくなると、クラスタウェアと連携し、パッケージの移動やノード切り替えにより業務の継続的な運用を実現。

両パス障害

Page 9: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 8 © NEC Corporation 2014

Oracle Database 12c 対応(ApplicationMonitor)

マルチテナント構成のデータベースの障害を PDB(*1) レベルで検出

▌ 予兆を含む Oracle リソース障害(停止、無応答)の監視機能データベースの参照/更新などによる監視を行い、Oracleのバックグラウンドプロセス単位でのインスタンス障害の検出が可能。

▌ PDB単位の監視機能実際にPDB上の表にアクセスすることで、PDB単位で発生する障害の検出が可能。PDBごとの表領域の空き容量を監視し、空き容量不足による障害発生の未然防止が可能。

▌ PDB単位の運用を考慮PDBの状態を判断して、OFFLINE状態のPDBを自動的に監視対象から除外することが可能。PDB単位の柔軟な運用をサポート。

(*1) PDB:プラガブル・データベース(*2) CDB:コンテナ・データベース

インスタンス

CDB

バックグラウンドプロセス

PDB

表領域

PDB

表領域

PDB

表領域

V$表V$表

V$表

ApplicationMonitor

PDB

CDB(*2)

PDB PDB

ApplicationMonitor

自動判断

サービス一時中断

Page 10: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 9

CLUSTERPRO MC (HA) 製品紹介

1. ProcessSaver

2. RootDiskMonitor

3. StorageSaver

4. ApplicationMonitor

5. ResourceSaver

© NEC Corporation 2014

Page 11: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

イメージ図

NEC優位性

プロセスを監視し、 プロセス消滅時に自動的に再起動を実施。プロセス再起動に失敗した場合は クラスタウェアと連携しノードを切り替え業務を継続するなど高可用を実現。

<製品概要>

●プロセス自動再起動によるダウンタイム短縮•異常終了に加えてハングアップの検出が可能。•異常検出時は、プロセスを自動再起動。

●クラスタ連携によるダウンタイム短縮•再起動を繰り返しても復旧しない場合は、クラスタウェアと連携してフェイルオーバし、業務を継続。

●設定テンプレートで容易に設定•OSプロセスやWebサーバなどの代表的なアプリケーション※

については監視設定や再起動スクリプトのテンプレートを提供

●動作環境の拡大•Oracle Linux/UEK に対応。•仮想化環境(VMware)に対応。

※Apache、 Tomcat、 WebOTX、 WebLogic、 Jboss、PostgreSQL 等のアプリケーション、 syslog 等のOS標準デーモンなど

<導入効果と機能>

CLUSTERPRO MC ProcessSaver 1.2 for Linuxプロセスが異常終了しても自動再開させ業務を継続

②システムログ通知

システム管理者

監視対象プロセス

・同一名のプロセス・関連するプロセスのグループ

障害

①監視/障害検出

③再起動

ProcessSaver

動作環境 :Red Hat Enterprise Linux 5、 Red Hat Enterprise Linux 6Oracle Linux 6 他

製品URL :http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 :H26年4月8日型番 :UL4438-302 他価格(最小構成): 220,000円(シングル構成、CPUライセンス、メディア含む場合)

•同一名プロセスの監視や、グループ化された複数プロセスの監視が行えるなど、柔軟な監視が可能。

•監視対象として代表的なアプリケーションについてはテンプレートが用意されており、簡単に導入が可能。

異常終了 ハングアップ

© NEC Corporation 2014Page 10

Page 12: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 11 © NEC Corporation 2014

イメージ図

NEC優位性

•同一名プロセスの監視や、グループ化された複数プロセスの監視が行えるなど、柔軟な監視が可能。

•監視対象として代表的なアプリケーションについてはテンプレートが用意されており、簡単に導入が可能。

プロセスを監視し、 プロセス消滅時に自動的に再起動を実施。プロセス再起動に失敗した場合は クラスタウェアと連携しノードを切り替え業務を継続するなど高可用を実現。

<製品概要>

●プロセス自動再起動によるダウンタイム短縮•異常終了に加えてハングアップの検出が可能。•異常検出時は、プロセスを自動再起動。

●クラスタ連携によるダウンタイム短縮•再起動を繰り返しても復旧しない場合は、クラスタウェアと連携してフェイルオーバし、業務を継続。

●設定テンプレートで容易に設定•OSプロセスやWebサーバなどの代表的なアプリケーション※

については監視設定や再起動スクリプトのテンプレートを提供。

●動作環境の拡大•仮想化環境(VMware,Hyper-V)に対応。

※ Tomcat、 WebOTX、 WebLogic、 Oracle、 IIS、SQL Serverなど

<導入効果と機能>

CLUSTERPRO MC ProcessSaver 1.2 for Windowsプロセスが異常終了しても自動再開させ業務を継続

②イベントログ通知

システム管理者

①監視/障害検出

③再起動

ProcessSaver

動作環境 :Windows Server 2012, Windows Server 2012 R2,Windows Server 2008,Windows Server 2003 他

製品URL :http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 :H26年4月8日型番 :UL1438-302 他価格(最小構成): 220,000円(シングル構成、CPUライセンス、メディア含む場合)

監視対象プロセス

・同一名のプロセス・関連するプロセスのグループ

異常終了 ハングアップ

障害

Page 13: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 12

業務が突然停止。手動での業務再起動まで業務が停止し、復旧後は障害箇所の特定に人手と時間を要した。

依存するプロセスが異常終了した場合、依存関係を考慮して自動再起動することで業務停止時間を最小限へ短縮。異常終了したプロセスをログに通知するため、障害箇所の特定と対処が短時間で可能。

業務プロセスが依存するプロセスが異常終了したことで業務プロセスも停止したが、情報がログに出力されなかった。

障害事例

導入効果

原因

幅広いプロセスの柔軟な監視

業務アプリミドルウェア

OSデーモン

同一名のプロセス グループ化されたプロセス

プロセスA

プロセスA

プロセスA

プロセスA

プロセス1

プロセス2 プロセス4プロセス3

ProcessSaver多様なプロセスを柔軟に監視可能

© NEC Corporation 2014

Page 14: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 13

様々な手段でプロセスのハングアップを検出

プロセス

ProcessSaver

業務が突然停止。業務プロセス自体は起動しており原因がわからず、手動での業務再起動まで業務が停止。

業務プロセスは起動していたもののハングアップ状態で、情報がログに出力されなかった。

障害事例

監視対象に応じて様々な手段でプロセスのハングアップを検出。ハングアップしたプロセスを自動再起動することで業務停止時間を最小限へ短縮。異常終了したプロセスをログに通知するため、障害箇所の特定と対処が短時間で可能。

導入効果

原因

プロセス プロセス

監 視 対 象 プ ロ セ ス が 定 期 的 にフ ァ イ ル を 更 新 し て い る 場 合 、ファイルのタイムスタンプを監視

プロセスが起動するスレッド数の変化を監視(*1)

プロセスがオープンするファイル数の変化を監視(*1)

(*1) Linux 版のみ提供している機能です。

© NEC Corporation 2014

Page 15: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 14 © NEC Corporation 2014

イメージ図

NEC優位性

OS ディスクの障害発生時にシステムログに障害を通知。両系障害発生時には、クラスタウェアと連携してノード切替することでシステムの安定稼働を実現。

<製品概要>

●多彩なディスク監視機能により障害を早く確実に検出•OSディスクを構成する論理ディスク(LUN)の死活監視。

•I/Oリクエストの無応答やメディアエラーを検出。

•管理領域および未使用領域も含むディスク全面セクタ検査。

●I/O リトライによる OS 高負荷を警告•メディアエラー(セクタ不良など)が発生したOSディスクを通知。

●HW-RAID での片系故障の検出による障害の未然防止•ディスクの全障害に至る前に通知し、予防保守を促す。

●動作環境の拡大•Oracle Linux/UEK に対応。•仮想化環境(VMware)に対応。•HP ProLiant DL380 のHW-RAID環境に対応。

<導入効果と機能>

CLUSTERPRO MC RootDiskMonitor 1.2 for Linux

・未使用領域を含む全領域へのディスク故障調査(メディアエラー等)により、運用中の障害を未然に防止。

OSディスクの障害を早期に検出し、業務を安定して継続

PV1

障害OSディスク

ミラーリング

PV2システムログ

①OSディスクの死活監視及び、ストール監視

異常検知→ディスク故障通知

RootDiskMonitor

③ノード切り替え※両系障害の場合

コマンドにより、監視の一時停止/再開やパラメータの動的変更が可能

②システムログコンソール通知

動作環境 : Red Hat Enterprise Linux 5、 Red Hat Enterprise Linux 6Oracle Linux 6 他

製品URL : http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 : H26年4月8日型番 : UL4441-302 他価格(最小構成): 185,000円 (シングル構成、CPUライセンス、メディア含む場合)

クラスタウェア

Page 16: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 15 © NEC Corporation 2014

イメージ図

NEC優位性

OS ディスクの障害発生時にイベントログに障害を通知。両系障害発生時には、クラスタウェアと連携してノード切替することでシステムの安定稼働を実現。

<製品概要>

●多彩なディスク監視機能により障害を早く確実に検出•OSディスクを構成する論理ディスク(LUN)の死活監視。

•I/Oリクエストの無応答やメディアエラーを検出。

•管理領域および未使用領域も含むディスク全面セクタ検査。

●I/O リトライによる OS 高負荷を警告•メディアエラー(セクタ不良など)が発生したOSディスクを通知。

●動作環境の拡大•仮想化環境(VMware,Hyper-V)に対応。

<導入効果と機能>

CLUSTERPRO MC RootDiskMonitor 1.2 for Windows

・未使用領域を含む全領域へのディスク故障調査(メディアエラー等)により、運用中の障害を未然に防止。

OSディスクの障害を早期に検出し、業務を安定して継続

PV1

障害OSディスク

ミラーリング

PV2イベントログ

①OSディスクの死活監視及び、ストール監視

異常検知→ディスク故障通知

RootDiskMonitor

③ノード切り替え※両系障害の場合

コマンドにより、監視の一時停止/再開やパラメータの動的変更が可能

②イベントログコンソール通知

動作環境 : Windows Server 2012, Windows Server 2012 R2,Windows Server 2008,Windows Server 2003 他

製品URL : http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 : H26年4月8日型番 : UL1441-302 他価格(最小構成): 185,000円 (シングル構成、CPUライセンス、メディア含む場合)

クラスタウェア

Page 17: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 16

年次処理時に突然サーバダウン。その後 OS は起動できたがサーバダウンが頻発し、障害箇所の特定に人手と時間を要した。

OS や業務アプリケーション、バックアップソフトが問題のあるセクタへアクセスすることにより発生する、I/O エラーや I/O リクエストの無応答を未然に防止

通常運用時にアクセスしない領域でメディアエラーが発生していたが年次処理でメディアエラー領域にアクセスし顕在化

障害事例

導入効果

原因

ディスクの全面検査で不良セクタを早期発見

OS からのアクセス業務 I/O

通常運用で頻繁にアクセスする領域

メディアエラーセクタ

パトロールシーク機能による検査領域

通常運用でアクセスしない領域はメディアエラー自体が表面化せず、年次処理やOSバックアップなどで表面化し、障害となる場合がある。

I/OエラーやI/Oリクエストの無応答の発生によりシステムへの影響大

全ディスク領域を定期的にテストアクセスするため、メディアエラーセクタの早期検出が可能

パトロールシーク機能(*1)

(*1)未使用箇所を含むディスクの全面検査を行う機能

RootDiskMonitor 未導入時

OS からのアクセス業務 I/O

RootDiskMonitor 導入時

© NEC Corporation 2014

Page 18: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 17

片系障害の検出により予防保守が可能(*1)

ミラー

RAIDコントローラ

物理ディスク

論理ディスク

内蔵ディスクを冗長化していたが、両系障害が発生しサーバダウン。ディスク交換を行うまで業務が停止。

片系障害時に情報が通知されなかったためそのまま運用を続け、両系障害に至った。

障害事例

導入効果

原因

ディスクの片系障害を検出し、通知することで両系障害に至る前に予防保守を行うことが可能。

(*1) HW-RAID の片系障害の検出は、Express5800、NX7700xシリーズかつ Linux 環境で対応しています。

Linux で HW-RAID 環境の場合

RootDiskMonitor

© NEC Corporation 2014

Page 19: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 18 © NEC Corporation 2014

イメージ図

NEC優位性

クラスタシステムを構築する 共有ディスク装置の障害監視を実施。

<製品概要>

●経路を含めたストレージ監視により業務のエラーや性能低下を早く確実に検出

•サーバとストレージ装置間を結ぶ I/O パスの死活および無応答を監視。

•間欠障害による頻繁なパス切替の原因を検出、予防してディスクI/O性能の低下を防止。

•VG (Volume Group)監視により、業務エラーを論理ディスクのレベルで早期に検出。

•障害として検出するのが難しい周期の短い間欠障害も検出。

●クラスタ連携によるダウンタイム短縮•I/O パスの両系障害時には、クラスタウェア連携による

フェイルオーバで業務を継続。

●iSCSI 接続のディスクへの対応●動作環境の拡大

•Oracle Linux/UEK に対応。•仮想化環境(VMware)に対応。•VMwareが管理するストレージへの物理パスの状態を監視。•SANBoot 環境における OS ディスク監視に対応。

<導入効果と機能>

CLUSTERPRO MC StorageSaver 1.2 for Linux

・間欠障害時の頻繁なパス切替の原因を検出、予防してパフォーマンス低下を防止。

ストレージの障害を早期に検出し、業務を安定して継続

②障害を検出③システムログに通知

④障害を検出したI/Oパスを切り離し⑤マルチパス管理製品が

正常なパスを使用してI/Oを継続FC: Fibre Channel

FCカード

FCカード

StorageSaver

マルチパス管理製品

業務AP

①ストレージ資源を監視

動作環境 : Red Hat Enterprise Linux 5、 Red Hat Enterprise Linux 6Oracle Linux 6 他

製品URL : http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 : H26年4月8日型番 : UL4440-302 他価格(最小構成): 360,000円 (シングル構成、CPUライセンス、メディア含む場合)

FC(副)FC(正)障害

Page 20: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 19 © NEC Corporation 2014

イメージ図

クラスタシステムを構築する 共有ディスク装置の障害監視を実施。

<製品概要>

●経路を含めたストレージ監視により業務のエラーや性能低下を早く確実に検出

•サーバとストレージ装置間を結ぶ I/O パスの死活および無応答を監視。

•間欠障害による頻繁なパス切替の原因を検出、予防してディスクI/O性能の低下を防止。

•VG (Volume Group)監視により、業務エラーを論理ディスクのレベルで早期に検出。

●クラスタ連携によるダウンタイム短縮•I/O パスの両系障害時には、クラスタウェア連携による

フェイルオーバで業務を継続。

●iSCSI 接続のディスクへの対応●動作環境の拡大

•仮想化環境(VMware,Hyper-V)に対応。•SANBoot 環境における OS ディスク監視に対応。

<導入効果と機能>

CLUSTERPRO MC StorageSaver 1.2 for Windowsストレージの障害を早期に検出し、業務を安定して継続

動作環境 : Windows Server 2012,Windows Server 2012 R2,Windows Server 2008,Windows Server 2003 他

製品URL : http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 : H26年4月8日型番 : UL1440-302 他価格(最小構成): 360,000円 (シングル構成、CPUライセンス、メディア含む場合)

NEC優位性

・間欠障害時の頻繁なパス切替の原因を検出、予防してパフォーマンス低下を防止。

②障害を検出③イベントログに通知

④障害を検出したI/Oパスを切り離し⑤マルチパス管理製品が

正常なパスを使用してI/Oを継続FC: Fibre Channel

FCカード

FCカード

StorageSaver

マルチパス管理製品

業務AP

①ストレージ資源を監視

FC(副)FC(正)障害

Page 21: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 20

ディスク I/O のスループット低下防止

×

正系 副系 副系

ディスクアレイ装置

間欠障害

頻繁な切り替わり発生

間欠障害

障害が発生したノード内では I/O パスの監視が継続されます。障害が発生したノード内の I/O パスの監視で正常に見えると切り戻しが発生します。そのため間欠障害ではノード内の I/O パスが頻繁に切り替わり、ディスクアクセスが遅延する可能性があります。

障害を検出すると正系から副系へ切り替わります。障害が発生したノード内の I/O パスを閉塞することができるので、間欠障害でも頻繁な切り替わりは発生しません。

ディスク I/O のスループットが低下

StorageSaver が障害の発生した I/O パスを閉塞。間欠障害時の頻繁な I/O パスの切替による業務のスローダウンを防止し、安定した業務継続を実現。

間欠障害により I/O パスの切り替えが頻発し、ディスクアクセスが遅延。

障害事例

導入効果

原因

マルチパス管理製品

閉塞

StorageSaver

ディスクアレイ装置

StorageSaver 未導入時 StorageSaver 導入時

マルチパス管理製品

© NEC Corporation 2014

Page 22: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 21

Oracleデータベースシステムを監視し、業務停止につながる障害を早期に検出。障害発生時には、Oracleプロセスの再起動もしくはクラスタ連携によるフェイルオーバで業務停止時間を最小化。

<製品概要>

●Oracleに特化した監視で障害を早く確実に検出•インスタンス、リスナ、Oracle Clusterwareの障害(停止、無応答)を監視し、早期に障害を検出。

•無応答に至る前の予兆検出も可能。•Oracle Data Guardによるディザスタ・リカバリ構成のスタンバイデータベースを監視し、スタンバイサイトとしての異常を検出。

●クラスタウェア連携によるダウンタイム短縮•障害発生時には、Oracleプロセスの再起動、クラスタウェア連携によるフェイルオーバ/ノード縮退で業務を継続。

•障害種別(停止、無応答)ごとにクラスタウェア連携動作の指定が可能。「停止障害時は自動復旧、無応答障害時はオペレータ介入」といった運用にも柔軟に対応。

●障害情報の自動採取による原因特定までの時間短縮•インスタンス障害はバックグラウンドプロセス単位で特定。•障害検出時には、原因究明に必須となる情報を自動的に採取。

●動作環境の拡大•Oracle Linux/UEK に対応。•仮想化環境(VMware)に対応。•Oracle Database 12c に対応し、マルチテナント・アーキテクチャ構成のデータベースの監視が可能。

<導入効果と機能>

•Oracleのバックグラウンドプロセス単位での障害監視により、障害箇所をバックグラウンドプロセスレベルで特定が可能となり、原因究明、対処までの時間を短縮。

CLUSTERPRO MC ApplicationMonitor 1.2 for LinuxOracleデータベースシステムを監視し、業務停止につながる重大問題を回避

NEC優位性

イメージ図

動作環境 :Red Hat Enterprise Linux 5、 Red Hat Enterprise Linux 6Oracle Linux 6 他

製品URL :http://jpn.nec.com/clusterpro/mc_ha/index.html出荷開始日 :H26年4月8日型番 :UL4437-302 他価格(最小構成):1,322,500円(シングル構成、CPUライセンス、メディア含む場合)

②システムログ通知

システム管理者

© NEC Corporation 2014

スタンバイサイトプライマリサイト

Oracle Data Guard

ApplicationMonitor

Oracle Data Guard

障害同期遅延

ApplicationMonitor

異常検知予兆検知

通信

①監視

Page 23: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Oracle のインスタンス無応答状態下での業務継続

アーカイブログ出力先のローカルディスク容量が100%になり、アーカイブ処理が終了せず、データベース更新ができない状態だった。

原因

業務が突然停止。手動での業務再起動まで業務が停止し、復旧後は障害箇所の特定に人手と時間を要した。

障害事例

ApplicationMonitor はアーカイブログ出力先のローカルディスク空き容量の監視が可能なため、無応答状態の発生を未然に防止可能。また、インスタンスの無応答障害に至ってしまった場合でも障害を検出し業務は待機系へフェイルオーバすること(*)で業務停止時間を最小限へ短縮。

導入効果

DBサーバ

APサーバ業務AP

業務

接続中の業務は遅延

(*)アーカイブログ出力先が共有ディスクの場合でも、現用系と待機系で別パーティションであれば、待機系での業務継続が可能。

DBローカルディスク

無応答障害でデータベースの更新不可

Oracle Databaseアーカイブログ出力先のディスク容量がひっ迫し、処理が遅延

DBサーバ

業務

DBローカルディスク

ApplicationMonitor

空きディスク容量を監視

別のディスク

APサーバ

業務AP処理遅延

Page 22

業務継続

ログ退避

ApplicationMonitor 未導入時 ApplicationMonitor 導入時

© NEC Corporation 2014

Oracle Database

Page 24: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 23

クラスタシステムのリソース監視を補強する製品。ハングアップ/パニックにつながる障害監視(異常監視)により業務停止を最小限にし、クラスタシステムダウンを防止。

<製品概要>

CLUSTERPRO MC ResourceSaver 1.0 for Linuxクラスタシステムを補強し、可用性の向上を実現

待機サーバ

・システムログ通知

MC SCOPE (*1)

監視リソース

仮想リソース

FC LAN障害

システム管理者

現用サーバ

待機サーバへフェイルオーバ

OSFileSystem

CPU

ResourceSaver

障害

イメージ図

動作環境(*3) : Red Hat Enterprise Linux 5、 Red Hat Enterprise Linux 6

Oracle Linux 6 他製品URL : http://jpn.nec.com/clusterpro/mc_ha/index.html

出荷開始日 : H24年10月12日型番 : UL4442-102 他価格(最小構成): 412,500円(シングル構成、CPUライセンス、メディア含む場合)

●無用な回復動作を防いでダウンタイム短縮(*1)

•複数のリソースをグループ化し1つの仮想リソースとして監視し、各種演算式により仮想リソースの障害判定条件を細かく設定可能。これによって業務継続不可となり真に回復動作が必要な状況を正確に判定可能。

•障害検出時に監視をリトライし、間欠障害や一時的な高負荷状態でのフェイルオーバ発生を防止。

●ファイルシステムの障害検知により、障害を局所化(*2)

•I/Oエラーによるリマウントを検知し、データ破壊が進行しないよう保守を促す。

●全CPUに対してウォッチドッグ方式のスケジューラ監視(*2)

•CPU障害およびCPU異常負荷によるスケジューラ異常を迅速に検知。

<導入効果と機能>

(*1) MC SCOPE (障害監視や原因究明に必要な詳細ログを記録する NEC 製ミドルウェア) が必要です。MC SCOPE は Enterprise Linux with

Dependable Support に含まれます。(*2) 本機能は OS が Red Hat Enterprise Linux 6、Oracle Linux 6 の場合

利用可能です(*3) 動作環境の詳細については下記 URLをご確認ください

http://jpn.nec.com/clusterpro/mc_ha/environment.html

© NEC Corporation 2014

Page 25: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 24

業務が突然停止し、しばらくしてフェイルオーバ。その間業務が停止した。復旧後は障害箇所の特定に人手と時間を要した。

全CPUまたは、全コアを対象としてCPU監視を行い、ハングアップの予兆を検知。

障害情報を収集した後に、必要に応じてフェイルオーバまたは、リブートすることが可能。これにより、業務への影響を最小限にすることが可能。

特定のCPUが応答しなくなったことにより、プロセスのデッドロックが発生。この影響でシステムがハングアップしたが、ログなど情報が残っていなかった。

障害事例

導入効果

原因

ResourceSaver

全CPUの監視により、業務影響を最小化(*1)

ハングアップ

原因特定が困難

ResourceSaver 未導入時

運用中

CPU異常発生

業務停止

障害情報収集

ResourceSaver 導入時

運用中

CPU異常発生

ダウンタイム縮小

フェイルオーバ/リブート

CPU障害を検知

(*1) 本機能は OS が Red Hat Enterprise Linux 6 の場合利用可能です

© NEC Corporation 2014

Page 26: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 25

NEC開発製品ですので、ユーザサポートも安心です!

お問い合わせ先

▐ 本製品に関するご相談、お問い合わせは下記までお願いいたします。

問い合わせ先 : [email protected]

▐ 以下製品サイトより製品マニュアルなどがダウンロードいただけます。

URL : http://jpn.nec.com/clusterpro/mc_ha/index.html

© NEC Corporation 2014

Page 27: CLUSTERPRO MC (HA - NEC(Japan)...Page 3 CLUSTERPRO とCLUSTERPRO MC (HA) の監視範イメージ サーバ ネット ワーク ディスク OS アプリ) ケーション CLUSTERPROは広く、浅く。Page

Page 26Page 26 © NEC Corporation 2013