年の瀬に Domino サーバのメールルーティングトラブル が発生しました。すべての Domino サーバで発生するトラブルで、影響は甚大です。Notes/Domino のトラブルでこれほど大きいのは珍しいですね。
発災からほぼ 3 ヶ月経ちましたので、対応も進み状況は落ち着いたのではないでしょうか?
私が管理するサーバも影響を受けたのですが、メーカーによる迅速なパッチ提供があり、それを適用することで回避できました。対応としては、最新の FixPack の適用とこのトラブルの Interim Fix を適用を行いました。
ただ、その作業でインストールトラブルに見舞われました。他の HotFix 適用など将来も起こりうる現象なので、後学のためにまとめておきます。
なお、本件の解決は、HCL Software の Customer Support に協力をいただきました。超ド級トラブルの最中だったので、サポート担当に皆さんは、私ら以上にパニック状態だったと思います。それでも、迅速かついつも通りの丁寧な対応をくださいました。解決できてありがたいのはもちろんですが、それ以上に感心いたしました。IT 担当者として見習わなくては...。
トラブル①:インストール中のエラー
まずは、FixPack インストール途中で発生したエラーです。
インストールを開始してしばらくたってから「RenameTempFiles: ERROR: Can't rename・・・」のエラーが発生し、インストールに失敗するというものです。
このエラーについては、以下の技術情報がありました。この記事によると Windows Management Instrumentation サービスが実行していることが原因だそうです。
トラブル②:インストーラが起動しない
インストールのトラブルはもう一つあり、FixPack のインストーラを実行したら "Notes/Domino or a Notes/Domino related process is still running." とメッセージが表示され、インストーラが起動しないというものでした。
この問題もすでに技術情報がありました。
エラー発生の原因として、以下の 6 点が挙げられていますが、3 に起因して発生しています。またしても Windows Management Instrumentation サービスが原因だったのです。
- Domino サーバー関連のプロセス(nsd.exe も含めて主に "n" で始まるプロセス、scontroller.exe、jconsole.exe)およびサービスが終了していない。
- バックアップソフト、もしくはウィルススキャンソフトが Domino サーバーのファイルにアクセスしている。
- Windows Management Instrumentation サービス (WmiPrvSE.exe) が稼動している。
- Fix Pack もしくは Hotfix のインストーラーを管理者権限で実行していない。
- Fix Pack もしくは Hotfix のインストーラーが OS のプロパティにて「読み取り専用」にチェックされている。
- Windows 側(OS 側)で、インストール先のフォルダに書き込み禁止権限が設定されている。
インストール手順
先の技術情報では『Windows Management Instrumentation サービスを停止する』とだけしか書かれていませんが、停止するだけではエラーが継続する現象がありました。これについては OS を再起動することで回避できました。
この経験を踏まえ、FixPack や Interim Fix の適用手順を改めて整理します。
1.Dominoサーバーサービスを無効に設定
サービスの一覧で Notes/Domino に関するすべてのサービスを無効化して、自動的に起動しないように設定します。
Windows OS を再起動します。1 の設定により Notes/Domino 関連のサービスは起動しない。
3.画面上で起動している、すべてのアプリケーションを停止
4.Windows Management Instrumentation サービス の停止
サービスの一覧からサービスを停止します。その際、関連するサービスの停止を確認するメッセージが表示されますので、停止させます。停止するサービスは、1 つの場合と 2 つの場合がありました。
5.一時ファイルをすべて削除
コマンドプロンプトから set コマンドを実行し、TMP および TEMP 環境変数の示すディレクトリを確認、その一時ディレクトリを空にします。
6. その後 FP や IF をインストール
インストーラは、管理者権限で実行します。
まとめ
今回は、FixPack のインストール時に発生した Windows Management Instrumentation サービスによるエラーについて記述しました。
今回のトラブルは緊急対応だったため、準備もなく対応に当たりました。FixPack のインストールだけだったので、作業としては安易に考えており、業務時間中にサーバを停止してのぶっつけ本番作業としました。インストール途中でエラーが発生した時には、原因調査と並行して、ユーザを待たせないよう Domino サーバを起動することとなり、「中途半端な状態で、正常に起動するのか?」と 肝を冷やしました...。
このようなことにならないよう日頃から、手順を明確にしておくべきと再認識した次第です。サーバ管理者として、まだまだ半人前ってことですね...。
ちなみに、インストールエラーでキャンセルした後に起動した Domino サーバは、作業前の FixPack で無事稼働しました。インストーラってよくできているんですね。
0 件のコメント:
コメントを投稿