ページの本文へ

Hitachi

日立ソリューションズ システム運用管理ソリューション

システム運用管理ソリューション

お役立ち情報 講演レポート

2022年6月9日

属人化を解消!AI活用により実現する運用管理のDXとは
~ビジネスを止めないために「監視・分析・管理」の視点から考える~


02デジタルオペレーターの適用で作業効率アップ
~システム監視のイベント振り分けや稼働レポート作成を支援~

膨大なイベント確認や、性能データ分析など、熟練者に頼りがちな作業について、AIを活用したIT運用デジタルオペレーターに任せることで作業効率が大幅にアップします。本セッションでは、人とAIの共存による運用の省力化について紹介されました。
株式会社日立製作所 サービスプラットフォーム事業本部
クラウドマネージドサービス本部 運用管理プラットフォーム部
主任技師 雨宮 廣和 氏

IT運用現場の属人化を解消 AIOpsを活用したオペレーター

ITの運用現場ではシステムの継続的な安定稼働をめざし、障害イベントの対処を速やかに確実に行うことが必須です。一方で作業が属人化するため、効率化が難しいのが現状です。これらの課題を解決するのが、「AI for IT Operations」(以下AIOps)を活用したオペレーターです。日立ではこれを「IT運用のデジタルオペレーター」と呼んでいます。
「当社がめざすAIとの融合は『人とAIの共存』であり、共存を通じて運用の効率化、省力化を目指します。最終的にNoOpsへとつなげ、お客様のシステムの安定稼働やコスト削減を実現します」(雨宮氏)。

3つの業務を任せて効率的、スピーディーに実行

具体的には「イベント監視」「月次レポート作成」「性能障害対応」の3つの業務を任せることができます。まずは「イベント監視業務」です。イベントの対処手順の検索、静観、一次対処、エスカレーションの判断、作業をデジタルオペレーターに任せ、イベントを分析し、監視から一次対処までの一連の作業を、タイムリーに確実に実行します。
次は「月次レポート作成業務」で、作成をデジタルオペレーターに任せることで、過去の性能データの傾向を分析、報告対象月の性能データと比較し、傾向、変化を自動抽出してリスクを指摘。自動で問題点を絞り込み、効率的でスピーディーな月次報告を実現します。「性能障害対応」では、サイレント障害などの性能障害について、事前に障害要因をモデル化し、過去の性能データとともに、デジタルオペレーターに学習させます。システム稼働時は、業務システムのインフラ、アプリケーションなどの性能データを監視してアラームを上げることで、システムの保守SEは、性能障害の検知、通知を受けることができます。
AIで実現するIT運用のデジタルオペレーター

AIで実現するIT運用のデジタルオペレーター

デジタルオペレーターと人が協調する運用省力化のイメージとは

これらの内容を踏まえ、デジタルオペレーターと人の作業分担という観点でのユースケース(図)が紹介されました。イベント監視業務にデジタルオペレーターを適用したイメージを表したものです。デジタルオペレーターは、「JP1/IM2」のイベントデータを分析し、何をすべきか判断して「JP1/AO」で実行。ログの採取、インシデントの登録、関係者への通知など、自動化可能な作業全般を「JP1/AO」で実行します。
「運用オペレーターは、デジタルオペレーターのAI判断が正しいかを確認。保守SEから指示された本対処を実行しますが、これも「JP1/AO」に実行指示することで効率的に行えます。このようにデジタルオペレーターと人が協調して、イベント監視業務を効率的に行うことができます」(雨宮氏)。
ユースケース紹介(イベント監視)

ユースケース紹介(イベント監視)

デジタルオペレーター適用後 運用前の約半数の工数に

また、デジタルオペレーターを適用した場合の効果についても述べられました。例えば、1カ月に発生する監視対象イベント数が3,400件程あり、1カ月当たり2.8人月の工数がかかっている状況では、適用後に判定や一次対処の工数が削減され、運用前の約半数の工数で済みます。
「月次レポート作成業務にデジタルオペレーターを適用した場合の効果では、データの傾向分析や閾値超過点の抽出、コメント生成といった作業を、人が行う必要がなくなりました。さらに稼働状況報告を、AIOpsが用意しているレポートGUIを用いることで、人が報告書を作成する必要もなくなり、作業工数は7割以上削減。また分析にも手間がかからなくなり、実質的に適用前の9割以上の工数削減となりました」(雨宮氏)。

AIOps導入により3人で行っていたイベント監視工数が1.5人に半減

次に導入事例として、大塚商会様の事例が紹介されました。4万台のサーバーから発生するイベント監視に適用したケースでは、日々膨大なイベントに対応。独自に設定したフィルターで、未知と判定されたイベントを人手で処理していました。文字列が一部異なるだけで、フィルターをすり抜けるイベントが大量存在し、対応に時間を要していました。
「しかし、デジタルオペレーター導入により、既知、未知イベントの判定を行い、人手によるイベント対応工数を半減させました。具体的には、AIOpsの導入で、3人で行っていた作業が、1.5人と半分の工数でできるようになりました」(雨宮氏)。
大塚商会様 導入事例

大塚商会様 導入事例

また、日立グループでのレポート作成業務への検証事例が述べられました。
「デジタルオペレーターの適用効果を検証した結果、運用SEが行っているような観点でのデータ分析をAIで自動化でき、またAIが適切なコメントを生成されることの確認ができました」(雨宮氏)。

AppDynamicsとのシナジー効果で未然に問題発生を防止

最後にAppDynamicsとの連携について解説が行われました。「性能監視ツール」にAppDynamicsを活用することで、性能監視から一次対処実行までの作業をタイムリーに実行。「月次レポート作成業務」では、これまでと違う傾向のコメントについて、AppDynamicsのメトリックデータから状況を調査し、適切な処理を行うことで、未然に問題発生を防止できます。そしてこの結果をAppDynamicsにフィードバックし、異常検知の基準を調整することも可能となります。
「本日ご紹介したAIOpsとAppDynamicsを組み合わせることで、シナジー効果が期待できます。ぜひ組み合わせてのご利用をお願いします」とセッションは締めくくられました。
IT運用最適化サービス

※株式会社日立製作所のサイトへリンクします。

NEXTセッション3:AIドリブンでのユーザー体感の監視
ページの先頭へ