シスコの IT 運用における AI: 金の針を未曾有量の干し草の山から探し出す

この記事は、シスコの IT カスタマー ストラテジー&サクセスのシニア IT マネージャーである Rich Gore によるブログ「AI in Cisco IT Operations: Finding Golden Needles in Ever Larger Haystacks(2019/4/17)の抄訳です。

お客様から、人工知能(AI)はアナリストが予測しているようなゲーム チェンジャーとなるのかどうかをよく尋ねられます。私が見るところ、答えは間違いなくイエスです。

 

成功の鍵は、適切なユース ケースを見い出すことです。どんなコンピュータでも私のくしゃみより速く円周率を 100 万桁まで計算できるように、数十億件のデータを通読して 1 つの質問に答えるのに AI 計算領域が 1 つあれば足ります。問題は、AI それ自体だけでは、質問すべき内容やそれに対する回答の仕方はわからない、ということです。しかし人間が質問を適切に整えてやりさえすれば、AI は天文学的な量の情報を読み込んで有意なパターンを探し出します。AI が干し草の山をかき分けて 1 本の針を見つけられるようにするには、まず人間が針を定義する必要がある、ということです。

シスコ IT は、多数の独立したチームを通じて AI への取り組みを開始しました。私の耳に入ったものだけで 40 を超えるプロジェクトがあり、それぞれの利用グループ(マーケティング、InfoSec、コンタクト センターなど)が費用を負担しています。IT、エンジニアリング、マーケティングといったシスコのさまざまなチームがすでに、範囲を拡大するべく、それぞれの AI の取り組みを集約しています。

以下に AI の活用例をいくつか紹介します。

 

セキュリティ

ゼロデイ マルウェアの検出

シスコが AI に初めて踏み込んだのは、マルウェア検出がきっかけでした。シスコは 2015 年に Stealthwatch テクノロジを買収しました。これは、当社のネットワークで内のトラフィックの移動に関する数十億個のデータ ポイントを選り分けて、ゼロデイ マルウェアの可能性がある異常な振る舞いを検出するものです。難しいのは、何が正常で何が異常なのかを AI エンジンに教えることです。たとえ話をしましょう。数百万人の来客を招いて夕食会を(大邸宅で)開くとしたら、泥棒かもしれない人をどうすれば特定できるでしょうか。ほとんどのセキュリティ防御では、シグネチャを確認します。この場合は、来客がドアを通るときに既知の犯罪者の人物写真を確認します。しかし、未知の泥棒を捕らえるためには、その振る舞いに注目する必要があります。夕食会の来客が邸宅内を歩き回り、他の来客とおしゃべりし、バーの周辺をうろうろするのは正常です。しかし、金庫のある施錠された部屋に直行したり、絵画の裏側を調べ始めたりするのは正常ではありません。それと同様なことがシスコのネットワークで発生したときには、Stealthwatch がアラームを出し、その脅威を隔離する措置をとります。このようにして、私たちはゼロデイ攻撃を定期的に発見しています。そのためには、毎日 280 億件を超える NetFlow レコードを選別するように Stealthwatch を設定し、許容できる正常な動作がどのようなもので、どのような動作がマルウェア攻撃の特徴であるかを、更新し続ける必要があります。しかしそれによって、他のツールでは不可能なことを確認できるのです。

暗号化されたトラフィック内のマルウェアを検出

 

ネットワーク トラフィックの 50% 超が暗号化されている現在、暗号化されたトラフィックに隠れたマルウェアは、従来の防御をすり抜ける可能性があります。しかし暗号化されたトラフィックを、言わば解読するのは困難なため、機械学習も必要になります。つまり、判別方法を教えることなく、マルウェアを見つけるよう AI プログラムに命令するのです。Stealthwatch の新しいアップグレードの 1 つ、暗号化トラフィック分析(ETA)と呼ばれる AI プログラムを使用することで、パケット長、到着時刻、初期ハンドシェイク データ パケットなど、ストリームが暗号化されたままでもマルウェアを示すいくつかの手掛かりを得ました。ETA は、シグネチャ分析または AI ベースの行動分析では見逃されたであろう、暗号化されたストリームのマルウェアを発見しました。

 

WAN 最適化

予測されるパフォーマンスに基づいて最適な回線でトラフィックをルーティング

シスコの中規模オフィスには、MPLS とインターネット VPN の 2 つの回線があります。セカンダリ回線をほとんどの時間アイドル状態にしておくのではなく、昨年より、Cisco Software Defined-WAN (SD-WAN) を使用してセキュアな WAN リンクをインテリジェントにプロビジョニングし、アプリケーション固有のトラフィックをそのジョブに適したその回線にルーティングするようにしました。この決定は、トラフィックのタイプ(音声、ビデオ、電子メールなど)と現在のネットワークの状態によって異なります(詳細については、同僚である Carol Goh のこのブログをご覧ください)。現在では、AI を使用して将来の回線の動作を予測することで、さらに的確な意思決定につなげています。たとば 60 分のライブ ウェビナーを放送するとします。現状では MPLS 回線のパフォーマンスが良好であるものの、30 秒後(または 17 分後)に低下する兆候が示されている場合、SD-WAN Manager を使用してバックアップ回線にトラフィックをルーティングするのが賢明です。

LAN のトラブルシューティング

問題が認識される前に特定してソリューションを推奨

Cisco Software-Defined Access(SD-A)には、AI 主導のデータ収集および分析プラットフォームが含まれます。シスコ IT ではすでに、3 つのグローバル地域(南北アメリカ、ヨーロッパ、アジア)に 1 つずつ、合計 3 つの主要な Cisco DNA Center(DNA-C)クラスタを展開しています。これらの AI クラスタでは、スイッチのトラフィックとパフォーマンスに関する大量の情報を収集し、個々のアプリケーションとユーザからのトラフィックを追跡しています(そのためには数千台のスイッチを Catalyst 9000 モデルに移行する必要がありました。Catalyst 9000 は、テレメトリ データを分析のために Cisco DNA-C にストリーミングするセンサーとして動作します)。Cisco DNA-C は、あらゆる AI ツールと同様、通常の動作とパフォーマンスをベンチマークします。パフォーマンスの低下を特定し、シスコ IT ネットワークに共通する 100 件を超える問題を参照します。適切なパターンが見つかった場合は、ネットワーク エンジニアにアラートを表示し、ネットワーク パス内のどこに問題があるかを正確に指摘して、そのパターンに基づく解決策を推奨します。続いて、中央の Cisco DNA コントローラが自動的に、関係するすべてのネットワーク デバイスに対して、推奨された変更を加えます。

Cisco DNA-C のワイヤレス アシュアランスの部分が非常に有用であることがわかりました。アクセス ポイント間を次々に接続して、建物内を歩いている人のパスをつなぎ合わせることで、その人の音声またはビデオのセッ
ションで問題が発生した場所と時点が正確にわかるだけでなく、クライアント デバイス、アクセス ポイント、有線ネットワークのどこに問題の根本原因がありそうなのかが特定されます。100 件を超えるよくある問題のいずれかと一致する場合は、修正方法を推奨し、その方法についてネットワーク エンジニアに一通り説明します。

 

データセンターの管理

変更管理の問題が発生する前に特定して解決策を推奨 

はるかに複雑なデータセンター環境でも、WAN と LAN の項目で説明したネットワーク ツールと類似した AI ツールが機能しています。何千ものアプリケーションとセキュリティ ポリシーが多様な組み合わせで存在し、ACI 全体にわたる仮想オーバーレイ ファブリックによって適用されている状態で、新しいアプリケーション ポリシーを問題なく展開するのは簡単ではありません。新しい AI ツールである Cisco Network Automation Engine(CNAE)は、存在しうる数百万種類の異なる接続の間で新しいポリシーの競合を自動的にチェックして、問題が生じる可能性がある箇所を確認し、望ましい結果を達成するための別のポリシーを推奨します。これにより、アプリケーションのセキュリティとパフォーマンスが最大に保たれ、データセンター内のどこかに設定の不備があるためにプロビジョニングが遅延するのを最小限に抑えられます。シスコ IT は現在、3 つの ACI ファブリック データセンターのうちの最大のデータセンターで CNAE を実行しています。

マーケティング

Web サイトを訪れるお客様にとっての次のベスト アクションを特定

シスコの中小企業のお客様は一般的に、cisco.com で製品の調査を行います。私たちは長年にわたり、Web の訪問者をフォローアップするさまざまな方法を試してきました。電子メールや電話でのフォローアップには特に効果がなく、スパムと思われる場合があります。

現在では、AI を用いて、お客様のビジネス ニーズや過去のやり取りに基づいた次のベスト アクションを見つけ出しています。私たちはマーケティング分析チームと協力して、cisco.com と Salesforce から情報を収集し分析するプラットフォームを構築しました。これは、お客様と過去にどのような手段で連絡をとったのか、どのようなコンテンツを提供したのか、(たとえば当社への連絡、製品ビデオの視聴、注文などを促すなどの)アクションによってお客様をセールス チェーンにつなげることができたかを調べるためのものです。その結果、特定のタイプの連絡にどのお客様が反応しそうであるのか、どのタイミングで購入を決定するのかを知ることができます。7 ヵ国 25 件のパイロット運用から得られた予備的な結果はとても有望なものです。顧客の反応率は 4 倍になり、反応につながらない社外コミュニケーションが 7 分の 1 から 10 分の 1 に減り、コストが削減されています。さらに良いことに、データの調整に時間を掛けるほど、長期的にみると回答率が向上することがわかりました。

 

コンタクト センター

カスタマー ジャーニーをより良いものに

シスコのコンタクト センターは、AI を最も多用しているユーザの 1 つです。次に例をいくつか示します。

  • 発信者とエージェント向けのセルフサービス。シスコ IT とコンタクト センター チームが協力して、AI 主導のナレッジ ツールである Cisco Answers を構築しました。
  • インテリジェント ルーティング。お客様から音声、電子メール、チャットでお問い合わせいただく場合、AI を用いてお客様が必要とするものを予測し、適切な専門知識を持つ最適なエージェントにつなぎます。一次解決率と顧客満足度の両方が向上しました。
  • 記録されたカスタマー コールから得られるビジネス インサイト。多くの企業と同様、当社ではエージェントのトレーニング用にコンタクト センターでのやり取りを記録しています。これらの記録は、マーケティングや製品開発などにとって情報の宝庫でもあります。1 日あたり 10 万件近いコールは、人間には扱いきれませんが、AI なら可能です。Verint の音声分析を使用して、記録されたコンタクト センターのやり取りのトレンドを把握するようにしました。たとえば、特定の地域の人とのやり取りで「ソフトウェア定義型」という言葉が急増しているとしたら、その地域でソフトウェア定義型ネットワーキングのマーケティング プログラムを強化することが考えられます。

 

サプライ チェーン

需要予測による在庫の最適化

その他の AI の活用を進める草の根的なプロジェクトは、営業、マーケティング、サプライチェーン等シスコ全体に広まっています。サプライ チェーンを例として見てみましょう。当社ではジャストインタイム(JIT)生産を行っているため、今日注文したシスコ サーバはまだ完成していない可能性があります。これを機能させるためには、必要なときに適切なコンポーネントを使用できることが必要です。1 ~ 2 ヵ月先の需要の予測精度が上がるほど、チップなどの注文数が不足して出荷が遅れるリスクが下がります。あるいは、注文数が多すぎて在庫が過剰になり、紛失や劣化のリスクが生じる可能性が抑えられます。AI のおかげで、UCS サーバのメモリ チップの在庫要件を 10 分の 1 に低減できそうです。

 

AI で広がる明るい未来。次のステップ

前述の使用例は、極めて複雑な意思決定プロセスを自動化するために AI の威力を活用するさまざまな方法の一例にすぎません。データがあり、計算能力があります。さらに必要なのは、ビッグ データ、AI、機械学習を理解する人材であり、私たちは現在、IT 人材のギャップを解消するために新しいスキルの習得と採用を進めています。

貴社では現在、IT 運用において AI をどのように使用していますか。また、こうあって欲しいという実践的で重要なものは何ですか。ぜひ以下からご意見をお聞かせください。