クレジット決済システム基幹ネットワーク更改

【案件概要】
クレジット決済システム基幹ネットワーク更改
【サマリー】
クレジット決済を使用するための基幹ネットワークの更新。全5ヵ年計画のうちの1年目で、主要拠点で構成された「基幹ループ」の更新。
概要構成としては、基幹ループをOSPFのバックボーンエリア(エリア0)とし、各主要拠点からさらにサブループを作ってエリアを分ける。(図1 概要構成図参照)

主要なネットワークであると同時に入館規制が厳しい構内に設置された機器の更改のため、作業はおよそ2時間程度で完了させる必要があった。
【予算感】
提案~展開/6人月
【エンジニアスキル】
提案、要件定義、基本設計、詳細設計、移行設計、プロジェクト管理(進捗管理、課題管理) ※CCNP、ネットワークスペシャリスト、プロジェクトマネジメント

本システムの特徴は何といっても数十km以上にもおよぶ長距離を自営の光ケーブルで構成しているところである。この特徴を活かし、リングプロトコル(※1)を使用した大きな一つのLANにするという提案も行ったのだが、今回はまだユーザ内にて同技術の導入実績がないことから、安心・安全をモットーに現行踏襲を基本とすることになった。

※1 リングプロトコル:LANスイッチをリング状に接続したネットワークにおいて、特別な制御フレームを使ってネットワークの状態を監視し、障害を検知するレイヤー2ネットワークの冗長化プロトコル。スパニングツリーより障害/復旧における収束時間が短いのが特徴。

まず、機器構成を確定させるために、現地調査を行ったのだが早速ここで一つ苦労した。今回の更改にあたり、新規機器は単純な入れ替えではなく新規に光ケーブルを準備するという方針から、各拠点間における新規光ケーブルの減衰量を計測し、そこからSFP(※2)などの必要部材の選定・調達を行う必要があった。

※2 SFP(Small Form Factor Pluggable) :光ファイバーを通信機器に接続する光トランシーバの規格の一つ。通信機器の筐体に並んだ専用の挿入口に装着して使用する

図1)概要構成図

図1)概要構成図

SFPの種類がいくつかあるのは知っていたが、あくまで目安距離でしか見ておらず光の減衰量まで考慮したことがなかったので、各SFPにおける送信レベル(dB)や受信レベル(dB)許容範囲を勉強し直し、実際の減衰量と照らし合わせて適切なSFP選定を行った。現調はユーザと一緒に回ったのだが、工事関係にとても博識で光にも詳しいため、最初は会話をするのにもなかなか苦労した…。
なお、現調による光減衰量の調査には「パワーメータ」や「OTDR」といった計測機器を使用した。また、光の受信レベルが強すぎる場合には、アッテネータと呼ばれる光減衰器を光ケーブルの先端に装着する必要があること、天候(霧や雨など)により減衰量が変わってしまうことがあるため、受信レベルにある程度マージンを取っておくことが大切ということなど、苦労した分とても良い経験にもなった。

基本設計・詳細設計については、OSPFによるルーティングを基本としており、各管区をエリア分けしているだけの至ってシンプルなネットワークである。更改後の次期ネットワークにおいてもルーティングは現行踏襲でOSPFを使用するため、変更点でいえば冗長化機能をHSRP(※3)からStack-Wise(※4)に変更するくらいであった。
そのため、基本設計・詳細設計における懸念事項や問題点は特になく、本案件において一番考慮が必要となったのは移行設計であった。

※3 HSRP(Hot Standby Router Protocol):デフォルトゲートウェイを冗長化するためのCisco独自のプロトコル。
※4 Stack-Wise:物理的には複数のスイッチを1台の仮想的なスイッチとして動作させる機能のこと。

移行設計では、上述した「新規に光ケーブルを準備する」という方針を要件としているため、必然的に単純な入替えによる更改はできないことを指していた。具体的には新規機器のみで新たなループ構成を構築し、旧機器ループと相互接続させ、クレジット決済機器を旧機器から新規機器に接続した後に旧機器のOSPF以外のインタフェースを停止していくという作業を順次行っていく方針となった。(図2 作業概要図参照)
旧機器においてOSPF含めたすべての動作を停止してしまうと、切り替えが完了していない拠点において冗長性が保てなくなってしまうため、旧機器はすべての切り替えが完了してから全停止および撤去するという運びとなった。

 

図2)作業概要図

図2)作業概要図

移行にあたり、まず新規機器のみで新たに準備された光ケーブルを用い新規ループを構築し、現地試験を行った。ここで実施した試験の内容はざっくりと、以下の3項目である。

1、ネットワークの正常性確認
2、光(SFP)の送信、受信レベルの正当性
3、性能評価

1については、単純にインタフェースやルーティング確認などよくあるものだ。2については、Cisco社製スイッチ(Catalyst)の場合、装着したSFPの光送信/受信レベルを確認できるコマンドが存在し、光受信レベルが閾値内に収まっているか確認可能なため、当該コマンドにより光受信レベルが正常値内であることの確認を実施した。3については、Access Oneという回線品質(スループットや遅延など)を測定できる機器を使用して、十分な回線品質が担保できているかの評価を実施した。
上記すべてにおいて問題ないことを報告し、ユーザから切り替えOKの判断を頂いた。

切り替えはユーザ含め要員数の関係で1日2拠点(隣接拠点)とし、これを順次行っていった。
展開作業においては、約2時間程度の許された時間内で完了させることが必須であった。システムの最終利用から次の開始までは実際には3時間程度あったのだが、切戻し作業やその他の調整事項などを踏まえると作業に使える時間は実質2時間程度。また、作業時間帯は構内で職務にあたっているユーザもいたため大きな物音を立てないなど、制約事項も色々とあり厳しい。

それでも、事前に展開作業スケジュールを綿密に計画・確認を行っていたため特に大きなトラブルを起こすことなく切り替えは順調に進んでいったが、とある拠点において一部箇所のみ後日切り替えという残作業を発生させてしまった。主要拠点の中でもかなり規模の大きな拠点では、拠点内LANが多数あり、ネットワーク機器もこのLANの数に応じて設置されることになる。そのため、想定していたよりも作業時間を要してしまい、2時間の作業枠に収めることができなくなってしまった。
幸いこれによる業務影響などは特に発生しなかったが、もう少し余裕を持たせるために当該拠点については当初から2日間に分けたスケジュール調整をするなど、反省点がいくつか残った。

その後は何も問題なく、すべての拠点の切り替えが完了し無事新規ループへの移行作業もほぼスケジュール通りに完了することができた。

一点、これは運用に関わるところの話だが、保守交換においての課題が残った。今回Stack構成していることは上述した通りで、このStackの際に使用するStackケーブルと呼ばれるものがスイッチ背面に接続されているのだが、拠点により搭載ラックの場所が狭く交換作業のスペースが十分に確保できず、このケーブルのみを外すといったことが困難であることが分かった。
現時点で故障などは発生していないが、保守交換になった際には片系のみの障害であっても、2台同時の交換となってしまうため、余計な作業と通信断を発生させてしまうこととなり、そもそも「Stackにする必要性があったのか?」といった提案・設計フェーズにも関わる反省点となった。

いくつかの課題・反省点はあったものの業務影響を及ぼすような大きな問題やトラブルがなかったことはお客様からも評価頂き、次年度以降も続くSTEP2、STEP3…へ向けての良い材料にできたと考えている。また、この案件の一番の収穫としては、よりエンドユーザに近いところで作業ができたことにより、ユーザ目線で物事を考える意識が強くなったことである。
今後も「お客様が求めるネットワーク」を共創し提案できるエンジニアを、あるべき姿として目指していきたいと思う。

powered by icons8