ソケットサイトのパフォーマンス問題のトラブルシューティング

概要

顧客はCatoに接続しているときに、アプリケーションのパフォーマンスに問題を経験する可能性があります。 パフォーマンスの問題は広範なトピックであり、物理層からアプリケーション層まで、さまざまなOSI層にわたって発生する可能性があります。 このプレイブックの主な焦点はTCP層までのパフォーマンス問題です。 アプリケーション層に関連するパフォーマンス問題はその他のプレイブックで議論されます:

症状

  • 遅いファイル転送、スループットの低下
    • Cato Cloudに接続すると、顧客はダウンロードとアップロードの速度が遅くなる場合があります。
  • アプリケーションの応答時間の遅延
    • これは、リモートデスクトップのようなインタラクティブなアプリケーションでより顕著になる可能性があります。 

考えられる原因

  • 誤った構成(QoS、ライセンス、TCPアクセラレーション、ウィンドウスケーリング)
  • ネットワーク輻輳
  • パケットロス(ISP、ラストマイル)
  • 非最適PoP 
  • 高いソケットCPU使用率 
  • 追加されたクラウドレイテンシー
  • ハードウェアの制限

問題のトラブルシューティング

さらなるトラブルシューティングを行う前に、これがCato Cloudに関連しているかどうかを隔離することが重要です。 それを行うために、Catoへの接続をバイパスして問題が存在するかどうかを確認できます。 Cato Cloudをバイパスすることで、その手順が詳細に説明されています。

接続をバイパスしたにもかかわらず問題が続く場合、これは問題がCatoによって引き起こされていないことを示します。 ただし、Cato Cloudへの接続をバイパスした後に問題が解決される場合は、さらなるトラブルシューティングと隔離のために以下の手順に従ってください。

ライセンスおよび帯域幅設定

注意: WAN帯域幅の割り当ては、サイトライセンスとインターフェースの帯域幅の構成に基づいています。 両方の値が異なる場合、より低い値がWANリンクに適用されます。

  • サイトに割り当てられたライセンスが正しいことを検証してください。 ネットワーク > サイト > サイト設定 > 一般 
  • WANインターフェースの構成された帯域幅が正しいことを検証してください。 ネットワーク > サイト > サイト設定 > ソケット > WANインターフェースを編集します。 
  • 中国およびベトナムのサイトの場合、ライセンスは異なります。 ライセンスはグローバルとリージョナルのライセンスに分割されます。 グローバルライセンスはグローバルサイトへの接続に使用され、リージョナルライセンスは国内での接続に使用されます。 
  • サイトライセンスの管理に関する詳細情報については、Managing-Site-Bandwidth-Licenses を参照してください。 

パケットロス

パケットロスは、Catoのインフラストラクチャ内またはインターネットサービスプロバイダー(ISP)で発生する可能性があります。 以下の手順は、パケットロスの原因を特定することを目的としています。

  • ネットワークアナリティクスでのパケットロス(上り/下り)を確認してください。

  • これが最終区間のパケットロスと一致する場合、ソケットのWANポートに接続されているケーブルのハードウェア問題またはインターネットサービスプロバイダー(ISP)の問題が示されます。

  • パケット損失の問題を解決するための提案については、パケットロス解決 セクションを参照してください。

パケット破棄(帯域管理)

ネットワークアナリティクスページで多数のパケット破棄が見られる場合、パケットが帯域管理(QoS)のために破棄されていることを意味します。 これによってアプリケーションが影響を受けているか確認するには:

  • ネットワーク > プライオリティアナライザー に移動し、どのクラスがパケットを破棄しているか確認し、アプリケーションが同じクラスに割り当てられているか検証してください。
  • もしそうであれば、このクラスのためにもっと帯域幅を割り当てることを検討してください。
  • または、影響を受けるアプリケーションが重要な場合、そのパフォーマンスを向上するために高い優先順位のクラスに移動してください。 クラスを設定する方法については、パケット破棄の解決(QoS) を参照してください。
  • パケット破棄のもう一つの理由は、マイクロバーストです。 それが何を意味するのか、どのように識別するのか、そして最終的に解決するためにどのような手順をとるべきかについては、マイクロバーストの確認を参照してください。

ソケットリソースの制限

ソケットがそのリソース制限に達すると、性能の低下が発生する可能性があります。

1. 最大対応スループット

  • ネットワーク > サイト > ネットワークアナリティクスに移動し、サイトのスループットが対応可能な制限内にあるかどうかを確認します。
  • 以下は我々のソケットモデルにおけるサポート最大トンネルスループットです:
    ソケットモデル 最大トンネルスループット
    X1500 500Mbps
    X1600 1Gbps
    X1600 LTE 1Gbps
    X1700 3Gbps
    X1700B 10Gbps
  • 詳細については、各データシートのCato-Socket-Deployment-Guidesを参照してください。 
  • 記載されている制限を超えた場合は、対応したスループット超過の解決方法を参照してください。

2. 高いソケットCPU使用率

  • ソケットリソースの過剰利用も性能の低下を招きます。  
  • ソケットWebUIから、HWステータスタブを選択します。 これにより、各コアの現在のCPU使用率を表示させることができます。 一貫して高いCPU使用率は、ソケットパフォーマンスに直接影響し、パケットロスを引き起こします。 
  • ネットワークパケットロスと同時に一貫して高いCPU使用率が見られる場合は、サポートに問い合わせてください。
  • 物理ソケットバージョン21.1および仮想ソケットバージョン22から、SocketのCPU使用率メトリックがCMAで可視化されるようになりました。 CMAのネットワークアナリティクスに移動し、ハードウェアタブを選択してください。

  • さらに、CPU使用率メトリックはソケットUIのHW状態タブでも利用可能です。

パフォーマンスに関する考慮事項: アクティブ/アクティブWANスループット

アクティブ/アクティブWAN環境では、すべてのデータフローが一時的に1つのWANリンクに集約され、利用可能な全てのリンクに均等に分配される代わりにアプリケーションスループットが制限される可能性があります。 このような場合、合計スループットは複数のリンクの帯域幅を利用するのではなく、1つのリンクの帯域幅によって制限されます。

この動作は、特に複数の同時フローに依存するSMBのようなプロトコルにおいて、パフォーマンスの期待に影響を与える可能性があります。 フローの分配は動的なネットワーク条件と内部アルゴリズムに影響され、リンク間でのバランスのとれた使用状況を常に保証するわけではありません。

注意: 複数のWANリンクで予想されるパフォーマンスに合わないスループットが観察された場合は、さらなる調査と支援のためにCatoサポートに問い合わせください。

サブ最適なPoP

Catoクラウドを使用すると、顧客はアプリケーションのパフォーマンスが遅くなったり、ダウンロード/アップロード速度が低下したりすることがあるかもしれません。

  • 検証のために、影響を受けたサービスでPINGテストを実行します。
  • 戻りRTTが期待されたよりも高い場合は、モニタリング> 接続構成に移動し、サイトをクリックして、サイトが最適なPoPに接続されていることを検証します。
  • 右窓のペインが表示されます。 ウィンドウペインの最下部にある"ログを表示"をクリックします
  • 別のウィンドウがポップアップします。 ISPが接続されたPoPの近くにあることを検証します。
  • これを解決するには、最適なPoPの解決を参照してください。

ネットワークルールの検証

  • 影響を受けた接続が正しいネットワークルールにヒットしていることを確認します。 
  • 影響を受けたアプリケーションがファイル共有またはWebアプリケーションの場合、TCP加速を有効にしたネットワークルールを作成し、そのルールをリストのトップに配置して隔離してください。 詳細については、TCP加速のベストプラクティスを参照してください。

追加されたクラウド遅延

  • SQLサービスのようなレイテンシーの変化に敏感なアプリケーションは、Catoクラウドに移行される際にタスク完了までに時間がかかる可能性があります。
  • WANを介してこれらのクエリを実行することにより導入される追加のレイテンシーは、わずか数ミリ秒であっても、クエリ数を考慮すると実際に積み重なります。
  • サイト間のレイテンシーを減らすために、TCP加速オフクラウドのようなCatoソリューションの実装を検討することをお勧めします。 またはAlt-WAN
  • AzureやAWSのようなパブリッククラウド環境でホストされているサービスは、Cloud Interconnectを利用してサイト間のレイテンシーを大幅に削減できます。
  • または、SQLクエリを修正してCatoクラウド上でのパフォーマンスを向上させることができます。

Windowsデバイス用のウィンドウスケーリング

  • TCP/IPにおけるウィンドウスケーリングは、より大きなウィンドウサイズの交渉を可能にし、各パケットでより多くのデータを送信できるようにしてパフォーマンスを向上させます。
  • これはデフォルトで有効化されているべきです。 これを確認するには、Windowsデバイス上でコマンドプロンプトを開き、netsh interface tcp show globalコマンドを実行してください。
  • "受信ウィンドウの自動調整レベル"という設定を探し、それが"標準"に設定されていることを確認してください。
  • 詳細はTCPウィンドウ拡張オプションの有効化を参照してください。

WindowsデバイスのためのTCPタイムスタンプオプション

  • Windowsオペレーティングシステムのデフォルト設定では、TCPタイムスタンプオプションはサポートされていません。 パケット損失をより的確に特定するために、パケットRTTの測定を改善するTCPタイムスタンプオプションを有効にしてください。
  • このオプションは、パケット損失が発生した場合にTCPスタックが再送タイマーを調整するのを支援します。
  • 次の手順に従ってWindowsコンピュータでTCPタイムスタンプを有効化することを推奨します:
    • Windowsでレジストリエディタを開きます。
    • 次のキーに移動しますHKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters
    • Tcp1323Optsという名前のキーを探します。 存在しない場合は、それをDWORD (32ビット)値として作成し、Tcp1323Optsと名前を付けます。 値を2に設定します。
    • システムを再起動します。
  • TCPタイムスタンプのステータスを確認するには、コマンドプロンプトからnetsh int tcp show globalを実行します。 RFC1323タイムスタンプを有効にする必要があります。

iPerfテスト

  • 問題を特定するためのもう一つのトラブルシューティングツールにiPerfがあります。 iPerfテストは、ネットワークにおける最大の実現可能なスループットを測定するために使用することができます。 これはネットワークと接続性テストの一部としてソケットWeb UIに含まれており、ツールタブからアクセス可能です。
  • Socket Web UIでのiPerfテストの実施についての詳細は、iPerfを使用したリンクテストを参照してください。
    注: より正確な結果を得るために、混雑制御を考慮しないUDPをテストプロトコルとして使用することをお勧めします。 このテストは、リンクの最大の実現可能スループットを判断することを目的としています。

(オプション)エクスペリエンス監視ラストマイル

  • エクスペリエンス監視ライセンスを持つ顧客は、可能性のあるパケット損失やパケット破棄を確認するためにラストマイルとアプリケーションパフォーマンスタブを確認できます。 データは、どこから問題が発生しているのかをより理解するために、サイトのネットワーク分析タブにある結果と関連付けることができます。

オフクラウド

  • テスト目的で、2つのサイト間にオフクラウド構成を検討してください。 このアプローチにより、クラウド内とオフクラウド間のパフォーマンスを比較できます。
  • パフォーマンスがオフクラウドでより良い場合、これはパフォーマンス問題の永続的な解決策になる可能性があります。
  • ただし、注意点として、カト脅威保護エンジンはオフクラウドトラフィックを検査しません。
  • 構成の詳細については、オフクラウドリンクへのトラフィックルーティングをご参照ください。 

検出された問題の解決

誤設定の解決

パケットロスの解決

  • ラストマイルパケットロスが存在する場合は、ソケットのWANポートに接続されたケーブルを交換してください。
  • 可能であれば、ソケットおよびアップストリームデバイスの別のWANポートに接続してください。 それでもラストマイルパケットロスの問題が改善されない場合は、プロバイダーに連絡して問題をさらに隔離してください。 
  • 高いパケットロスが観測される場合は、VoIPトラフィックに対するパケットロス軽減を有効にすることを検討してください。 詳細については、トラフィックの最適化を参照してください。
  • パケットロスの詳細なトラブルシューティングについては、ソケットサイトのパケットロスのトラブルシューティング方法をご覧ください。

パケット廃棄(QoS)の解決

  • クラスにより多くの帯域幅を割り当てるには、ネットワーク > 帯域管理を開き、影響を受けたクラスを選択し、制限値を変更してください。
  • 影響を受けたアプリケーションをより高い優先度のクラスに移動するには、影響を受けたアプリケーションの既存のネットワークルールを編集し、帯域幅優先度を低い値に変更してください(値が低いほど、優先度は高くなります)。 別の方法として、新しいネットワークルールを作成し、帯域幅優先度に低い値を割り当ててください。
  • 帯域管理に関する詳細なガイドについては、帯域管理プロファイルの設定を参照してください。

サブ最適PoPへの接続の解決

  • デバイスが最適なPoPに接続されていない場合は、「優先POPロケーション」の設定が構成されているか確認してください。 これを行うには、ネットワーク > サイト > サイト設定 > 一般 > 優先POPロケーションに移動してください。 設定が間違って設定されていた場合は、最適なロケーションを選択してください。
  • ソケットは、ネットワーク > サイト > コネクションSLAで設定された新しく定義された優先PoPに自動的に再接続されます。ただし、優先POPへの再接続アクションを使用して、手動で再接続をトリガーすることもできます。優先PoPロケーションに手動で再接続するに記載された方法に従ってください。

サポートされているスループットを超える問題の解決

  • より大きなソケットにアップグレードするために、各アカウントマネージャーまたはカスタマーサービスマネージャーに連絡してください。 担当者がわからない場合は、サポートに連絡してください。

Catoサポートへのケースの提出

上記の手順が問題の隔離と解決に役立たない場合は、Catoサポートでケースを開いてください。 ケースを開く際は、以下の質問を考慮して、対応する回答を提供してください: 

  1. 問題がすべてのアプリケーションまたは特定のアプリケーションに影響しますか? 
  2. 特定のアプリケーションに影響がある場合、それらは新規アプリケーションですか? 
  3. 新規アプリケーションについては、アプリケーション名バージョンなど、詳細を提供してください。
  4. 既存のアプリケーションで何が変更されて、問題が発生しましたか?
  5. この問題は全てのサイトに影響しますか、それとも特定サイトにのみ影響しますか? 特定サイトの場合、影響を受けるサイトを列挙してください。
  6. すべてのサイトに影響する場合、サーバーはどこに設置されていますか? 

データ収集

問題を再現する際に、サポートセルフサービス(SSS)を収集してください。 また、デバイスにWiresharkをインストールし、2セットのパケットデータをキャプチャしてください:

  • 最初のパケットキャプチャセット(PCAP)は、パフォーマンス問題をキャプチャする必要があります。 これはSSSを収集しながら同時に行うことができます。
  • Catoクラウドをバイパスして接続が行われ、パフォーマンスに問題がない場合に、二番目のPCAPセットを収集する必要があります。 このデータセットは、収集されたログとSSSをレビューする際のサポートのベンチマークとして機能します。
  •  

この記事は役に立ちましたか?

0人中0人がこの記事が役に立ったと言っています

0件のコメント