- ベストアンサー
ARPがおかしくなる
Ciscoルータを使用し上位プロバイダと接続しているのですが、約30分程度(早いときは15分程度)経過すると、パケットが全て通らないという現象が発生しています。 Pingにて確認を行っているのですが、問題が発生したときPingはこちら側ルータのWAN側ポートまではPingが通ります。 そして、この不具合が発生したときARPテーブルを見るとAgeが0のままになっており、それ以後は上がることは有りません。 また、ARPをクリアすると回復します。他にインターフェースクリアも有効でした。 パケットとしてはスパニングツリー以外は流れてないようです。 この様な現象で回復方法が分かる方、ご指導よろしくお願い致します。
- みんなの回答 (7)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
#5補足より >Cisco2600で「ARP Timeout」を120秒などの設定にしておけば、とりあえずは大丈夫でした。 > とりあえず今のところの解決方法はこれ ということなんでしょうか。 解決しなかったら「staticでarpテーブルを作る」という案を出そうと思っていました。 でも、120秒で発生しなくなったのはたまたまなのでは? つまり119秒目にarpテーブルが壊れてすぐにクリアされたとか。 でないと180秒で発生して120秒で発生しない理由が...今晩眠れなくなってしまいます^ ^;; ちなみに確認したいのは、 ・正常通信時と障害発生時のarpテーブルのHardware Addr表記は同じか? ・障害発生時にパケットキャプチャしてCiscoルータから送信自体は行えているか? 2番目は折り返しがダメ と思っていますが、念のため。 自分的には上位L3-SWのSTPが正常に組まれていないというのが怪しいと思いますが、 例えばmain側のDuplexがautoとfullで設定しまっているとか。 でも相手はプロバイダなんですよね...そんな過ちはしないでしょうね。
その他の回答 (6)
#5のつづきですが、 #2補足の図から、もしかしてメディアコンバータで単純に光変換等したネットワークでしょうか? (広域Etherはその先にある?) そんなはずは無いとは思いますが一応 ^ ^;; ちなみにメトロイーサとかは、局内にL2のスイッチがありますので、 arpはそことのやりとりになると思います。 後は広域Etherサービスで足回りはATMとかで、WANアクセス装置が間に入っているとか。
補足
実際プロバイダとの契約等はお客様再度で行っており、私も詳しくは分からないのですが、実際プロバイダの担当者といろいろとやり取りし、こちらのルータ(Cisco2600)とプロバイダ側スイッチ(L3SW)の間には何も無い様です。 有るとすればメディアコンバータのみの様です。 実際にMACアドレスがL3SWのものを取ってます。 そして、そのL3SWには他のお客も繋がっており、Ciscoで接続してる方も居るが、問題無いという回答でした。 *補足の説明がイマイチだったかもしれませんので再度書きますと L3SW <-プロバイダ局内設置 | MC | | <-電柱を通ってどこか経由で繋がる | MC | C2600 <-自前ルータ この様な感じになります。 かなり投げたくなってきてます・・・(笑) 以上。お手数ですがよろしくお願い致します。
#4補足より >ARPテーブルですがおかしくなるのは上位側L3スイッチの部分のみのようです。 > この上位L3-SWのarpテーブルをクリアすると通信できるようになる ということでしょうか? そうなるとL3-SW側が問題となると思いますが...。 (Cisco側が問題で通信断されていても、arpの問題であればL3-SW側で解決すべき問題かと) とりあえずSTPの話もありましたので、そこを確認されてはいかがですか? エクストリーム製品は扱ってないのでお力にはなれないです。すみません。 ちなみにCisco2600と1600で開発に訊いてみましたがそういった問題はあがっていないそうです。
補足
いろいろとお力添え頂きありがとう御座います。 ARPのクリアはCisco2600側で行っております。 そして、エクストリームとCiscoルータでの構成については実勢もあるので、愛称みたいなものは無いと思っております。 さらに先ほどの実験したのですが、NEC製ルータIP45/007(小規模用ダイアルアップルータ)を使い、通常LAN側になる部分を使いCisco2600の代わりをやってみたのですが、やはり同じ現象が出てしまいました。 と言うことで、Ciscoと限らずルータ機器は同じ症状になってしまうものかと思ってます。 もう一つ実験で、Cisco2600で「ARP Timeout」を120秒などの設定にしておけば、とりあえずは大丈夫でした。 180秒以上に設定すると同じ現象が発生するという、納得のいかない結果が出てます。
#3補足より >1600シリーズは同じ現象が発生し、スイッチ類の場合は問題が発生しませんでした。 > 明らかにCiscoルータの挙動による問題ということですね。 テストできる環境をお持ちで、ここまでつきとめているのなら 通常簡単に問い合わせ(というより苦情かな^ ^;)ができるんですけどね。 あと出来るのであれば、他製品のルータの評価が欲しいところですね。 アライドの安いAR320とかYAMAHAのルータとか...。 自分のところでもいずれ導入する予定でもありますので、 ちょっとそれなりに開発に訊いてみます。 #あまり期待されても困りますが...すみません。 ということで、できれば回線の種別とプロバイダを教えて頂ければ幸いです。
補足
補足なのですが、メディアコンバータとルータの間にCat1900などのスイッチを入れた場合で、ルータがこの現象を発生しだした後に、Cat1900にPingすると通ってしまいますので、NIC事態は生きてると判断してます。 そして、ARPテーブルですがおかしくなるのは上位側L3スイッチの部分のみのようです。 回線は広域Etherです。プロバイダはちょっとここで申し上げる事はできませんm(__)m
広域Etherでしょうか? ありきたりなアドバイスで参考にならないかもしれませんが、 とりあえず障害点の切り分けをされてはいかがでしょうか。 まずはスニファーしかけて障害発生時の状況を解析してみてから、 内のメディアコンバータまでの折り返し試験をしてもらうとか、 他のルータ(PCでもいいかな)やスイッチを接続して同様の現象が起こるか確認するとか...。 上記を試験してCisco2610が原因とわかっているようでしたら、保守先に相談してみるとか。 #自分のところならそれなりに解析してくれる部門と契約していますが #musimusiさんはどうでしょうか? #ここに投稿されるくらいだから訊く先が無いことと思われますが...^ ^;;
補足
キャプチャーで障害前、障害発生後のパケットを見たのですが、これといったものは見つからなかったのです。 そして、Cisco2621以外にも1600シリーズやCat1900などのスイッチ類を接続して同現象が発生するかテストしたところ、1600シリーズは同じ現象が発生し、スイッチ類の場合は問題が発生しませんでした。またルータとメディアコンバータの間にスイッチを入れた場合でも同じ現象が発生しダメでした。 保守の話ですが、内情がややこしいのです。他の機器は保守しますが、今回の件はある意味サービスで行ったので私としてもベンダーにも聞くに聞けないのが現状なのです。
例えば「Cisco IOS ARP Table Overwrite Vulnerability」 ってのもあります。(参考URLを) 外からarpテーブルの書き換えが可能で 書き換えられたらarpテーブルを消去するまで通信不能になるという問題です。 ということで、少なくとも ・Ciscoルータの型番とIOS ・ネットワーク構成 を出した方が回答がつきやすいと思いますよ。
補足
一応IOSは最新までは行かなくとも、ある程度新しい物にしてみたのですが、症状は変わりませんでした。 構成を明記した方が・・とご指摘がありましたので、下記に構成を明記致します。 L3スイッチ(Exstreme製)<--上位 | メディアコンバータ | | | メディアコンバータ | ルータ(Cisco2621) <--こちら側ルータ この様な構成になっており、基本的なIP設定ミスやサブネットの記述ミス等は何度も確認し間違いはありません。 ルータのIOSは11~12.1(?)まで3種類ためしましたが症状は変わりませんでした(IOSのバージョンは実機を見ないと不明ですので詳しくは分りません) 以上で、思い当たる事がありましたら宜しくお願いいたします。
ネットワーク構成の変更とかは最近していませんか? また、ネットワークの構成を明示した方が回答がつきやすいようにも思うのですが。。。 (私の能力では、ちょっと的が絞れないんで) こちら側ルータってことは、他にもルータがあるんですよね?
補足
No2の方からもご指摘頂きましたので、下記に構成を示します。 L3スイッチ(Exstreme製)<--上位 | メディアコンバータ | | | メディアコンバータ | ルータ(Cisco2621) <--こちら側ルータ そして、他にもルータが下位に繋がりますが、この現象の原因を探る為に、基本的にこの構成のみでテストを行っております。 この様な感じですが、何か思い当たる事がありましたら宜しくお願いいたします。
お礼
とりあえず、ARPクリアのタイミングを短くして対処する事になりました。 現在、プロバイダ側で原因を調べている様です。 いろいろと、ありがとうございました。
補足
>「staticでarpテーブルを作る」という案を出そうと思っていました。 これに付きましては既に試して失敗してます(T_T) >・正常通信時と障害発生時のarpテーブルのHardware Addr表記は同じか? これが同じなんです。show arp で見たとき変わってるのはageが0より上がらなくなってるだけなんです。 >・障害発生時にパケットキャプチャしてCiscoルータから送信自体は行えているか? 発生時にCiscoからのパケットは出てます。例えば構成としては、「L3SW」-「Cat1900」-「C2600」という感じで繋げた場合、c2600からCat1900にPingが打てるんです。 そして問題のL3SWにPingしたときもパケットはちゃんと出てるんです。 障害が発生した時の具体的なパケットの動きとしては 1.C2600→L3SWへエコー要求 2.L3SWから全体へARP要求(C2600のMACは?) 3.C2600→L3SWへARP応答 これを繰り返す動きをします。 やはり上位側L3SWでしょうか・・・いきなりMACどこじゃ?と聞いてきてますし・・・ しかし、C2600のARPをクリアすると回復するという不可思議な動きをするんです。