[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[jfriends] Re: UrlRetriever.java




ENDO Yasuyuki wrote:
> 
> >ていました。HTMLファイルを読み込んだら、片っ端からURLの文字列を見つけて、
> >世界中のリンクを辿り続けるものでした。パケットの無駄遣いとはまさにこの事で
> >す。(^^;
> 
> なかなか凶悪なコードですね。^^;
> かなりの時間がかかるのではないでしょうか?

  はは。検索エンジンに使えませんかね?(冗談)
  
  ただ、URLの重複チェックに時間がかかりますね。 
  時間が経つにつれて、ひたすら重複チェックだけに精を出す始末。

 
> ただし私がやった例では、例えば <FRAME SRC=./main.htm などという
> " 記号が無い凶悪なものがあり、Netscape などのブラウザーでは
> 表示できてしまうので厄介でした。
> MagicMapper も " 記号が無いタグの解析は失敗していました。
> 
> これが自分で書こうと思った動機です。

  あー、そんなのあるんですか。分かりませんでした。
  結局 1文字ずつ処理することになるのか...

------------
高橋智宏