[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]
[jfriends:00047] Re: HTML タグの取得について<リンクタグと構造タグの違い?>
中島と申します
くろたろう wrote:
> はじめまして。本日から参加させて頂きました。
> よろしくお願いします。
こんにちは。よろしく。
>
> 現在、www上からHTMLファイルをダウンロードし、解析する
> ソフトを作成しております。その際、とりあえず<a href>タグ
> と<img src>タグを取得しようとしたところ、同じHTMLのタグ
> であるにも関わらず、下記①の方法では<a href>タグが取得で
> きず、仕方なく<a href>タグのみ、下記②の方法で取得してい
> ます。なぜこうなるのか?又、解決方法などのご意見を頂けた
> ら、幸いです。どうかよろしくお願いします。
<img>タグには終了タグがありませんが、<a>タグには終了タグがあります
よね?それが違いです。
Parserは本来終了タグを持たないタグを見つけるとhandleSimpleTag()を
呼び出しますが、開始タグ、終了タグを見つけるとそれぞれhandleStartTag(),
handleEndTag()を呼び出します。
つまりhandleSimpleTag()だけで、すべてのHTMLタグを扱えるわけでは
ないということです。
<a>タグを見つけて属性を調べたいのならばhandleStartTag()を実装する
必要があると思います。
では。