[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[jfriends:00047] Re: HTML タグの取得について<リンクタグと構造タグの違い?>



中島と申します

くろたろう wrote:
> はじめまして。本日から参加させて頂きました。
> よろしくお願いします。

こんにちは。よろしく。

> 
> 現在、www上からHTMLファイルをダウンロードし、解析する
> ソフトを作成しております。その際、とりあえず<a href>タグ
> と<img src>タグを取得しようとしたところ、同じHTMLのタグ
> であるにも関わらず、下記①の方法では<a href>タグが取得で
> きず、仕方なく<a href>タグのみ、下記②の方法で取得してい
> ます。なぜこうなるのか?又、解決方法などのご意見を頂けた
> ら、幸いです。どうかよろしくお願いします。

<img>タグには終了タグがありませんが、<a>タグには終了タグがあります
よね?それが違いです。
Parserは本来終了タグを持たないタグを見つけるとhandleSimpleTag()を
呼び出しますが、開始タグ、終了タグを見つけるとそれぞれhandleStartTag(),
handleEndTag()を呼び出します。

つまりhandleSimpleTag()だけで、すべてのHTMLタグを扱えるわけでは
ないということです。

<a>タグを見つけて属性を調べたいのならばhandleStartTag()を実装する
必要があると思います。

では。