[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[jfriends:00409] Re: 文字列にある文字列が含まれるかどうかを調べる方法 ( 大文字小文字を区別しない)



In article <41297362.60207@xxxxxxxxxxxxxxx>
Yukie Oshima wrote:
>今回やったテストの結果からわかったことは、多量のテキストファイルで、
>大文字小文字をくべつせずに文字列検索を行うには Perl > Java(すべて大文字
>統一) > Java(Pattern_クラスを使用する)の順に早いということです。
>
>ただ、今回のテスト結果から単純に文字列検索処理として Perl が Java より
>早いといことはいえないかもしれないとおもいました。 ファイルの IO が
>Perl の方が Java より早いかもしれないからです。この点詳しい方が
>いらっしゃいましたら、教えてください。

UTF-8 なりのファイルから日本語キーワードを検索するケースでは差がな
くなるんでは無いですかね。
String への変換は高負荷です。
検索対象が英数字に限られるなら InputStream を使って面倒ですが自力
でバイト列上を検索すると Java でも高速になります。

-- 
木下 信@ひらつか
http://www.sk-jp.com/