Java

本类阅读TOP10

·使用MyEclipse开发Struts框架的Hello World!(录像1)
·hibernate配置笔记
·AOP编程入门--Java篇
·linux下Tomcat 5.0.20 与 Apache 2 安装/集成/配置
·在win2003下整合了整合Tomcat5.5+ apache_2.0.53+ mod_jk_2.0.47.dll
·构建Linux下IDE环境--Eclipse篇
·Jsp 连接 mySQL、Oracle 数据库备忘(Windows平台)
·ASP、JSP、PHP 三种技术比较
·Tomcat5.5.9的安装配置
·AWT GUI 设计笔记(二)

分类导航
VC语言Delphi
VB语言ASP
PerlJava
Script数据库
其他语言游戏开发
文件格式网站制作
软件工程.NET开发
关于HtmlStreamTokenizer

作者:未知 来源:月光软件站 加入时间:2005-2-28 月光软件站

HtmlStreamTokenizer 是纯java写的html 解析器,把html处理成三种类型tags, comments, and text,类试于StreamTokenizer class,但HtmlStreamTokenizer 处理的是html stream数据流,可以用来处理html文件,
下面是一个例子
import adc.parser.*;
//
HtmlStreamTokenizer tok = new HtmlStreamTokenizer(inputstream);
HtmlTag tag = new HtmlTag();
while (tok.nextToken() != HtmlStreamTokenizer.TT_EOF)
{
  int ttype = tok.getTokenType();
  if (ttype == HtmlStreamTokenizer.TT_TAG)
  {
    tok.parseTag(tok.getStringValue(), tag);
    System.out.println("tag: " + tag.toString());
  }
  else if (ttype == HtmlStreamTokenizer.TT_TEXT)
  {
    System.out.println("text: " + tok.getStringValue());
  }
  else if (ttype == HtmlStreamTokenizer.TT_COMMENT)
  {
    System.out.println("comment: <!--" +
      tok.getStringValue() + "-->");
  }
}
下载地址
 http://sourceforge.net/projects/htmltok/



相关文章

相关软件