public interface ContentExtract
//获取到网页的源码 String rawtxt = page.getRawTxt(); // 执行解析操作 object value=解析出来的数据 page.addResultItem( 实例中唯一的键, value) ;
Modifier and Type | Method and Description |
---|---|
void |
extract(ContentRule contentRule,
List<ExtractRule> rules,
Page page)
从网页内容里解析出所有符合要求的数据
|
void extract(ContentRule contentRule, List<ExtractRule> rules, Page page) throws com.yishuifengxiao.common.tool.exception.ServiceException
contentRule
- 内容解析规则rules
- 内容提取规则page
- 网页对象com.yishuifengxiao.common.tool.exception.ServiceException
- 解析时遇到的异常Copyright © 2020 Pivotal Software, Inc.. All rights reserved.