Class | Description |
---|---|
ContentRule |
内容解析规则
定义了哪些页面为内容页 根据 内容页地址规则 和 内容匹配规则 确定哪些页面是内容页,需要从中提取出数据 |
ExtractFieldRule |
属性提取规则
定义了如何提取数据 |
ExtractRule |
内容提取规则
内容提取规则中包含了一组属性提取规则,定义了如何提取一项数据 |
HeaderRule |
请求头参数配置信息
|
LinkRule |
链接解析规则
确定起始页和需要提取哪些链接,即通过种子链接提出后续所有的列表页和内容页的连接 |
MatcherRule |
链接过滤规则
|
PageRule |
内容页内容匹配规则
内容页内容匹配规则表明根据抓取内容判断该页面是否需要进行内容提取操作 |
SiteRule |
站点规则
|
Copyright © 2020 Pivotal Software, Inc.. All rights reserved.