Class and Description |
---|
ContentRule
内容解析规则
定义了哪些页面为内容页 根据 内容页地址规则 和 内容匹配规则 确定哪些页面是内容页,需要从中提取出数据 |
ExtractFieldRule
属性提取规则
定义了如何提取数据 |
ExtractRule
内容提取规则
内容提取规则中包含了一组属性提取规则,定义了如何提取一项数据 |
HeaderRule
请求头参数配置信息
|
LinkRule
链接解析规则
确定起始页和需要提取哪些链接,即通过种子链接提出后续所有的列表页和内容页的连接 |
MatcherRule
链接过滤规则
|
PageRule
内容页内容匹配规则
内容页内容匹配规则表明根据抓取内容判断该页面是否需要进行内容提取操作 |
SiteRule
站点规则
|
Class and Description |
---|
ContentRule
内容解析规则
定义了哪些页面为内容页 根据 内容页地址规则 和 内容匹配规则 确定哪些页面是内容页,需要从中提取出数据 |
ExtractRule
内容提取规则
内容提取规则中包含了一组属性提取规则,定义了如何提取一项数据 |
Class and Description |
---|
ContentRule
内容解析规则
定义了哪些页面为内容页 根据 内容页地址规则 和 内容匹配规则 确定哪些页面是内容页,需要从中提取出数据 |
ExtractRule
内容提取规则
内容提取规则中包含了一组属性提取规则,定义了如何提取一项数据 |
Class and Description |
---|
PageRule
内容页内容匹配规则
内容页内容匹配规则表明根据抓取内容判断该页面是否需要进行内容提取操作 |
Class and Description |
---|
ExtractRule
内容提取规则
内容提取规则中包含了一组属性提取规则,定义了如何提取一项数据 |
Class and Description |
---|
ExtractFieldRule
属性提取规则
定义了如何提取数据 |
ExtractRule
内容提取规则
内容提取规则中包含了一组属性提取规则,定义了如何提取一项数据 |
Class and Description |
---|
LinkRule
链接解析规则
确定起始页和需要提取哪些链接,即通过种子链接提出后续所有的列表页和内容页的连接 |
Class and Description |
---|
MatcherRule
链接过滤规则
|
Class and Description |
---|
SiteRule
站点规则
|
Class and Description |
---|
ContentRule
内容解析规则
定义了哪些页面为内容页 根据 内容页地址规则 和 内容匹配规则 确定哪些页面是内容页,需要从中提取出数据 |
ExtractRule
内容提取规则
内容提取规则中包含了一组属性提取规则,定义了如何提取一项数据 |
LinkRule
链接解析规则
确定起始页和需要提取哪些链接,即通过种子链接提出后续所有的列表页和内容页的连接 |
SiteRule
站点规则
|
Copyright © 2020 Pivotal Software, Inc.. All rights reserved.