# 提取模拟器

测试接口主要用于用户在配置风铃虫定义规则时测试使用,请勿将此作为正式抓取功能使用。

# 链接抓取功能测试

链接抓取测试主要根据已经定义好的站点规则和链接提取规则从指定的地址里提取处符合要求的链接地址,

该功能主要用于测试站点规则和链接提取规则是否配置正确,或者的配置的规则产生的结果是否符合预期目标。

链接提取测试接口使用方法如下:


	SimulatorData data=Crawler.link(SiteRule siteRule, LinkRule linkRule);

该方法主要有两个参数:站点规则和链接提取规则。

其中返回值 SimulatorData 的基础定义如下:

	/**
	 * 测试是否否成功,true表示成功,false表示失败
	 */
	private Boolean success;
	/**
	 * 输出数据,success为true时表示的是输出数据,success为false表示异常原因
	 */
	private Object data;

# 内容提取功能测试

内容提取测试功能主要是根据已经定义好的站点规则和内容提取项规则从指定的地址中提取出扶摇要求的数据。

该功能主要是用于测试站点规则和内容提取项规则是否配置正确,输出结果是否符合预期目标。

内容提取测试接口使用方法如下:


SimulatorData data = 
	Crawler.extract(String url, SiteRule siteRule, ContentItem contentExtractRule);

该方法主要有三个参数:目标网页地址,站点规则和内容提取项规则 。

Last Updated: 1/6/2020, 9:47:00 PM