0. 快速教程


假设我们有一个产品列表如下:

http://chongdata.com/sample_page/index.html

产品列表包含4个产品:
产品1 链接(url) http://chongdata.com/sample_page/product1.html
产品2 链接(url) http://chongdata.com/sample_page/product2.html
产品3 链接(url) http://chongdata.com/sample_page/product3.html
产品4 链接(url) http://chongdata.com/sample_page/product4.html

1. 训练爬虫


假如我们对价钱以及卖出件数很感兴趣
然后在表格中必须填上两个链接(url) 以及对应的 关键字值. 关键字之间用 ; 分开.
这些值用于训练爬虫。

链接url1
关键字1
链接url2
关键字2

例如在以上表格中
第1个文本框中填写产品1的链接url
第2个文本框中的111和15分别是产品1的价钱和卖出件数
第3个文本框中填写产品2的链接url
第4个文本框中的32和55分别是产品2的价钱和卖出件数

您的爬虫id为:

爬虫状态:

当爬虫训练完毕就可以用你的爬虫去采集信息
立刻替换你需要的链接和关键字,训练您的爬虫

2. 测试爬虫


填写你要采集数据链接,每行一个链接

任务ID

任务状态

任务结果

3. 大规模数据采集


提供网站的根域名(种子链接),系统把整个网站关键字信息提取出来

此项服务需要注册,点击这里