卡卡资源论坛

 找回密码
 注册
查看: 299|回复: 0

基础篇1:批量采集论坛用户的用户名,邮箱或用户积分(图文)

[复制链接]
发表于 2019-9-28 10:18:08 | 显示全部楼层 |阅读模式
万能信息采集是一款小巧而功能强大的批量网页信息采集工具

今天给大家做一个批量抓取多个页面的某局部的信息,并导出到excel或文本。
为本论坛的用户资料页为例,采集全论坛的用户昵称并导出到表格
一:打开用户资料页,例如:http://bbs.kakawz.com/home.php?mod=space&uid=2777 ,可以看到,页面有多处包含昵称的地方。只要任意截取一个地方的,都能找到用户昵称。

二:当前页面,晴天娃娃07221 就是我们要找的昵称,即我们需要把晴天娃娃07221采集出来。

1、把1个的用户资料网址填到此框
2、点最下面的配置测试,右面框将显示页面源代码
3、在右侧找到任一处晴天娃娃所在位置
   请注意晴天娃娃 前面/后面 的代码
   只需截取出,前面和后面中间部分,就是 用户昵称

4、再将昵称的前/后的代码,分别填到区域区域的首与尾的框中,用途选择“截取区域之间的文本”


5、再点配置测试,右边将正确显示匹配出的用户名,如下图




OK,到这一步,说明我们的配置OK。
最后一步
将所有的用户页面网址,都填写到“提交网页”框中,再点“测试好了,开始批量处理”,稍等片刻,即可在任务列表显示全部的匹配结果

再把处理的结果,导出来吧~~

是不是超级简单省事多了~~有同学要问这几个页面我手动找都比你快,好的别抬杠啊,我只是拿这几个举例,实际应用中可以有上万个页面的信息要批量取,手动找找看~~

小作业:
1、用工具试着把这些页面的用户积分匹配出来

下节预告:将一个页面的所有文章标题匹配出来

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|ZY |管理我的广告

GMT+8, 2019-12-9 14:19 , Processed in 0.069798 second(s), 22 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表