系统:PC
日期:2021-05-05
类别:网络工具
版本:v2.8.2.0
懒人采集器免费版是一款非常实用的数据采集工具,操作简单。用户可以通过软件快速的采集你所需要的数据。软件支持微信、今日头条、淘宝商品、百度新闻等文章、评论、商品搜索等99%的网页资源。软件可以将你采集到的资源到电脑里使用。
零门槛
不懂网络爬虫技术,会上网,就会采集网站数据
多引擎,高速稳定
内置高速浏览器引擎,还可以切换为HTTP引擎模式运行,采集数据更加高效。还内置了JSON引擎,无需分析JSON数据结构,可视化选取JSON内容。
适用各种网站
能够采集互联网99%的网站,包括单页应用Ajax加载等等动态类型网站。
可视化向导
所有采集元素,自动生成采集数据
计划任务
灵活定义运行时间,全自动运行
多引擎支持
支持多个采集引擎,内置高速浏览器内核、HTTP引擎和JSON引擎
智能识别
可自动识别网页列表、采集字段和分页等
拦截请求
自定义拦截域名,方便过滤站外广告,提高采集速度
多种数据导出
可导出为Txt 、Excel、MySQL、SQLServer、 SQlite、Access、网站等
1、软件操作简单,可通过鼠标点击的方式轻松选取要抓取的内容;
2、支持三种高速引擎:浏览器引擎、HTTP引擎、JSON引擎,内置优化后的火狐浏览器,加上独创的内存优化使浏览器采集也可以高速运行,甚至可以快速转换为HTTP方式运行,享受更高的采集速度!而在抓取JSON数据时,同样可以使用浏览器可视化方式,通过鼠标点选需要抓取的内容,完全不需要去分析JSON数据结构,使非网页专业设计人士也可以轻松抓取需要的数据;
3、不用分析网页请求和源代码,却支持更多的网页采集;
4、先进的智能算法,可以一键生成目标元素XPATH、自动识别网页列表、自动识别分页中的下一页按钮……
5、支持丰富的数据导出方式,可以导出为txt文件、html文件、csv文件、excel文件,也可以导出到已有的数据库,如sqlite数据库、access数据库、sqlserver数据库、mysql数据库,通过向导的方式简单映射字段,即可轻松导出到目标网站数据库中。
自动生成列表和字段
可以对某些网站上的列表惰性收集器进行智能分析,并且可以自动突出显示网页列表并生成列表数据
然后我们可以修剪数据,例如删除一些不必要的字段
单击右上角的三角形符号,将弹出该字段的详细配置,然后单击删除功能以删除该字段。
如果某些网页自动生成的列表数据不是您想要的数据,则可以单击“清除字段”以清除所有生成的字段
采集时怎样避免重复到重复数据?
在运行某个采集任务时,如果该任务之前有采集过数据,那么采集前如果没有清空原有数据的话,会以追加的形式将新采集数据添加到本地采集库中,这样就可能出现某些已采集过的数据再次重复采集入库,还有,如果目标网页本身也重复的数据,也可能造成数据重复,那么怎么避免采集的数据出现重复呢?
方法很简单,我们希望哪一个字段内容不允许出现重复,只要点击该字段表头上这个三角符号,再勾选“过滤重复”复选框,点击确定就可以了
如何手动生成字段?
点击“增加字段”按钮
点击列表中任意一行中要提取的元素,比如要提取标题和链接地址,鼠标左键点击一下该标题即可
当点击的是网页链接时,会提示是否用时要抓取链接地址
如果要同时提取链接标题和链接地址,点“是”,如果只要提取标题文本,点否,这里我们点“是”
系统会自动生成标题和链接地址字段,并在字段列表中显示出提取到的字段内容,当点击底部表格字段标题时,会在网页上以黄色背景高亮显示出匹配的内容。
如何还有标记列表中的其他字段,点击新增字段,重复以上操作即可。
怎样手动生成列表?
点击“查找列表”按钮,选择“手动选择列表”
按提示,用鼠标左键点击网页列表中的第一行数据
点完第一行,再按提示点击第二行或其他相似的行
点击完列表里的任意两行后,整个列表就高亮显示出来了,同时该列表里的字段也会字段生成,如果生成的字段不对,点击清除字段,把下面的字段全部清除掉
热门推荐
更多版本
相关应用
实时热词
评分及评论
这个确实不错的软件
下载的最新版本,之前遇到的问题希望已经解决了
很好,最新版已安装并使用了,谢谢!
这款软件功能非常全面,用起来非常顺手
这东西太有价值了,收了收了
点击星星用来评分