系统:PC
日期:2021-04-04
类别:网络工具
版本:v6.3.15
网络神采是一款专业的轻量级采集软件,软件可以帮助用户简单快速的采集数据。用户通过软件可以采集各个行业的数据,软件支持网页数据进行可视化浏览,帮助用户简单有效的进行数据采集,还支持二次开发、分布式部署。
1、采集强度
支持JS解析、POST分页、登录采集、跨层采集。对于疑难采集页面,有成熟的解决方案。
2、速度快
支持多任务同时运行,每个任务又可以设置多线程,确保运行效率。
3、规模化
支持任务多级分类、批量管理。支持云服务器分布式部署,管理员团队协合。
4、流程化
支持定时采集,任务定时自动启动。通过二次开发,实现流程化的信息采集、信息处理。
5、运行稳定
系统运行稳定,要求“0 bug”。目标网页改版后,自动通知管理员。
6、准确性
定制好任务后,采集准确率可达100%,即一条不漏。
数据采集
可以快速精准的采集各个行业的网页数据
模板设置
可以进行默认结果替换、新建任务模板设置
安全与保密
导出任务时删除数据库连接串名称,连接串为全局设置,只需要删除名称
缓存清理
每隔多少分钟清理一次空闲任务缓存,可设置时间进行定时采集频率删除
数据导出
可以将采集的数据导出为 Excel、CSV、Word、Access文件格式
采集结果设置
在数据库中找不到对应字段或存储过程参数时忽略错误从结果文件发布到数据库时,同时删除结果文件中的数据
将发布时的重复行保存到文件
将发布时的出错行保存到文件
1、完成软件下载,双击.exe文件即可进行使用,无需安装,点击鼠标右键可以进行软件桌面快捷键创建
2、双击软件弹出软件登录弹框,点击输入账号和密码即可进行软件登录
3、完成软件登录进入软件网络数据采集界面,该界面可以进行帮助和教程信息进行查看
4、点击根文件夹的文件弹出任务编辑弹框,盖特纳看可以进行常规任务设置
5、点击可视化采集采集配置按钮进入软件可视化操作界面,该界面可以进行采集数据图片浏览
6、点击提取下一个网址即可对输入的网址数据进行提取
7、点击擦剂规则按钮进入数据采集规则设置界面,该界面可以进行数据采集
8、点击数据采集结果按钮进入数据采集结果界面,该界面可以设置文件保存方式
9、点击源文件查看器按钮进入文件源代码查看界面进行源文件查看
10、点击选择职位数据采集文档进入数据可视化采集界面,改进可以对可视化网页的数据进行采集
11、点击保存导出按钮弹出数据采集文件导出方式列表,点击选择Excel、CSV、Word文件格式进行文件导出
12、点击软件设置按钮弹出软件选项设置弹框,该弹框可以进行常用选项设置
13、点击高级选项按钮进入软件高级选择设置界面,该界面可以进行软件模板设置
可视化采集配置,放大、缩小范围时:
1、提取下一网址:默认为连续 * 号,按Ctrl键为单个 * 号
2、循环采集:按Shift键,支持连续 * 号
3、多个 * 号时,加亮显示
可视化采集配置,操作细节:
1、显示完整XPath:选中后,不再取消当前元素,而是直接切换
2、废除选项:复制XPath时覆盖现有,改为:复制XPath时,按Shift键可覆盖现有内容
3、Gecko内核:换回 xulrunner_60.0.26,低版本 xulrunner_45.0.34 仍会出现 COM 断开,体验太差
修复bug:
1、循环采集:整条数据或“关键规则”采集失败后,URL被回收多次
2、切换动态层:从当前层切换到动态层时,如果动态层使用了“模拟点击”,而当前层未使用,会导致“提取下一层XPath时出错: 未将对象引用设置到对象的实例”。
评分及评论
现在可以下载了!新版本的
这个软件真的很不错 收藏备用!
明人不说暗话 我好喜欢这款软件 真的,感谢分享
嗯嗯,好东西,新鲜的
好用的软件,一直在用的
点击星星用来评分