极光下载站 - 打造齐全的绿色软件家园

极光下载站

当前位置: 首页 网络软件 网络其它 八爪鱼采集器 v7.6.2.3072 官方测试版

八爪鱼采集器八爪鱼采集器 v7.6.2.3072 官方测试版

  • 软件大小:55.7M
  • 软件语言:简体中文
  • 更新时间:2019-03-08
  • 软件授权:免费下载
  • 软件类型:国产软件
  • 软件类别:网络其它
  • 运行环境:WinAll, WinXP, Win7, Win10
  • 软件等级 :
  • 安全检测: 360安全卫士 360杀毒 电脑管家
  • 官方主页:http://www.bazhuayu.com/
  • 软件厂商:视界信息

软件介绍

  • 介绍说明
  • 下载地址
  • 精品推荐
  • 相关软件
  • 网友评论

八爪鱼采集器软件是一款免费试用数据采集软件功能强大简易采集软件支持100款以上的网站数据源,智能代理IP采集避免防封,由5000台云服务器支撑云采集24小时不间断,全自动化数据采集格式支持定时功能哦。

软件介绍

八爪鱼采集器是是一款可以采集获取任何一个网页信息的必备的采集工具,它彻底改变了我对爬虫和采集器的认识,让网页数据采集变得前所未有的简单,如果你正在寻找一款好用的采集软件,八爪鱼绝对是最好的选择。

八爪鱼采集器软件下载

不仅使用简单,而且功能强大:点击,登陆,翻页,甚至识别验证码,当网页出错误,或者多套模版完全不一样的时候,还可以根据不同情况做不同的处理。

配置好采集任务,就可以关机了,任务可以在云端执行,数量庞大的企业云,24*7不间断运行,再也不用担心IP被封,网络中断了,还能瞬间采集大量数据。

和市面上其他采集软件不同的是,八爪鱼采集器没有繁杂的采集规则设置,通过鼠标点击几次就可以成功配置一个采集任务,把体验做到了极简,大幅度提高了工作效率。用一句话形容八爪鱼采集器,那就是:追本朔源,将一切行为回归到人的本性。”

软件特色

简易采集

简易采集模式内置上百种主流网站数据源,如京东、天猫、大众点评等热门采集网站,只需参照模板简单设置参数,就可以快速获取网站公开数据。

智能防封

八爪鱼采集可根据不同网站,自定义配置组合浏览器标识(UA),全自动代理IP,浏览器Cookie,验证码破解等功能,实现突破绝大多数网站的防采集策略。

无限层级采集

很多主流新闻、电商类的网站,里面包含一级商品列表页,也包含二级商品详情页,还有三级评论详情页面;不论网站有多少层级,八爪鱼都可以不限制层级的采集数据,满足各类业务采集需求。

支持网站登录后采集

八爪鱼内置了采集登录模块,只需配置目标网站的账号密码,即可用该模块采集到登录后的数据;同时八爪鱼还具备采集Cookie自定义功能,首次登录以后,可以自动记住cookie,免去多次输入密码的繁琐,支持更多网站的采集。

云采集

由5000多台云服务器支撑的云采集,7*24小时不间断运行,可实现定时采集,无需人员值守,灵活契合业务场景,帮你提升采集效率,保障数据时效性。

API接口

通过八爪鱼API,可以轻松获取八爪鱼任务信息和采集到的数据,灵活调度任务,比如远程控制任务启动与停止,高效实现数据采集与归档。基于强大的API体系,还可以无缝对接公司内部各类管理平台,实现各类业务自动化。

自定义采集

针对不同用户的采集需求,八爪鱼可提供自动生成爬虫的自定义模式,可精准批量识别各种网页元素,还有翻页、下拉、ajax、页面滚动、条件判断等多种功能,支持不同网页结构的复杂网站采集,满足多种采集应用场景。

便捷定时功能

简单几步点击设置,即可实现采集任务的定时控制,不论是单次采集的定时设置,还是预设某一天或是每周每月的定时采集,都可以同时对多个任务自由进行设置,根据需要对选择时间进行多重组合,灵活调配自己的采集任务。

全自动数据格式化

八爪鱼内置了强大的数据格式化引擎,支持字符串替换、正则表达式替换或匹配、去除空格、添加前缀或后缀、日期时间格式化、HTML转码等多项功能,采集过程中全自动处理,无需人工干预,即可得到所需格式数据。

更新日志:

主要体验改进

【自定义模式】新增触发器功能,可根据特定条件进行采集,点击查看详细教程:

【自定义模式】提供八爪鱼6内核模式,有效解决部分网站在八爪鱼7上打不开的问题

【自定义模式】滚动页面功能间隔时间最小支持0.5秒

【自定义模式】选中所有链接时,新增「采集以下链接文本+链接」选项

【自定义模式】选中所有链接时,新增「采集以下元素Inner Html」和「采集以下元素Outer Html」选项

【自定义模式】关联任务采集支持增量模式

【自定义模式】设置关联任务时,支持搜索任务组名和任务名

【简易模式】增加「热门」分类

【简易模式】目前可按模板名和模板上线时间进行排序

【简易模式】增加搜索功能,可搜索模板

【其他】增强导出到数据库的健壮性

【其他】导出数据库选择数据表时,增加搜索功能

Bug修复

修复手动输入多个网址时,循环项消失问题

修复「从文本导入」网址后,采集时速度慢的问题

修复部分定时任务出错问题

修复「在iframe中循环输入文字采集时点击元素无效」问题

修复若干小问题

八爪鱼采集器怎么用

1、打开八爪鱼采集器的客户端,登陆软件之后新建一个任务,打开你要采集的网站地址。这里我自己示范的原创设计手稿的采集。

2、进入到设计工作流程环节,在界面浏览器那输入你要采集的网址,点击打开,你就能看到你要采集的网站界面,由于这个网址存在多页内容需要采集,我们再设置采集规则的时候,可以先建立翻页循环,先把鼠标选择页面上的【下一页】按钮,在弹出的任务对话框,选择高级选项中的【循环点击下一页】,软件会自动建立一个翻页循环。

3、建好翻页循环好,就是采集当前页上的内容,我要采集图片的URL,就选中一个图片,然后单击,软件会自动弹出对话框,先建立一个元素循环列表。当前页面的所有元素都被抓取后,循环列表则建立完成。

4、设置要抓取的内容,选择元素循环列表中的任意一个元素,在浏览器内找到该元素对应的图片,点击后弹出对话框,选择【抓取这个元素的图片地址】为字段1,同时我为了方便识别,还抓取了字段2为图片标题名称,设置原理同图片地址。

5、检查一下,翻页循环框应该将产品循环框嵌套在内,表示,先抓取完当前一整页的图片URL后再翻页。

6、设置执行计划后,就可以开始采集了,单击采集的话,直接点击【完成】步骤下的【检查任务】,开始运行任务。采集完毕后可以直接下载成EXCEL的文件。

7、将URL转换为图片,这里用八爪鱼图片转换工具,将EXCEL导入之后,就可以自动等待系统将图片下载下来了!

下载地址

  • PC版

普通下载地址:

精品推荐

  • 网页信息采集
  • 网络管理
  • 软件管家
网页信息采集

网页信息采集 更多+

信息采集的方法很多不管在现实中网络中都可以进行信息采集,互联网信息采集是指利用计算机软件技术,针对定制的目标数据源,实时进行信息采集、抽取、挖掘、处理,从而为各种信息服务系统提供数据输入的整个过程。网页信息采集就是其中一种,那么网页信息采集软件也很多,小编推荐几款网页信息采集软件给大家,希望大家喜欢支持!

网络管理

网络管理 更多+

网络管理是一种对计算机里的硬件,软件的使用和帮助,以便对人们对网络资源进行监视,测试,分析,控制等操作,这样的操作后,就可以让用户们对性能或其他需要提高,提高满足了一些要求,比如查看CPU或运行性能等使用,通常做网管的行业比较常用,这样做是可以提高网络的质量水平。小编推荐几款网络管理软件,希望大家喜欢支持。

软件管家

软件管家 更多+

软件管家是一种下载、安装、升级、卸载软件的管理工具。有了软件管家,最新的软件、游戏、等每天更新,节省你搜索和下载资源的时间,非常的方便。现在的软件管家比较多,河源小编推荐一下比较实用的给大家。

查看所有评论+

网友评论

网友
您的评论需要经过审核才能显示
第 1 楼 客人 [广东东莞CZ88.NET] 2015/4/11 23:05:06
破解版?破毛啊

本类排名

本类推荐

相关资讯

公众号