八爪鱼采集器_八爪鱼采集器免费版
登陆软件之后新建一个任务,打开你要采集的网站地址。这里我自己示范的原创设计手稿的采集。
2、进入到设计工作流程环节,在界面浏览器那输入你要采集的网址,点击打开,你就能看到你要采集的网站界面,由于这个网址存在多页内容需要采集,我们再设置采集规则的时候,可以先建立翻页循环,先把鼠标选择页面上的【下一页】按钮,在弹出的任务对话框,选择高级选项中的【循环点击下一页】,软件会自动建立一个翻页循环。
3、建好翻页循环好,就是采集当前页上的内容,我要采集图片的URL,就选中一个图片,然后单击,软件会自动弹出对话框,先建立一个元素循环列表。当前页面的所有元素都被抓取后,循环列表则建立完成。
4、设置要抓取的内容,选择元素循环列表中的任意一个元素,在浏览器内找到该元素对应的图片,点击后弹出对话框,选择【抓取这个元素的图片地址】为字段1,同时我为了方便识别,还抓取了字段2为图片标题名称,设置原理同图片地址。
5、检查一下,翻页循环框应该将产品循环框嵌套在内,表示,先抓取完当前一整页的图片URL后再翻页
6、设置执行计划后,就可以开始采集了,单击采集的话,直接点击【完成】步骤下的【检查任务】,开始运行任务。采集完毕后可以直接下载成EXCEL的文件。
7、将URL转换为图片,这里用八爪鱼图片转换工具,将EXCEL导入之后,就可以自动等待系统将图片下载下来了!
八爪鱼采集器8.0版是一款功能强大的网页数据抓取工具。下面是使用八爪鱼采集器8.0版的步骤:
1. 安装软件并打开:从官网下载八爪鱼采集器8.0版软件,安装并打开软件。
2. 创建项目:点击左侧导航菜单中的“新建项目”按钮,填写数据采集的项目名称和网站地址。
3. 配置采集规则:点击“添加采集设置”按钮,选择网站采集的页面并进行网页分析。在网页分析界面,选择需要采集的数据类型(如标题、正文、图片等),并设置采集规则(如正则表达式、CSS选择器等)。
4. 配置数据存储方式:点击“添加输出设置”按钮,设置数据输出的格式、存储路径、文件名等信息。
5. 开始采集:完成采集规则的设置后,点击“开始采集”按钮即可开始采集数据。采集过程中软件会提示用户输入验证码等人机交互操作。
6. 查看采集结果:采集完成后,可以在软件中查看采集结果,也可以导出数据到Excel、CSV或数据库等数据存储类型中。
以上就是使用八爪鱼采集器8.0版的简单步骤。在使用过程中还需要注意设置合理的采集间隔和数据抓取范围,以免造成网站的过度访问等问题。