数据挖掘教程篇 八爪鱼采集器新手采集教程

八爪鱼采集器如何采集数据?八爪鱼采集器是一款专门用来采集网页数据的网络软件,以自主研发的分布式云计算平台为核心,能够在短时间内从不同网站和网页上抓取大量规范化的数据内容,帮助用户轻松实现数据自动化采集,编辑,规范化,大大提高用户的效率 。下面Win10镜像之家官网给大家分享的是八爪鱼采集器新手采集教程,有需要的小伙伴一起来看看吧 。
八爪鱼采集器新手采集教程:步骤一
我们找到八爪鱼采集器的安装位置,双击或右击-打开运行【Octopus 。exe】,无法运行的伙伴右击-管理员身份运行;也可以通过桌面的八爪鱼采集器快捷运行方式开启 。
步骤二
开始运行后,会弹出登入界面,没有账号的小伙伴们,可以点击免费注册,进行注册使用 。
步骤三
登入完后进入主界面,刚开始使用的小伙伴,可能会有一个问卷弹出,如实填写就行 。
我们将游标移动到新建按钮上,会展现一个下拉菜单,分别是【自定义任务】、【模板任务】、【导入任务】、【新建任务组】;我们这里选择【模板任务】 。
步骤四
八爪鱼采集器在此已经为我们预设了很多模板,这里使用京东作为演示内容 。
步骤五
点击选择京东后,会有好几个模板,功能各不相同,这里我们点击第一个【京东-商品搜索】 。
点击【立即使用】
步骤六
这个界面便是设置爬取的内容参数,我们一一讲解 。
任务名:顾名思义,设置本次的任务名字
任务组:将这次任务归类到哪各组,因为我们没有设置所以只有一个【我的任务组】,小伙伴们可以自行去创建组,在新建按钮中选择【新建任务组】 。
搜索关键词:你要在网页中搜索爬取的内容 。
页数:爬取多少页的数据,不指定为全部爬取 。
这里设置爬取3页手机的数据,点击【保存并启动】,开启爬取
步骤七
点击后会弹出这个界面,有条件的小伙伴可以购买【云采集服务】,这里使用【启动本地采集】
稍加等待后,软件会自己启动前往指定页面爬取数据 。
这里没有等待全部爬取完,点击了停止采集,这里我们可以选择直接导出或稍后导出 。
步骤八
若点击【导出数据】,我们可以指定导出的格式,这里导出到Excel中 。
选择导出位置
导出完毕
查看内容
【数据挖掘教程篇 八爪鱼采集器新手采集教程】关于八爪鱼采集器新手采集教程就给大家介绍完了,希望能对大家有所帮助 。了解更多教程请继续关注Win10镜像之家官网哦……

    推荐阅读