100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

 

不是银弹

OpenAI的产品不是银弹,甚至都不属于连科学上网都不会的人,它有着诸多门槛和约束条件,注册充值就能卡掉99%的人。所谓银弹,就是一种能够解决所有问题的万能解决方案。

AI就只是一种工具,它不是那个你想象中的东西。期望它给出正确方案的前提就是,你得会提问,你要知道自己去哪里,怎么做,具体怎么做可以找它,执行则交给自己的心力,以及不停的探索尝试,不停的逼近自己的目标。

0成本0门槛进入业务融入生活,成为习惯,或许才是AI最好的打开方式。

娃今天和豆包玩了半小时,开心的不得了。

100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

不懂的东西,问问kimichat(有微信小程序),可能有惊喜,很多时候体验AI这个新事物,其实不用原生ChatGPT就可以,最主要是习惯。

很多人家里连电脑都没有,也不耽误体验新鲜事物,目前豆包和kimichat手机上就可以完成ChatGPT的部分功能特性了。

100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

教,和执行,往往都是两回事,哪怕中间过程一模一样,考验的还是自己,人行了,做什么都行。

 

爬虫采集

继续本篇的目标:爬虫是不是非得要依赖AI或者RPA工具?

前一篇100个AI+RPA提效系列(5) 【5分钟实现公众号文章爬虫】说到,使用RPA工具采集微信公众号文章,那么,其他平台的文章和数据,是不是也可以照葫芦画瓢。

答案是的,甚至还有更方便的招数,也不用自己去制作应用。

除了微信这种比较封闭的平台,很多其他平台的数据和信息,只要是网页形式,大部分都可以用工具采集,这里的工具除了自己写脚本、成熟的RPA工具之外,还有一类专业的采集器,用于采集网页数据。

询问kimichat:

100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

后羿采集器是一款基于人工智能技术研发的网页采集工具,它提供了智能模式和流程图模式两种主要的采集方式。

这个案例,采集生财有术里的文章,只需要如下几步:

#1 点击智能采集,大部分情况都可以用智能采集,比如文章列表,帖子列表,评论列表这类比较合适

100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

 

#2  点击打码,其实就是预登录,完成登录过程

100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

 

#3 自动识别字段,下面的content字段就是我们期望获得的内容,也可以自己修改删除,然后点击开始采集

100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

 

#4 默认设置即可,部分只有专业版可以设置,但是免费版常规使用也不影响

100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

# 5 开始采集,等待采集完毕时,采集的数据可以导出

100个AI+RPA提效系列(6) 【AI不是银弹!0代码5分钟实现任何网站爬虫】

不会用?问问kimichat。

以下是使用后羿采集器的基本步骤:

  1. 新手入门:

    • 下载并安装后羿采集器软件。

    • 注册并登录账号。

    • 了解软件的基本界面和功能。

  2. 智能模式:

    • 输入要采集的网址。

    • 选择页面类型(单页、列表页、列表页+详情页等)。

    • 如果需要登录,使用预登录功能。

    • 设置预执行操作,如点击按钮等。

    • 输入验证码(如果遇到)。

    • 切换代理(如果需要)。

    • 设置提取字段,软件会自动识别并展示数据。

    • 进行深入采集,如果需要采集详情页数据。

    • 设置数据筛选和采集范围。

    • 配置采集任务,包括定时启动、智能策略、自动导出等。

    • 启动任务并查看数据运行界面。

    • 查看和导出采集结果。

  3. 流程图模式:

    • 创建流程图模式任务,通过拖拽组件来构建采集流程。

    • 设置验证码识别功能(如果验证码出现在固定位置)。

    • 利用批量输入关键字或页码进行翻页。

    • 设置采集任务的其他参数。

  4. 数据发布:

    • 发布采集到的数据到数据库(如MySQL、SQLServer、PostgreSQL、MongoDB等)。

    • 设置数据迁移。

  5. 常见问题:

    • 如果遇到问题,可以参考官方提供的常见问题清单或联系客服。

  6. 教程和资源:

    • 官方提供了详细的视频教程和图文教程,帮助用户快速掌握使用方法。

    • 用户可以通过官方文档中心获取更多关于软件使用的信息。

请注意,使用任何数据采集工具时,都应遵守相关法律法规,尊重网站的robots.txt文件规定,不要对网站服务器造成过大压力,避免进行非法的数据采集活动。

再不会,再问就好了。

 

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享