不是银弹
OpenAI的产品不是银弹,甚至都不属于连科学上网都不会的人,它有着诸多门槛和约束条件,注册充值就能卡掉99%的人。所谓银弹,就是一种能够解决所有问题的万能解决方案。
AI就只是一种工具,它不是那个你想象中的东西。期望它给出正确方案的前提就是,你得会提问,你要知道自己去哪里,怎么做,具体怎么做可以找它,执行则交给自己的心力,以及不停的探索尝试,不停的逼近自己的目标。
0成本0门槛进入业务融入生活,成为习惯,或许才是AI最好的打开方式。
娃今天和豆包玩了半小时,开心的不得了。
不懂的东西,问问kimichat(有微信小程序),可能有惊喜,很多时候体验AI这个新事物,其实不用原生ChatGPT就可以,最主要是习惯。
很多人家里连电脑都没有,也不耽误体验新鲜事物,目前豆包和kimichat手机上就可以完成ChatGPT的部分功能特性了。
教,和执行,往往都是两回事,哪怕中间过程一模一样,考验的还是自己,人行了,做什么都行。
爬虫采集
继续本篇的目标:爬虫是不是非得要依赖AI或者RPA工具?
前一篇100个AI+RPA提效系列(5) 【5分钟实现公众号文章爬虫】说到,使用RPA工具采集微信公众号文章,那么,其他平台的文章和数据,是不是也可以照葫芦画瓢。
答案是的,甚至还有更方便的招数,也不用自己去制作应用。
除了微信这种比较封闭的平台,很多其他平台的数据和信息,只要是网页形式,大部分都可以用工具采集,这里的工具除了自己写脚本、成熟的RPA工具之外,还有一类专业的采集器,用于采集网页数据。
询问kimichat:
后羿采集器是一款基于人工智能技术研发的网页采集工具,它提供了智能模式和流程图模式两种主要的采集方式。
这个案例,采集生财有术里的文章,只需要如下几步:
#1 点击智能采集,大部分情况都可以用智能采集,比如文章列表,帖子列表,评论列表这类比较合适
#2 点击打码,其实就是预登录,完成登录过程
#3 自动识别字段,下面的content字段就是我们期望获得的内容,也可以自己修改删除,然后点击开始采集
#4 默认设置即可,部分只有专业版可以设置,但是免费版常规使用也不影响
# 5 开始采集,等待采集完毕时,采集的数据可以导出
不会用?问问kimichat。
以下是使用后羿采集器的基本步骤:
-
新手入门:
-
下载并安装后羿采集器软件。
-
注册并登录账号。
-
了解软件的基本界面和功能。
-
-
智能模式:
-
输入要采集的网址。
-
选择页面类型(单页、列表页、列表页+详情页等)。
-
如果需要登录,使用预登录功能。
-
设置预执行操作,如点击按钮等。
-
输入验证码(如果遇到)。
-
切换代理(如果需要)。
-
设置提取字段,软件会自动识别并展示数据。
-
进行深入采集,如果需要采集详情页数据。
-
设置数据筛选和采集范围。
-
配置采集任务,包括定时启动、智能策略、自动导出等。
-
启动任务并查看数据运行界面。
-
查看和导出采集结果。
-
-
流程图模式:
-
创建流程图模式任务,通过拖拽组件来构建采集流程。
-
设置验证码识别功能(如果验证码出现在固定位置)。
-
利用批量输入关键字或页码进行翻页。
-
设置采集任务的其他参数。
-
-
数据发布:
-
发布采集到的数据到数据库(如MySQL、SQLServer、PostgreSQL、MongoDB等)。
-
设置数据迁移。
-
-
常见问题:
-
如果遇到问题,可以参考官方提供的常见问题清单或联系客服。
-
-
教程和资源:
-
官方提供了详细的视频教程和图文教程,帮助用户快速掌握使用方法。
-
用户可以通过官方文档中心获取更多关于软件使用的信息。
-
请注意,使用任何数据采集工具时,都应遵守相关法律法规,尊重网站的robots.txt文件规定,不要对网站服务器造成过大压力,避免进行非法的数据采集活动。
再不会,再问就好了。