1.电脑下载安装后羿采集器客户端
下载链接:https://www.houyicaiji.com/
2.找到需要抓取的小红书话题链接
我的链接:
https://www.xiaohongshu.com/page/topics/608250ba2b332200018d6f57?fullscreen=true&naviHidden=yes&xhsshare=CopyLink&appuid=65e7b9b3000000000d026f0e&apptime=1710816479
3.开始采集
自动抓取了7个内容,我们需要按需删除与修改(右键菜单删除以及重命名编辑),修改后如下图:
为了采集到更多我们感兴趣的话题,可以选择深入采集,因为上一步我们把链接删到只剩下一个,所以深入采集自动跳转的二级页面就是自动跳转到博主主页。
同样的,我们删掉不需要的字段,再手动添加需要在二级页面抓取的内容。
添加选择好两个字段后,先在右下角点击保存,再在下图左下角选到第一个工作簿。
点击蓝色的开始采集,无需设置其他内容,点击启动。
后羿采集到的数据如图:(还蛮直观好看的)
采集完成(我按需采集了30条),以Excel格式导出数据。
简单编辑处理一下Excel表格,使之美观方便查看。
4.再之后就可以拆解模仿对标,让ChatGPT等大语言模型辅助生成内容。
over,后羿采集器功能还是很强的,可以替代日常工作生活中很多重复性工作,可以看看我录制的这个视频 。
© 版权声明
如有侵权,请联系站长删除
THE END