八爪鱼如何进行淘宝商品列表页采集

大家在淘宝上找商品的时候,是不是总想批量保存下来慢慢对比?尤其是像我这种,买个东西前恨不得把全淘宝翻一遍的人,手动复制粘贴那可真是要命!后来我发现用八爪鱼采集器可以一键搞定,真的是省心又高效。所以今天就来聊聊,怎么用八爪鱼采集淘宝商品列表,超简单,跟着做保准能成!

八爪鱼采集器官方链接:https://affiliate.bazhuayu.com/7hypDr

淘宝商品采集,搞清这些基本信息先!

这次要采集的页面是淘宝搜索结果页,比如输入关键词“耐克”,八爪鱼就能把搜出来的一堆商品信息都给我们提取出来。
我们能采集到的字段也很丰富,比如关键词、商品标题、店铺名称、价格、付款人数、商品链接、品牌、发货地等等,想要啥有啥,超级方便。

而且,数据可以导出成Excel、CSV、HTML甚至直接存数据库,格式随你挑。

开始动手啦,一步步教你搞定!

第一步:打开网页

首先嘛,当然是让八爪鱼去打开淘宝了。直接在输入框里填上【https://www.taobao.com/】,点击【开始采集】,就能让它打开网页了。

注意呐!如果跳出来个【自动识别】窗口,记得点【不再自动识别】,因为我们这次是手动建流程,自动识别不太适合这次的需求哈。

第二步:登录淘宝账号

这个非常关键!淘宝对爬虫抓取很敏感,不登录的话,很容易被拦截。

做法也不难:

  • 打开右上角【浏览模式】。
  • 找到【请登录】,点进去。
  • 切换到【扫码登录】,拿手机扫一扫就行。
  • 登录完别忘了关闭【浏览模式】。

这样一来,八爪鱼就能以登录状态正常采集啦。

第三步:输入多个关键词并搜索

如果你只想搜索一个关键词,直接在搜索框输入就好了。但如果像我一样,想一口气查“耐克”“阿迪达斯”“匡威”这种多个品牌,那就得批量输入了。

操作如下:

  1. 选中淘宝的搜索框,点【输入文本】,随便输一个关键词,点【确认】。

  2. 在这个【输入文本】步骤后面,加一个【循环】。

    rpa_tutorial_octoparse_case_TB_Product_list_page_collection_1

  3. 循环方式选【文本列表】,然后把你准备好的关键词一行一行输入进去(最多可以输2万个呢)。

  4. 把【输入文本】步骤拖到循环里去。

    rpa_tutorial_octoparse_case_TB_Product_list_page_collection_2

  5. 在【输入文本】的设置里,勾选【使用当前循环里的文本来填充输入框】。

这样一来,每次循环,八爪鱼就会自动切换关键词啦!

接下来,还要点击搜索按钮。这步要注意,淘宝首页和搜索结果页的搜索按钮不太一样,所以要手动改下点击元素的XPath,改成:

    
//button[@class="btn-search tb-bg"] | //form[@id="J_SearchForm"]/button[@class="submit icon-btn-search"]

这样才能保证每次关键词切换以后都能顺利搜索!

小技巧:采集搜索框的文本值,这样能知道每条数据是哪个关键词搜出来的哦!

第四步:采集商品列表数据

终于到最爽的一步了——采集商品数据!

方法特别简单:

  1. 找到页面上任意一个完整的商品信息块,点一下。

  2. 出现黄色提示框后,点【选中子元素】。

  3. 点【选择全部】。

  4. 最后点【采集数据】。

    rpa_tutorial_octoparse_case_TB_Product_list_page_collection_3

这样八爪鱼就知道要采集每个商品的信息啦!它会自动循环,把一页上的所有商品都采下来。

第五步:采集多页数据

只采一页太少了吧?当然要把后面几百页的好货也一网打尽!

继续选中【下一页】按钮,点击【循环点击下一页】,八爪鱼就能自己翻页,采集每一页的商品了。

如果你只想采几页,比如10页,不想翻到最后,那可以在循环设置里自己设定翻页次数,很人性化。

小提醒:如果点的是【下一页】文字,系统提示是【循环点击下一页】;如果点的是整个按钮,提示可能是【循环点击单个链接】,功能是一样的,别慌哈。

rpa_tutorial_octoparse_case_TB_Product_list_page_collection_4

第六步:编辑字段

采集到的字段可能有些用不到,可以进去【提取数据】设置页面删掉一些多余字段,或者调整字段顺序、改个更清楚的名字,后面导出的时候一目了然。

rpa_tutorial_octoparse_case_TB_Product_list_page_collection_5

比如我一般就会把价格放前面,付款人数放后面,自己用着顺手嘛!

第七步:启动采集

搞定所有步骤以后,点击【保存】再【采集】就能开始了!

这时候,八爪鱼会弹出一个窗口,你可以选择【本地采集】(用自己的电脑)或者【云采集】(用八爪鱼的服务器)。
如果用本地采集,别忘了在弹出页面扫码重新登录一下淘宝,保持登录状态哦。

rpa_tutorial_octoparse_case_TB_Product_list_page_collection_6

采集完成后,可以根据需要导出Excel、CSV、HTML等等。一般我们日常用Excel就够了,导出来一看,整整齐齐,超有成就感!

rpa_tutorial_octoparse_case_TB_Product_list_page_collection_7

我的感觉是

用八爪鱼采淘宝数据,真的是又快又稳,还能灵活批量搜索多个关键词。以前我为了找一双合适的跑鞋,各家店一个一个比价,手动复制商品信息,搞得眼睛都快瞎了。现在嘛,几分钟就能把一堆商品全扒下来,想怎么比就怎么比,爽歪歪!

而且这个方法不光能采淘宝,别的平台大同小异,稍微改改也能通用。

所以如果你也有批量采集商品数据的需求,真的超推荐八爪鱼,跟着这个教程一步步来,零基础也能轻松搞定!有什么问题或者遇到特别奇葩的情况,也可以来找我交流哈~

阅读全文
RPA
八爪鱼RPA
支持一键抓取公众号/小红书/抖音/淘宝数据
立即查看
流程自动化
付费
AI爆文训练营
图文变现友好赛道,低门槛、高上限,教你从0到1做个赚钱的公众号!
立即查看
躺着赚钱
¥149/年
何老师陪你做副业
这里聚焦AI副业、个人IP、自媒体运营、写作、赚钱案例。不哔哔,只分享有价值的副业项目。
立即查看
AI赚钱案例
限免
DeepSeek进阶教程
带你全面掌握DeepSeek应用技巧。提升工作、学习效率
立即查看
100万人学过
付费
网盘拉新实战教程
每周花费一小时,手把手教你赚网盘平台佣金
立即查看
500人学过
限时优惠
AiPPT
结合最新AI技术,为用户提供一键生成高质量PPT的解决方案。
立即查看
一键生成 PPT
免费
豆包MarsCode
一款免费的AI编程助手,全新支持DeepSeek R1/V3、豆包大模型1.5自由切换,免部署、更准确、更强大!
立即查看
AI编程助手
免费
Monica AI
Monica AI满血复活DeepSeek【免费】,提升您的聊天、搜索、写作和编程体验。
立即查看
一站式 AI 助手
云服务
腾讯云
综合性的云计算服务平台,现已接入DeepSeek,提供多样化的云解决方案
立即查看
高效可靠
云服务
阿里云
全球领先的云计算与数据服务平台,提供云服务器、存储、数据库、安全等多种服务
立即查看
多样化
DeepSeek企业微信码
免费领取DeepSeek资料