八爪鱼采集文本循环

在数据采集领域,八爪鱼是一款功能强大的工具,它可以帮助用户批量输入关键词并从多个网站采集相关数据。无论你是需要从京东采集手机数据,还是从知网获取学术文献,八爪鱼都能够轻松应对。今天,我将通过一个具体的教程,带你一步步了解如何使用八爪鱼进行关键词输入和数据采集。

八爪鱼采集器官方链接:https://affiliate.bazhuayu.com/7hypDr

一、单个关键词查询与采集(以京东为例)

在京东网站上,我们可以通过输入关键词来搜索相关商品并采集其数据。以下是具体操作步骤:

Step1:打开网页并输入关键词

首先,在浏览器中打开京东的首页。你需要先登录你的账户,并确保能够正常操作页面。点击“切换到浏览器模式”,然后使用鼠标手动拖动滑块进行验证。

rpa_tutorial_octoparse_guide_text_loop_1

接着,选中页面中的文本输入框,设置一个“输入文字”的操作步骤。在提示框中输入关键词【手机】并确认,这时在流程区的左侧将出现【输入文字】步骤。

Step2:点击搜索按钮

在输入关键词后,接下来我们需要点击页面上的搜索按钮。在步骤设置中选择“点击该按钮”,八爪鱼就会执行搜索操作,显示出所有与“手机”相关的商品。

Step3:提取数据

当搜索结果显示出来后,我们可以开始提取数据。例如,我们可以提取商品的标题和价格。选中商品标题,选择“采集该元素的文本”操作,价格字段也可以进行相同的操作。

Step4:开始采集数据

设置完数据提取后,点击“采集”按钮,选择“启动本地采集”。八爪鱼会自动依次输入关键词并采集相应的数据。

注意: 有些网页会在搜索后更新页面结构,导致无法继续输入下一个关键词。在这种情况下,我们需要将“打开网页”步骤拖入“循环”中,确保每次都能正确加载页面并执行后续操作。

二、批量输入多个关键词并采集数据

如果你有多个关键词需要查询并采集数据,可以使用八爪鱼的“文本循环”功能。以下是如何批量输入多个关键词并采集数据的操作流程。

Step1:设置文本循环

首先,打开八爪鱼,并在“打开网页”步骤后添加一个“循环”步骤。进入循环设置页面,选择“文本列表”循环方式。然后,将预先准备好的关键词列表粘贴到设置框中。你可以一次性输入多个关键词,每个关键词占一行。

rpa_tutorial_octoparse_guide_text_loop_2

Step2:输入多个关键词

在设置完关键词列表后,选择页面中的文本输入框,设置“输入文本”操作,并将其拖入循环中。这样,八爪鱼就会依次将每个关键词填入搜索框进行搜索。

rpa_tutorial_octoparse_guide_text_loop_3

Step3:点击搜索按钮

设置完输入框后,选中页面上的搜索按钮,设置“点击该按钮”操作。八爪鱼会自动执行搜索,显示与每个关键词相关的数据。

rpa_tutorial_octoparse_guide_text_loop_4

Step4:提取数据

你可以选择提取商品的标题、价格等字段。选中相应字段后,设置采集操作,八爪鱼会按照设置的顺序依次提取每个关键词的相关数据。

rpa_tutorial_octoparse_guide_text_loop_5

Step5:开始采集

完成上述设置后,点击“采集”按钮,八爪鱼会自动启动本地采集,依次输入每个关键词并采集数据。

rpa_tutorial_octoparse_guide_text_loop_6

三、批量输入多个关键词(双文本输入)

有些网站需要多个文本框来进行条件筛选,比如知网的高级搜索功能。在这种情况下,我们需要使用“组合文本循环”来处理。以下是如何在知网上批量输入多个关键词进行数据采集的步骤。

Step1:选择检索条件

打开知网的高级搜索页面,选择“作者发文检索”条件,并点击该元素。设置Ajax超时时间为3秒。

rpa_tutorial_octoparse_guide_text_loop_8

Step2:设置组合文本循环

将鼠标移动到第一个输入框,点击后选择“输入文本”,接着设置第二个输入框。为了输入多组关键词,我们需要创建“组合文本循环”。点击流程中的“循环”按钮,选择循环方式为“文本列表”。将每组关键词按要求(用分号隔开)粘贴到文本框中。

rpa_tutorial_octoparse_guide_text_loop_9

Step3:输入多个关键词

在循环中,勾选“使用当前循环里的文本来填充输入框”选项。这确保了八爪鱼能够依次将每组关键词填入到对应的文本框中。

rpa_tutorial_octoparse_guide_text_loop_10

Step4:点击检索按钮

设置完关键词后,选择页面中的“检索”按钮,并设置“点击该按钮”操作。

rpa_tutorial_octoparse_guide_text_loop_11

Step5:提取数据

选择需要提取的数据字段(例如,作者名、文章标题等),设置采集操作。

rpa_tutorial_octoparse_guide_text_loop_12

Step6:优化流程

在流程的高级设置中,可以设置“执行前等待”时间,以确保每次执行时页面加载充分。

rpa_tutorial_octoparse_guide_text_loop_13

Step7:开始采集

完成所有设置后,点击“采集”按钮,选择普通模式,八爪鱼将依次输入每组关键词并采集相关数据。

rpa_tutorial_octoparse_guide_text_loop_14

总结

通过八爪鱼的关键词输入和数据采集功能,我们可以高效地从不同网站提取所需的信息。不论是单个关键词的查询,还是批量输入多个关键词,八爪鱼都能轻松应对,帮助我们提高数据采集效率。如果你需要批量处理数据采集任务,不妨尝试一下这个强大的工具。

我的感觉是,八爪鱼在数据采集方面确实提供了很多灵活的操作方式,尤其是在批量采集和自动化处理上,能够大大减少我们的工作量。对于需要定期采集大量数据的用户,八爪鱼无疑是一个非常值得尝试的工具。

阅读全文
RPA
八爪鱼RPA
支持一键抓取公众号/小红书/抖音/淘宝数据
立即查看
流程自动化
付费
AI爆文训练营
图文变现友好赛道,低门槛、高上限,教你从0到1做个赚钱的公众号!
立即查看
躺着赚钱
¥149/年
何老师陪你做副业
这里聚焦AI副业、个人IP、自媒体运营、写作、赚钱案例。不哔哔,只分享有价值的副业项目。
立即查看
AI赚钱案例
限免
DeepSeek进阶教程
带你全面掌握DeepSeek应用技巧。提升工作、学习效率
立即查看
100万人学过
付费
网盘拉新实战教程
每周花费一小时,手把手教你赚网盘平台佣金
立即查看
500人学过
限时优惠
AiPPT
结合最新AI技术,为用户提供一键生成高质量PPT的解决方案。
立即查看
一键生成 PPT
免费
豆包MarsCode
一款免费的AI编程助手,全新支持DeepSeek R1/V3、豆包大模型1.5自由切换,免部署、更准确、更强大!
立即查看
AI编程助手
免费
Monica AI
Monica AI满血复活DeepSeek【免费】,提升您的聊天、搜索、写作和编程体验。
立即查看
一站式 AI 助手
云服务
腾讯云
综合性的云计算服务平台,现已接入DeepSeek,提供多样化的云解决方案
立即查看
高效可靠
云服务
阿里云
全球领先的云计算与数据服务平台,提供云服务器、存储、数据库、安全等多种服务
立即查看
多样化
DeepSeek企业微信码
免费领取DeepSeek资料