
八爪鱼如何进行百度爱采购厂家信息采集教程
你平时在做电商、B2B业务,或者想找供应链厂家信息的时候,是不是经常头大啊?要一个个网页点开看,效率低得不行。尤其是像在百度爱采购这种平台上,厂家超多,要一个个整理简直要累到爆。不过呢,我最近用了一下八爪鱼这个神器,真的超好用,直接可以批量采集厂家数据,还能一键导出成Excel,爽得一批!
八爪鱼采集器官方链接:https://affiliate.bazhuayu.com/7hypDr
这次就来跟大家聊聊怎么用八爪鱼搞定百度爱采购的厂家信息采集,保证一步步讲明白哈,咱们走起!
第一步,打开网页
首先嘛,咱们得把八爪鱼打开,在首页的【输入框】那里,输入目标网址:https://b2b.baidu.com/c?q,然后点【开始采集】。这时候八爪鱼就自己打开了爱采购的页面,省事儿吧?
这里要注意一个小细节哦:打开网页后如果弹出来【自动识别】的提示,直接点【取消识别】!因为一开始不需要它自动帮咱识别,后面自己来设置更准确。
第二步,批量输入关键词并搜索
想采集什么关键词的厂家自己定,比如“除湿机”“净化器”这种。操作特别简单:
先选中搜索框,点【输入文本】,随便输一个关键词保存一下。
然后选中【搜索】按钮,点【点击该按钮】,这样八爪鱼就能模拟搜索操作了。
要是想批量输入很多关键词呢?那就:
在【打开网页】后加一个【循环】,然后把【输入文本】和【点击搜索】都拖进去。
设置循环方式选【文本列表】,把准备好的关键词一行行贴进去。
最后在【输入文本】那里勾上【使用当前循环里的文本】。
这样设置好后,八爪鱼就能一个关键词一个关键词地自动去搜了,超智能有没有!
第三步,智能识别厂家列表
网页打开,搜索也设置好了,接下来就该采数据了!
直接点右上角的【自动识别】,等几秒钟,它就能自动把厂家列表的数据识别出来啦。而且不仅识别了数据,还顺带把翻页操作也搞定了,省得咱自己写流程,超贴心。
识别好后点【生成采集设置】,八爪鱼就帮你把整个流程搭好了,妥妥的。
小tips:如果它识别出来的数据不是你想要的那一组,记得切换一下识别结果哦!
第四步,编辑和补充字段
不过呢,自动识别虽然牛,但总有漏掉字段的时候,比如注册资本、营业期限这些。
这个时候就可以自己加字段啦:
- 点【提取数据列表】步骤,然后点【+】,选择【从页面中添加字段】。
- 在网页上直接点你想采的字段,比如注册地址、商品价格啥的。
加完字段后,还能把字段名字改成自己喜欢的,或者把没用的字段删掉,整体排版整整齐齐,看着也舒服。
第五步,修改循环翻页和循环列表的XPath
这里稍微复杂一点,不过跟着我来,超简单。
默认生成的翻页XPath有个小毛病:到了最后一页还一直翻,导致下一个关键词都搜不出来。为了避免这个bug,咱们要自己改一下XPath:
【循环翻页】改成:
//li[@class="ivu-page-item ivu-page-item-active"]/following-sibling::li[1][not(@title="下一页")]
【循环列表】改成:
//div[@class="company-search-content"]/div
这样设置完,八爪鱼就能聪明地识别什么时候翻页,什么时候停了,不怕死循环啦!
第六步,启动采集啦
一切准备好后,点一下【采集】然后选【启动本地采集】,八爪鱼就开始飞速地帮你搞数据了,坐等收菜就好。
数据采完了,想怎么导都行,Excel、CSV、HTML、数据库通通支持。我自己是最喜欢导成Excel表格,清晰明了,还能随时拿去用,效率爆表!
最后
我的感觉是,用八爪鱼来采集爱采购的数据,真的又快又方便,手动一条条复制那种苦力活儿再也不用干了,直接批量搞定,工作效率提升好几倍!特别适合需要做电商选品、厂家筛选、供应链资料整理的小伙伴们。想省时间的,真的可以考虑搞起来了呀!