【八爪鱼采集攻略】提取数据如何设置自定义抓取方式

【八爪鱼采集攻略】提取数据如何设置自定义抓取方式八爪鱼大数据,八爪鱼爬数据,八爪鱼数据,八爪鱼数据采集,八爪鱼数据采集器,八爪鱼数据采集教程,八爪鱼抓取数据,八爪鱼数据导出,八爪鱼数据分析,八爪鱼数据采集器下载
社会化媒体营销 > 【八爪鱼采集攻略】提取数据如何设置自定义抓取方式

【八爪鱼采集攻略】提取数据如何设置自定义抓取方式(1)

【八爪鱼采集攻略】提取数据如何设置自定义抓取方式

自定义抓取方式包含“从页面中提取数据”’、“从浏览器提取数据”、“生成数据”三部分。

八爪鱼提取数据-自定义抓取方式 图1

1、从页面中提取数据

(1)抓取元素的指定属性值:首先要先选中InnerHtml和OuterHtml查看要提取的属性值是否存在,再选中抓取元素的指定属性值。例如源码:

热门 中,id、class、href就是A标签的属性,在下拉选项中选取要提取的属性名称,即可提取到该属性的属性值,演示如下:

八爪鱼提取数据-自定义抓取方式 图2

八爪鱼提取数据-自定义抓取方式 图3

(2)抓取文本:提取网页中展示的内容,可见的文字信息。

(3)抓取地址:一般用于抓取图片地址或Iframe地址,首先字段的Xpath定位

到的是IMG标签或者Iframe标签,提取其中的src属性值。

(4)抓取选中项的文本:配合循环下拉框试用,提取当前选中项的文本

(5)抓取这个元素的OuterHtml,InnerHtml:提取网页源码

(6)抓取值:一般用于抓取输入框的文字,首先字段的Xpath定位到的是input

标签,提取其中的value值,演示如下:

八爪鱼提取数据-自定义抓取方式 图4

八爪鱼提取数据-自定义抓取方式 图5

(7)抓取超链接:首先字段的Xpath定位到的是A标签,从A标签中提取href

的属性值。演示如下:

八爪鱼提取数据-自定义抓取方式 图6

八爪鱼提取数据-自定义抓取方式 图7

2、从浏览器提取数据

八爪鱼提取数据-自定义抓取方式 图8

(1)页面网址:同添加其他特殊字段中的抓取当前页面的网址效果

(2)页面标题:同添加其他特殊字段中的抓取当前页面的标题效果

(3)从页面源码里抓取:可直接用正则表达式提取网页源码里匹配到的数据

3、生成数据

八爪鱼提取数据-自定义抓取方式 图9

点击显示全文

分页:12
  • 【八爪鱼采集教程】提取数据-自定义合并方式

    八爪鱼·云采集服务平台 www.bazhuayu.com 【八爪鱼采集教程】提取数据-自定义合并方式提取数据里面的八爪鱼提取数据自定义合并方式一般用于将多个字段追加至同一个...

    贡献者:八爪鱼大数据
    136840
  • 股票交易数据抓取采集的方法

    股票交易数据抓取采集的方法_计算机软件及应用_IT/...自定义任务名,也可以不设置按照默认的就行 任务组:...【八爪鱼采集攻略】提取... 暂无评价 8页 免费©...

    贡献者:八爪鱼大数据
    190676
  • 饿了么数据抓取以及采集方法

    八爪鱼·云采集网络爬虫软件 www.bazhuayu.com 饿了么数据抓取以及采集方法本文...“自定义采集” 2》将要采集的网址 URL 复制粘贴到网站输入框中,点击“保存网址...

    贡献者:八爪鱼大数据
    237089
  • 八爪鱼采集提取数据中格式化数据的设置《支持正则》

    下面对格式化数据进行演示: 步骤一:点击自定义采集下的立即使用→输入网址并保存 格式化数据的设置《支持正则》-图 1 八爪鱼·云采集服务平台 www.bazhuayu.com ...

    贡献者:八爪鱼大数据
    812609
  • 八爪鱼采集器-新手攻略_图文

    八爪鱼采集器-新手攻略_计算机硬件及网络_IT/计算机...获取数据包:有些数据属于很多客户都需要的数据,如...八爪鱼采集器使用方法使用八爪鱼采集器,最常用的就...

    贡献者:keven1006
    424820
  • 【八爪鱼采集攻略】蚂蜂窝美食评论信息采集

    【八爪鱼采集攻略】蚂蜂窝美食评论信息采集_互联网_...并进行自定义命名 八爪鱼·云采集服务平台 www....数据”选择“合适的导出方式”,将 采集好的数据导出...

    贡献者:八爪鱼大数据
    185278
  • 八爪鱼采集器提取数据-找不到时如何处理

    如下图: 八爪鱼提取数据 找不到时如何处理-图 1 下面介绍如何设置找不到字段时的操作: 步骤一、点击需要设置的字段名称→自定义数据字段→自定义定位元素方式 ...

    贡献者:八爪鱼大数据
    357902
  • 八爪鱼采集器不用配规则采集数据的方法

    八爪鱼采集器不用配规则采集数据的方法_互联网_IT/计算机_专业资料。八爪鱼采集器不用配置采集规则的快速采集办法 八爪鱼采集器不用配置规则也能采集网页数据图文 ...

    贡献者:无此出处
    150373
加载中...
加载中...
  • XPath语法规则及实例

    XPath语法规则及实例_IT/计算机_专业资料。XPath 语法规则术语: 一、 XPath 术语: 1. 节点: 在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指...

  • xpath的使用方法

    xpath的使用方法_计算机软件及应用_IT/计算机_专业资料。xpath的使用方法 首先要说的是 XPath 数据类型。XPath 可分为四种数据类型: 1. 节点集《node-set》 节点...

  • xpath详解总结,很全面

    请看一个典型的 XPath 查询表达式:/messages/message//child:: node《》[@id=0],其中/messages/message 是路径《绝对路径以"/ "开始》,child::是轴表示在子节点...

  • Xpath使用实例简单粗暴

    Xpath使用实例简单粗暴_计算机软件及应用_IT/计算机_专业资料 暂无评价|0人阅读|0次下载|举报文档Xpath使用实例简单粗暴_计算机软件及应用_IT/计算机_专业资料。XPath...

  • JS中常用的xpath特性

    JS中常用的xpath特性_计算机软件及应用_IT/计算机_专业资料。JS中常用的xpath特性JS 中常用的 xpath 特性 //选择所有 dir 元素的值等于 xx 的元素 Dom.document...

24小时热门信息
  • Docker 学习笔记

    //github.com/yeasy/docker_practice/raw/master/_local/.bashrc_do cker; echo "[ -f ~/.bashrc_docker ] && . ~/.bashrc_docker" >> ~/.bashrc; ...

    贡献者:luziq
    245042
  • Docker on CentOS

    To try something more ambitious, you can run an Ubuntu container with: $ docker run -it ubuntu bash For more examples and ideas, visit: http://docs...

    贡献者:snake890603
    482090
  • docker镜像仓库常见问题汇总

    docker镜像仓库常见问题汇总_互联网_IT/计算机_专业资料。解决docker镜像《V2》仓库删除问题 Docker 镜像仓库常见问题汇总安装镜像仓库 v2 yum installdocker-distribution...

    贡献者:missrian
    188033
  • Docker 镜像的存储机制介绍

    Docker 镜像的存储机制介绍 近几年 Docker 风靡技术圈,不少从业人员都或多或少使用过,也了解如何通过 Dockerfile 构建镜像, 从远程镜像仓库拉取自己所需镜像,推送...

    贡献者:贾宝传奇
    174357
  • docker环境搭建

    docker环境搭建_计算机软件及应用_IT/计算机_专业资料。docker环境安装全文 Docker 是 PasS 提供商 DoctCloud 开源的一个基于 LXC 的高级容 器引擎,源代码托管在 ...

    贡献者:张小飞705
    767694
  • docker in dockers错误

    docker run -d -p 127.0.0.1:8080:8080 -v /var/lib/jenkins:/var/jenkins_hom e --add-host=dockerhost:`/sbin/ip route | /usr/bin/awk '/...

    贡献者:崩高级
    248184
精彩推荐
手机版 | 欢迎来到社会化媒体营销
RSS订阅