文档章节

php解析html类库simple_html_dom

小良下山化了个缘
 小良下山化了个缘
发布于 09/05 14:50
字数 297
阅读 0
收藏 0
PHP

本文介绍simple_html_dom,就是用来处理网页,可以写爬虫抓取信息;

背景:在项目中获得一个很长的html标签的长字符串,需要解析到里面所有的<img>标签的的src地址;

用正则匹配来做比较麻烦,在朋友的推荐下使用simple_html_dom非常方便,

这个组件不光可以解析字符串,也可以直接传入文件地址和网页url;

下面举例:

<?php
$content = '';//html内容

//
header("Content-type: text/html; charset=utf-8");
include('simple_html_dom.php');
$html = new simple_html_dom();
$html->load($content);
$img = $html->find('img');
foreach ($img as $value) { 
    $src[] = $value->getAttribute('data-src');  //获取自定义属性要用getAttribute,否则无法取到
}
echo "<pre>";
var_dump($src);
echo "</pre>";
  1. 首先要引入simple_html_dom库。git地址:https://github.com/samacs/simple_html_dom。

  2. 参照git里面的例子使用

  3. 中文文档:http://microphp.us/plugins/public/microphp_res/simple_html_dom/manual.htm#section_create

© 著作权归作者所有

共有 人打赏支持
小良下山化了个缘
粉丝 0
博文 34
码字总数 17066
作品 0
西安
后端工程师
私信 提问
php Dom操作 Simple

一直以来使用php解析html文档树都是一个难题。Simple HTML DOM parser 帮我们很好地解决了使用 php html 解析 问题。可以通过这个php类来解析html文档,对其中的html元素进行操作 (PHP5+以上...

我恨你
2016/12/12
7
0
PHP的HTML解析工具--html-parser

php html解析工具,类似与PHP Simple HTML DOM Parser。 由于基于php模块tidy,所以在解析html时的效率比 PHP Simple HTML DOM Parser 快2倍多。 并提供广度优先查询find()和深度优先查询fin...

俊杰Jerry
2013/06/15
5.2K
0
一个简单的开源PHP爬虫框架『Phpfetcher』

一个简单的开源PHP爬虫框架『Phpfetcher』 5.00 / 5 5 1 / 5 2 / 5 3 / 5 4 / 5 5 / 5 1 vote, 5.00 avg. rating ( 98 % score) 转载请注明: 吹水小镇 | reetsee.com 原文链接地址: http:/...

蜗牛奔跑
2015/06/25
0
0
PHP的内存泄露问题与垃圾回收

你写了一个php脚本,一般都不用考虑内存泄露和垃圾回收的问题,因为一般情况下你的脚本很快就执行完退出了。 但在一些运行时间长,数据量大的时候,程序运行一段时间后,php脚本就占用了过多...

Jean
2014/05/19
0
0
那些最好的轮子 - PHP篇

Databse 数据库ORM Doctrine 2 License : MIT Source Code Allo点评:Doctrine是功能最全最完善的PHP ORM,社区一直很活跃,对NoSQL也非常迅速的作出了跟进与支持。但之所以没有说Doctrine是...

kisshua
2016/06/14
33
0

没有更多内容

加载失败,请刷新页面

加载更多

Apache Sentry架构介绍

cdh版本的hadoop在对数据安全上的处理通常采用Kerberos+Sentry的结构。 kerberos主要负责平台用户的权限管理,sentry则负责数据的权限管理。 下面我们来依次了解一下: Kerberos包含一个中心...

hblt-j
14分钟前
0
0
First Bad Version(leetcode278)

You are a product manager and currently leading a team to develop a new product. Unfortunately, the latest version of your product fails the quality check. Since each version is......

woshixin
20分钟前
1
0
executor 和task 优先于线程(68)

java.util.concurrent 包里有一个Executor 框架 基于接口的任务执行工具 只需要一行代码 提交一个runnable 方法 优雅的终止(必须做到,不然虚拟机可能不会退出) 对于负载不重的服务 Execut...

Java搬砖工程师
20分钟前
1
0
一条SQL查询语句是如何执行的

123

writeademo
23分钟前
1
0
CSS中position属性( absolute | relative | static | fixed )详解

四个属性的特点 static:无特殊定位,对象遵循正常文档流。top,right,bottom,left等属性不会被应用。 relative:对象遵循正常文档流,但将依据top,right,bottom,left等属性在正常文档流...

简心
28分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部