文档章节

PHP正则表达式 获取开始字符串和结束字符串中的部分内容

FeanLau
 FeanLau
发布于 2017/05/01 08:17
字数 318
阅读 647
收藏 0

现在有一些网站的文章数据是写在JSON数据里面的,然后网页上的文章数据存储在<script></script>标签里面,现在用PHP 的file_get_content函数获取了整个网页上的字符串数据,如何截取出<script></script>内部的JSON数据呢?

用正则表达式去非常正确的想法,正则表达式的用法有3种:

  1. 正则匹配;
  2. 正则替换;
  3. 正则分割;

这里用到的是正则匹配,下面是从网上找到的、经过验证的正确性的代码:

<?php

//获取开始字符串和结尾字符串之间的部分
$subject = "[i=s] \u672c\u5e16\u6700\u540e\u7531 areyouok \u4e8e 2016-3-5 15:12 \u7f16\u8f91 [\/i]\n\n[attach]41[\/attach][attach]10[\/attach]\u592a\u9633\u5149\uff0c\u91d1\u4eae\u4eae\uff0c\u96c4\u9e21\u9ad8\u9ad8\u5531\r\n";
$pattern = '#\[attach](.*?)\[\\\/attach]#i'; 
$items = preg_match_all($pattern, $subject, $matches);

echo "<pre>";
var_dump($matches);
echo "</pre>";

?>

运行效果的截图如下所示:

说明一点,由于网页上的<script></script>肯定是有很多对的,上面的正则处理表达式考虑到了多种情况的。将多对标签内部的字符串都截取了下来保存在字符串中的。

© 著作权归作者所有

共有 人打赏支持
FeanLau
粉丝 3
博文 221
码字总数 117937
作品 0
浦东
程序员
私信 提问
加载中

评论(1)

FeanLau
FeanLau
注意上面分割的字符串,array[ 0 ]是带有起始标签的,array[ 1 ]是去除起始标签后的字符串,多留意一下,我没注意到下面的array[ 0 ],险些又去思考了。
Java魔法堂:深入正则表达式API

目录                               一、前言 二、正则表达式的使用诉求 三、java.util.regex包 四、java.lang.String实例 五、最短路径实现诉求 六、Java支...

fsjohnhuang
2014/11/16
0
0
正则表达式-笔记

正则表达式的一般技巧 正则表达式如何部分替换匹配到的字符串 查找文本并替换其中一部分内容,另一部分保持不变 例子: 有如下文本,我想把“第xx章”改成“第xx节”,要求中间的数字不被替换...

BjarneCpp
2018/01/19
0
0
Python全栈 正则表达式(re模块正则接口全方位详解)

re模块是Python的标准库模块 模块正则接口的整体模式 re.compile 返回regetx对象 finditer fullmatch match search 返回 match对象 match.属性|方法 re模块的使用: regex = re.compile(patt...

巴黎香榭
2018/08/24
0
0
php正则表达式

http://www.cnblogs.com/baochuan/archive/2012/03/12/2391135.html http://www.jb51.net/article/36172.htm http://www.jb51.net/article/75004.htm 前言 正则表达式是烦琐的,但是强大的,......

污湖洞主
2017/04/21
0
0
Python 字符串和正则表达式的使用

1.字符串 1.1字符串的格式化 #格式化语法"%s" % str1"%s %s" % (str1,str2) #格式化字符串 str1 = "version"num = 1.0format = "%s" % str1print (format)format = "%s %d" %(str1, num)prin......

阿豪boy
2018/02/16
0
0

没有更多内容

加载失败,请刷新页面

加载更多

zookeeper和HBASE总结

zookeeper快速上手 zookeeper的基本功能和应用场景 zookeeper的整体运行机制 zookeeper的数据存储机制 数据存储形式 zookeeper中对用户的数据采用kv形式存储 只是zk有点特别: key:是以路径...

瑞查德-Jack
48分钟前
1
0
Oracle 查询时间在当天的数据

要实现这个功能需要用到trunc这个函数对时间的操作select trunc(sysdate) from dual --2014-12-27 今天的日期为2014-12-27select trunc(sysdate, 'mm') from dual --2014-12-1 ......

覃光林
49分钟前
1
0
阿里技术专家详解 Dubbo 实践,演进及未来规划

作者:曹胜利 链接:https://www.infoq.cn/article/IwZCAp3jo_H5fJFbWOZu?utm_source=tuicool&utm_medium=referral Dubbo 整体介绍 Dubbo 是一款高性能,轻量级的 Java RPC 框架。虽然它是以...

Java干货分享
53分钟前
1
0
深入解读阿里云数据库POLARDB核心功能物理复制技术

日志是数据库的重要组成部份,按顺序以增量的方式记录了数据库上所有的操作,日志模块的设计对于数据库的可靠性、稳定性和性能都非常重要。 可靠性方面,在有一个数据文件的基础全量备份后,...

阿里云官方博客
56分钟前
1
0
Python数据科学环境:Anaconda 了解一下

几乎所有的 Python 学习者都遇到过“安装”方面的问题。这些安装问题包括 Python 自身环境的安装、第三方模块的安装、不同版本的切换,以及不同平台、版本间的兼容问题等。当你因为这些问题而...

crossin
57分钟前
2
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部