PHP正则表达式 获取开始字符串和结束字符串中的部分内容
博客专区 > FeanLau 的博客 > 博客详情
PHP正则表达式 获取开始字符串和结束字符串中的部分内容
FeanLau 发表于7个月前
PHP正则表达式 获取开始字符串和结束字符串中的部分内容
  • 发表于 7个月前
  • 阅读 24
  • 收藏 0
  • 点赞 0
  • 评论 1

腾讯云 新注册用户 域名抢购1元起>>>   

现在有一些网站的文章数据是写在JSON数据里面的,然后网页上的文章数据存储在<script></script>标签里面,现在用PHP 的file_get_content函数获取了整个网页上的字符串数据,如何截取出<script></script>内部的JSON数据呢?

用正则表达式去非常正确的想法,正则表达式的用法有3种:

  1. 正则匹配;
  2. 正则替换;
  3. 正则分割;

这里用到的是正则匹配,下面是从网上找到的、经过验证的正确性的代码:

<?php

//获取开始字符串和结尾字符串之间的部分
$subject = "[i=s] \u672c\u5e16\u6700\u540e\u7531 areyouok \u4e8e 2016-3-5 15:12 \u7f16\u8f91 [\/i]\n\n[attach]41[\/attach][attach]10[\/attach]\u592a\u9633\u5149\uff0c\u91d1\u4eae\u4eae\uff0c\u96c4\u9e21\u9ad8\u9ad8\u5531\r\n";
$pattern = '#\[attach](.*?)\[\\\/attach]#i'; 
$items = preg_match_all($pattern, $subject, $matches);

echo "<pre>";
var_dump($matches);
echo "</pre>";

?>

运行效果的截图如下所示:

说明一点,由于网页上的<script></script>肯定是有很多对的,上面的正则处理表达式考虑到了多种情况的。将多对标签内部的字符串都截取了下来保存在字符串中的。

共有 人打赏支持
粉丝 2
博文 194
码字总数 99378
评论 (1)
FeanLau
注意上面分割的字符串,array[ 0 ]是带有起始标签的,array[ 1 ]是去除起始标签后的字符串,多留意一下,我没注意到下面的array[ 0 ],险些又去思考了。
×
FeanLau
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: