文档章节

C#正则表达式获取html标签之间的内容

Okimbin
 Okimbin
发布于 2013/02/21 22:00
字数 96
阅读 1.3W
收藏 5

正则表达式获取<td>和</td>之间的内容

string str = @"<td>123/126/130</td><td>186/194</td></tr><tr><td>4</td><td><f>beijing</td><td>T60</td>

Regex reg = new Regex(@"(?<=<td>)(.*?)(?=</td>)", RegexOptions.IgnoreCase);//[^(<td>))]

MatchCollection mc = reg.Matches(str);

foreach (Match m in mc)
            {
                webtext.Text += m.Value + "\r\n";
            }

参考资料

正则表达式30分钟入门教程http://www.jb51.net/tools/zhengze.html




© 著作权归作者所有

Okimbin
粉丝 3
博文 22
码字总数 4457
作品 0
海淀
私信 提问
加载中

评论(5)

web天空
web天空

引用来自“kiwivip”的评论

你这样使用环视完全木有必要,直接普通的规则即可。
这就是C#正则提取最简单的写法,哪来的浪费CPU
Okimbin
Okimbin 博主

引用来自“kiwivip”的评论

引用来自“Okimbin”的评论

引用来自“kiwivip”的评论

你这样使用环视完全木有必要,直接普通的规则即可。

我在写的时候用了好几种方法都没成功,就这种方法成功了。那能告诉一下有可以更简单提取上面那段字符串的方法吗?

我不会写c# 我写perl给你看: while(/<td>(.*?)<\/td>/g){...} 这样就行了,用个全局匹配加循环就行,你这样环视当然能行,我只是表达这样浪费cpu木有必要~

哦。原来如此。谢啦
kiwivip
kiwivip

引用来自“Okimbin”的评论

引用来自“kiwivip”的评论

你这样使用环视完全木有必要,直接普通的规则即可。

我在写的时候用了好几种方法都没成功,就这种方法成功了。那能告诉一下有可以更简单提取上面那段字符串的方法吗?

我不会写c# 我写perl给你看: while(/<td>(.*?)<\/td>/g){...} 这样就行了,用个全局匹配加循环就行,你这样环视当然能行,我只是表达这样浪费cpu木有必要~
Okimbin
Okimbin 博主

引用来自“kiwivip”的评论

你这样使用环视完全木有必要,直接普通的规则即可。

我在写的时候用了好几种方法都没成功,就这种方法成功了。那能告诉一下有可以更简单提取上面那段字符串的方法吗?
kiwivip
kiwivip
你这样使用环视完全木有必要,直接普通的规则即可。
微信小程序实现博客园文章阅读功能

在微信小程序开发中,我们可以根据不同的业务场景,开发不同的业务应用,可以基于自身域名服务接口,也可以基于第三方的域名接口进行处理(如果被禁用除外),本篇随笔介绍使用小程序来实现我...

walb呀
2017/12/04
0
0
[python爬虫] 正则表达式使用技巧及爬取个人博客实例

这篇博客是自己《数据挖掘与分析》课程讲到正则表达式爬虫的相关内容,主要简单介绍Python正则表达式爬虫,同时讲述常见的正则表达式分析方法,最后通过实例爬取作者的个人博客网站。希望这篇...

Eastmount
2017/10/18
0
0
[python] 常用正则表达式爬取网页信息及分析HTML标签总结

这篇文章主要是介绍Python爬取网页信息时,经常使用的正则表达式及方法。它是一篇总结性文章,实用性比较大,主要解决自己遇到的爬虫问题,也希望对你有所帮助~ 当然如果会Selenium基于自动化...

Eastmount
2016/04/07
0
0
Pyhon 网络爬虫--简单的爬取功能

从网页上爬取内容大致分为三步: 1、获取整个网页信息(源代码) 2、通过正则匹配,获取指定标签中的内容 3、将获取到的内容写到本地中 一、获取整个网页信息(源代码) import urllib.requ...

年华飞逝我欲何从
前天
0
0
.NET Core 网络数据采集 -- 使用AngleSharp做html解析

有这么一本Python的书: <> 我准备用.NET Core及第三方库实现里面所有的例子. 这是第一部分, 主要使用的是AngleSharp: https://anglesharp.github.io/ (文章的章节书与该书是对应的) 第1章 初...

solenovex
2018/04/29
0
0

没有更多内容

加载失败,请刷新页面

加载更多

复习下Linux去除重复项命令uniq

uniq也是linux管道命令家族中的一员,其主要功能是去除重复项。 在介绍uniq命令之前,我们先来新建在下面的案例中需要用到的文件/tmp/uniq.txt,内容如下:默认情况下uniq只会检索相邻的重复...

php开源社区
24分钟前
17
0
展会人脸识别签到门禁闸机,“快”“准”识别“刷脸”签到

结合客户需求自主研发动态人脸识别身份核查系统。集现场人脸采集、身份验证、黑名单预警、等功能为一体,从读取身份信息到现场采集人脸照片、进行比对、并获取结果,全程自动化,需增加外围硬...

艾力奋会展服务
26分钟前
17
0
mysql索引原则

设计原则 经常被用户条件查询的字段,创建索引 索引不是越多越好;索引占用磁盘空间,影响insert、update、delete性能 经常修改的表,不要建过多的索引;更新表数据时,索引也会进行微调或者...

简到珍
27分钟前
15
0
排序算法(快排&归并&选择&插入&冒泡)-php&go实现

PHP //排序常用算法//排序算法 稳定排序算法class SortAlg{ //冒泡排序 public function maoPaoSort($arr) { $n = count($arr); if ($n <= 1) { ......

山人有妙计
28分钟前
15
0
基于函数计算的 BFF 架构

什么是 BFF BFF 全称是 Backends For Frontends (服务于前端的后端),起源于 2015 年 Sam Newman 一篇博客文章《Pattern: Backends For Frontends —— Single-purpose Edge Services for U......

阿里巴巴云原生
33分钟前
15
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部