文档章节

PHP中如何过滤掉非汉字字符?

BearCatYN
 BearCatYN
发布于 2015/04/24 12:51
字数 76
阅读 43
收藏 0
点赞 0
评论 0
<?php

$str = "a 1b 2b<中文>。xxyy字符";

//转换 GB2312 -> UTF-8$str = mb_convert_encoding($str, 'UTF-8', 'GB2312');preg_match_all('/[\x{4e00}-\x{9fff}]+/u', $str, $matches);
$str = join('', $matches[0]);

//转换 UTF-8 -> GB2312
$str = mb_convert_encoding($str, 'GB2312', 'UTF-8'); 

echo $str;  //输出 中文字符

?>


本文转载自:http://blog.csdn.net/danson_yang/article/details/20851621

共有 人打赏支持
BearCatYN
粉丝 27
博文 157
码字总数 11947
作品 0
朝阳
程序员
中英文组织机构名过滤

需求:用统计方法抽取出的机构名有很小一部分是错误的,可能包含各种特殊字符或者其他错误情况,需要过滤掉非法的机构。 方法:网上关于机构名过滤的资料很少,再者组织机构命名方式非常多样...

baoer1024 ⋅ 2012/04/10 ⋅ 0

关于 MySQL UTF8 编码下生僻字符插入失败/假死问题的分析

1、问题:mysql 遇到某些中文插入异常 最近有同学反馈了这样一个问题: 上述语句在脚本中 load 入库的时候会 hang 住,web 前端、命令行操作则要么抛出 Incorrect string value: 'xF0xA1x8B...

xrzs ⋅ 2014/11/12 ⋅ 13

如何配置php,使得echo的输出自动过滤掉二进制(乱码)的字符串

以前用一个虚拟主机时,不知主机提供商如何配置的php环境。在代码中使用echo输出字符串时,如果输出的字符串中有不可见的二进制字符,如,字符串来源于直接读取图片的二进制值,则echo不会打...

kejxp1993 ⋅ 2017/07/25 ⋅ 0

word导入中的一个乱码

在做一个题库的项目中,需要将word中的试题导入到数据库中,中间过程真是坎坷,且不说word中的公式,图片等等格式,还有凌乱的排版,还有一些不明觉厉的乱码; 由于PHP暂时不能胜任,所以使用了C#开发...

xilei ⋅ 2014/03/10 ⋅ 0

给对方发邮件,对方收不到,全是乱码的解决办法

造成邮件乱码的原因很多,但归纳起来不外乎有三种情况:一是操作系统和使用的软件设置不同导致的;二是发送邮件时发送程序采用不同的编码标准,如UU、MIME、BINHEX等,而你所用的操作系统程序...

yudi669 ⋅ 2013/12/26 ⋅ 0

盘古分词

盘古分词是一个基于 .net framework 的中英文分词组件。主要功能 中文未登录词识别 盘古分词可以对一些不在字典中的未登录词自动识别 词频优先 盘古分词可以根据词频来解决分词的歧义问题 多...

匿名 ⋅ 2010/12/29 ⋅ 0

MySQL怎么存文本不乱码?

导读 MySQL里怎么存储那些看起来会乱码的字符? 我在“UTF8字符集的表怎么直接转UTF8MB4”一文中介绍了如何把表字符集由UTF8直接转换成UTF8MB4的几种方法。 1、只修改字符集(使用默认校验集...

n88lpo ⋅ 2017/12/06 ⋅ 0

php 正则匹配中文 utf8编码/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$

在javascript中,要判断字符串是中文是很简单的。比如: var str = "php编程"; if (/^[u4e00-u9fa5]+$/.test(str)) { alert("该字符串全部是中文"); } else { alert("该字符串不全部是中文"...

BearCatYN ⋅ 2015/05/12 ⋅ 0

python制作galgame引擎(EX)

来来来,最后一点东西。扯完了这个系列就暂时结束了,然后我就可以滚去再次开始憋代码……当有了比较大的更新或者长了比较大的姿势的时候,这个系列还会更新。极有可能的是,前几篇讨论的东西...

Aprocy ⋅ 2013/01/29 ⋅ 4

python爬取页面的时候如何过滤非GBK编码的不读取?

就是我要爬一个页面的数据,这个页面是GBK的,但是里面会有人回复非GBK的帖子,比如“傘€傘€傘€傘€ ”,这样爬出来的字符如果要decode('gbk')的时候会报错 >>> new.decode('gbk')Traceba...

socket ⋅ 2013/08/01 ⋅ 3

没有更多内容

加载失败,请刷新页面

加载更多

下一页

思路分析 如何通过反射 给 bean entity 对象 的List 集合属性赋值?

其实 这块 大家 去 看 springmvc 源码 肯定可以找到实现办法。 因为 spirngmvc 的方法 是可以 为 对象 参数里面的 list 属性赋值的。 我也没有看 具体的 mvc 源码实现,我这里只是 写一个 简...

之渊 ⋅ 47分钟前 ⋅ 0

vim使用手册--配对括号的查找

1、把光标放在标记有(、[或{处。 2、按%字符 3、此时光标的位置应当在配对的括号处 4、再次按%就可以跳回配对的第一个括号处。

dragon_tech ⋅ 51分钟前 ⋅ 0

c++ 、object-c printf,%02X和%x有什么区别 ?

%x即按十六进制输出,英文字母小写,右对齐。 %02X有以下变化:英文字母变大写,如果输出字符不足两位的,输出两位宽度,右对齐,空的一位补0。超过两位的,全部输出。 如果不用 %02x 会出现...

yizhichao ⋅ 56分钟前 ⋅ 0

Spring源码解析(七)——实例创建(中)

前言 上一节讲到了,Spring 会根据实例的作用域执行不同的创建逻辑,分别是 Singleton、Prototype、其他 Scope,其中 Singleton 会调用 getSingleton 从缓存中获取,缓存中没有才会创建实例;...

MarvelCode ⋅ 56分钟前 ⋅ 0

Thrift RPC实战(六) spring集成thrift

1.服务端设置 对泛型Thrift Service的支持, 通过采用spring配置以及反射的方式来实现.对于一个服务提供者来说,需要提供端口,接口以及接口实现类,因此在接口中spring配置文件中配置如下 <!...

lemonLove ⋅ 59分钟前 ⋅ 0

oracle11g自动分区使用

为什么使用自动分区? 在oracle11g之前,oracle是不支持自动分区功能的,这就可能导致我们系统在运行一段时间之后,就需要看看分区是否创建或者写触发器进行创建分区,否则就会导致数据无法入...

strict_nerd ⋅ 今天 ⋅ 0

Spring mvc ViewResolver视图解析器实现机制

概要 我们在controller里面经常这样return一个ModelAndView。 return new ModelAndView("userList", "users", userList); DispatcherServlet 靠 ViewResolver 把 userList 解析为 /WEB-INF......

轨迹_ ⋅ 今天 ⋅ 0

策略模式

1.策略模式 策略模式是同一个行为的不同处理办法。策略模式和简单工厂模式的区别:1.策略模式主要是方法的执行方式,工厂模式要获取的对象。两者的侧重点不同。 ...

Cobbage ⋅ 今天 ⋅ 0

行政区划代码转为字典形式

原数据为: http://www.mca.gov.cn/article/sj/xzqh/2018/201804-12/201804-06041553.html 手动替换了一下格式,并使用下面的代码处理. # 输入格式s = """110000:北京市110101:东城区1101...

漫步海边小路 ⋅ 今天 ⋅ 0

android apk 签名

创建key,需要用到keytool.exe (位于C:\Program Files\Java\jdk1.6.0_10\bin目录下),使用产生的key对apk签名用到的是jarsigner.exe (位于C:\Program Files\Java\jdk1.6.0_10\bin目录下),把...

国仔饼 ⋅ 今天 ⋅ 0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部