PHP处理字符中的emoji表情

原创
2020/04/29 23:26
阅读数 80

点击上方“ 码农编程进阶笔记 ”,选择“置顶或者星标

文末有干货,每天定时与您相约!


utf-8 编码的 emoji 表情或者某些特殊字符占用 4 个字节。utf-8 编码的常用中文字符占用 3 个字节。


三个 PHP 内置函数:

mb_strlen

mixed mb_strlen ( string $str [, string $encoding = mb_internal_encoding() ] ) // 返回具有 encoding 编码的字符串 str 包含的字符数。多字节的字符被计为 1。// 如果给定的 encoding 无效则返回 FALSE


mb_substr

string mb_substr ( string $str , int $start [, int $length = NULL [, string $encoding = mb_internal_encoding() ]] ) // 根据字符数执行一个多字节安全的 substr() 操作。位置是从 str 的开始位置进行计数。第一个字符的位置是 0。第二个字符的位置是 1// mb_substr() 函数根据 startlength 参数返回 str 中指定的部分。

strlen

int strlen ( string $string )// 返回给定的字符串 string 的长度。

判断字符串中是否含有 emoji 表情

函数如下:

function haveEmojiChar($str){    $mbLen = mb_strlen($str);        $strArr = [];    for ($i = 0; $i < $mbLen; $i++) {        $strArr[] = mb_substr($str, $i, 1, 'utf-8');        if (strlen($strArr[$i]) >= 4) {            return true;        }    }        return false;}


移除字符串中的 emoji 表情

函数如下:

function removeEmojiChar($str){    $mbLen = mb_strlen($str);        $strArr = [];    for ($i = 0; $i < $mbLen; $i++) {        $mbSubstr = mb_substr($str, $i, 1, 'utf-8');        if (strlen($mbSubstr) >= 4) {            continue;        }        $strArr[] = $mbSubstr;    }        return implode('', $strArr);}

含有 emoji 表情的字符串在 MySQL 中的储存

MySQL 中使用 utf8mb4 字符集。

PHP 对字符串进行 base64 编码,从数据库中取出时再对字符串进行解码。

直接移除字符串中的 emoji 表情(该方法简单粗暴)


往日精选文章

PHP 垃圾回收机制详解
涨见识| 字节PHP/Golang社招面经
[笔记] 使用 opcache 优化生产环境PHP
高级 PHP 工程师必备的编码技巧及思维
PHP7还没学明白,PHP8就要来了, 能有多快?



本文分享自微信公众号 - 码农编程进阶笔记(lxw1844912514)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部