文档章节

网站敏感骂人词库及算法(附6仟个敏感词)

rin9958
 rin9958
发布于 2016/07/16 22:38
字数 88
阅读 2751
收藏 11

原文:「我今天开着张三丰田去上班 」

strtr:「我今天开着**去上班 」(四个词均替换为了*)

词库下载:badword.src.zip

require('badword.src.php');
$badword1 = array_combine($badword,array_fill(0,count($badword),'*'));
$bb = '我今天开着张三丰田上班';
$str = strtr($bb, $badword1);

转载自:http://www.9958.pw/post/web_badword

© 著作权归作者所有

共有 人打赏支持
rin9958
粉丝 9
博文 113
码字总数 54109
作品 0
程序员
基于DFA敏感词查询的算法简析

文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1.背景 项目中需要对敏感词做一个过滤,首先有几个方案可以选择: a.直接将敏感词组织成S...

李晓晖
2016/10/14
0
0
关于java中敏感词检测的一些总结

Tek_Eternal
2014/09/01
0
0
spetacular/badwords

#bannedwords-违禁词,敏感词库 论坛、社交网站、博客、微博等允许用户生成内容的网站,常常遇到屏蔽违禁词、敏感词、广告、色情等文字的问题。这里给出一份违禁词列表,供大家参考。 共分以...

spetacular
2016/04/19
0
0
请教下java中关于敏感词检测程序的设计思路?

如题,现在手头有现成的敏感词库文件(格式是“敏感词|等级”),还有分词工具jcseg,项目工程里要实现一个对传入的文本(100~200字)进行敏感词检测的功能。 一开始我的思路是这样: 项目启...

Tek_Eternal
2014/08/11
2.3K
7
敏感词检测组件--ToolGood.Words

ToolGood.Words是一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母等功能。 非法词(敏感词)检测类有:、、、 示例代码: string s = "...

ToolGood
2017/01/11
696
0

没有更多内容

加载失败,请刷新页面

加载更多

【挑战剑指offer】系列03:逆序打印单链表

本系列的算法原题来自于“牛客网-剑指offer”,写这个板块,不仅仅是解决算法问题本身,更是手动提高难度、自行变式,思考更多的解决方案,以带给自己一些启发。 1. 【逆序打印单链表】原始题...

LinkedBear
46分钟前
2
0
Linux内存布局

今天这篇文章主要是我之前看Linux内核相关知识和博客Gustavo Duarte中。我主要是看了这篇博客,并且结合之前的知识,对内存管理的的理解又上升了一个档次。所以想通过这篇文章总结下。 我们先...

linuxprobe16
今天
1
0
day94-20180921-英语流利阅读-待学习

记录死亡还是消费死者?自杀报道的媒体偏见 雪梨 2018-09-21 1.今日导读 自杀事件报道一直是新闻报道的重要部分,具有骇人听闻、吸引眼球的特点。可是在报道这些事件的时候,除了客观陈述事实...

飞鱼说编程
今天
4
0
如何通过 J2Cache 实现分布式 session 存储

做 Java Web 开发的人多数都会需要使用到 session (会话),我们使用 session 来保存一些需要在两个不同的请求之间共享数据。一般 Java 的 Web 容器像 Tomcat、Resin、Jetty 等等,它们会在...

红薯
今天
5
0
C++ std::thread

C++11提供了std::thread类来表示一个多线程对象。 1,首先介绍一下std::this_thread命名空间: (1)std::this_thread::get_id():返回当前线程id (2)std::this_thread::yield():用户接口...

yepanl
今天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部