文档章节

【码云周刊第 33 期】6款程序员必备的开源中文处理工具

码云Gitee
 码云Gitee
发布于 2017/08/11 12:52
字数 908
阅读 9.8K
收藏 170

#程序员薪资揭榜#你做程序员几年了?月薪多少?发量还在么?>>>

码云周刊

##码云项目推荐

1、项目名称: 中文转拼音库 pinyin4j

中文转拼音库 pinyin4j

**项目简介:**Pinyin4j 是一个流行的 Java 库,支持中文字符和拼音之间的转换。拼音输出格式可以定制。

**项目地址:**https://gitee.com/cocho/pinyin4j

**2、项目名称:汉字/拼音转换工具库 Pinyin4Net **

**项目简介:**Pinyin4Net 是一个 .net 下的汉字/拼音转换工具库。现支持 .net2.0, .net4.0, .netcore1.1 ( standaedlib1.6 ),针对三个 .net 版本分别有3个分支。

接口:

  • 汉字单字转拼音
  • 汉字字符串转拼音
  • 汉字转拼音格式选项,可用大小写,声调以及对拼音中(v ü)的处理
  • 获取汉字多音字的所有读音
  • 根据拼音查询所有匹配的汉字
  • 姓名拼音单独数据库和单独的查询接口

**项目地址:**https://gitee.com/hyjiacan/Pinyin4Net

3、项目名称:php 拼音扩展 pinyin-php

**项目简介:**pinyin-php 是一个 C 语言编写的 php 扩展,用于将汉字翻译为汉语拼音。通过逆序中文分词的方法实现提高多音字识别。将字词库置于程序之外通过 php.ini 配置文件指定路径加载。

**项目地址:**https://gitee.com/duguying2008/pinyin-php

4、项目名称:敏感词检测组件

性能对比

**项目简介:**一款高性能非法词(敏感词)检测组件,附带繁体简体互换,支持全角半角互换,获取拼音首字母,获取拼音字母,拼音模糊搜索等功能。

**项目地址:**https://gitee.com/toolgood/ToolGood.Words

**5、项目名称: 基于 PHP 的简繁体转换工具 ccsw **

**项目简介:**ccsw 是基于 opencc4 php 开发,能很智能的完成简繁体转换。功能如下所示:

转换效果: 你干什么不干我事 => 你幹什麼不干我事

地区词汇转换效果: 我鼠标哪儿去了 => 我滑鼠哪兒去了

**项目地址:**https://gitee.com/flyhope/opencc4php

6、项目名称: 拼音搜索汉字工具 UTPinYinHelper

演示

**项目简介:**本项目是通过拼音去匹配汉字,简单来说,就是拼音搜索。

**项目地址:**https://gitee.com/tangzhengyue/UTPinYinHelper

码云一周更新说明

  • 代码片段编辑器支持高亮;
  • 代码片段搜索支持内容的搜索;
  • 新增 CSDN 第三方登录;
  • 修复项目转移后文件404的缓存问题;
  • 个人升级为组织以及企业保留代码片段;
  • PR 合并支持 Squash Merge(即将需要 merge 的多个提交合并成一个提交)。
  • 码云 Markdown 解析器更换为 CommonMark 解析器

之前码云的解析器基于用户的反馈做了很多定制化的修改,但是随着使用码云的用户越来越多,以及越来越多的Github用户往码云上迁移,我们收到了很多用户反馈,在Github正常解析渲染的Readme在码云上渲染出来的结果却有所出入,讨论再三,我们决定将码云的 Markdown 解析器更换为 CommonMark。

##推荐阅读:

【码云周刊第 32 期】程序员眼中的 Vue 与 Angular !

【码云周刊第 31 期】从实战项目开始学做微信小程序!

【码云周刊第 30 期】打造场景化的图片特效处理工具

【码云周刊第 29 期】构建高性能微服务架构

【码云周刊第 28 期】计算机视觉时代的识图技术

##请关注码云官方微信公众号,了解更多开源项目资讯! 码云微信公众号

© 著作权归作者所有

码云Gitee

码云Gitee

粉丝 798
博文 111
码字总数 127666
作品 0
深圳
私信 提问
加载中

评论(4)

inuxor
inuxor

引用来自“久永”的评论

什么程序员啊,难道 phper 等同程序员?做网页的也配算程序员?
那个2不就是尊贵的大刀奈特吗?
久永
久永
什么程序员啊,难道 phper 等同程序员?做网页的也配算程序员?
Elven_Xu
Elven_Xu
舅服你
乌扎拉
乌扎拉
OSChina 技术周刊第二十期 —— 使用 Docker 搭建 Java Web 运行环境

每周技术抢先看,总有你想要的! 移动开发 【软件】移动端web框架 Frozen UI 【博客】Android各种Adapter的用法 服务端开发/管理 【翻译】2014 Docker 的竞争随即而来 【翻译】Docker 和 PI...

OSC编辑部
2015/02/01
2.7K
2
OSChina 技术周刊第二十五期 —— 每周技术精粹

每周技术抢先看,总有你想要的! 移动开发 【翻译】AngularJS 应用访问 Android 手机的照片库 【软件】跨平台移动端开发 NativeScript 【博客】Android Studio建立jni开发环境 【博客】Xamar...

OSC编辑部
2015/03/15
2.6K
3
OSChina 开源周刊第 33 期 —— Java 7 生命周期终结

每周技术抢先看,总有你想要的! 开源资讯 Node.js 和 io.js 准备合作!合久必分,分久必合? Nervana 开源深度学习软件,性能超 Facebook、Nvidia产品 B 站建开源工作组 多 APP 使用其开源项...

OSC编辑部
2015/05/09
4.4K
1
OSChina 技术周刊第十九期 —— 开源看板管理系统 LibreBoard

每周技术抢先看,总有你想要的! 移动开发 【软件】移动后端服务平台 Uncode 【博客】Android四大组件之一:BroadcastReceiver 【博客】仿QQ列表滑动弹出按钮、长按提示、刷新列表 服务端开发...

OSC编辑部
2015/01/25
5.8K
6
OSChina 技术周刊第 24 期 —— C# 6.0 的新特性

每周技术抢先看,总有你想要的! 移动开发 【博客】Swift社交应用文本输入优化汇总 服务端开发/管理 【翻译】HTTP/1 的最佳实践并不适合 HTTP/2 【翻译】使用 AppDomain 存储实现大数据集合 ...

OSC编辑部
2015/03/09
1.8K
0

没有更多内容

加载失败,请刷新页面

加载更多

数据倾斜

数据倾斜: 两种数据倾斜发生的现象: 80%情况下都发生挂了,只有极少20%情况下能把task执行完成 窄依赖:结构简单,如果发生数据丢失,方便查找丢失的数据 宽依赖:结构复杂,如何发生数据丢...

七宝1
今天
20
0
我的jdk源码(十一):ArrayList

一、概述 ArrayList类是AbstractList的子类,实现了具体的add(), set(), remove()等方法。它是一个可调整大小的数组可以用来存放各种形式的数据。 二、源码分析 (1) 类的声明,源码如下: ...

Java觉浅
昨天
24
0
vnc server,vnc server是什么,vnc工具推荐

nc server是一个用来共享linux服务器上资源给其他分布式用户的服务只要再一台linux系统的机器上安装vnc server,然后开启服务,其他机器就可以通过vncviewer访问这台机器上的共享资源,那么今...

兔子m
昨天
20
0
COLA的扩展性使用和源码研究

cola扩展点使用和设计初探 封装变化,可灵活应对程序的需求变化。 扩展点使用 步骤: 定义扩展点接口,类型可以是校验器,转换器,实体; 必须以ExtPt结尾,表示一个扩展点。 比如,我定义一个...

李福春carter
昨天
27
0
0、MySql第零章,安装及集群配置

MySql第零章,安装及集群配置 一、MySql安装 1、RPM安装 RPM安装,无法自定义一些安装路径和配置文件路径 ##以后再填坑 2、Generic安装 二进制 预编译 Generic,下载地址: https://cdn.m...

有一个小阿飞
昨天
17
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部