文档章节

拼音拆分算法

Acce1erator
 Acce1erator
发布于 2016/01/28 11:00
字数 398
阅读 194
收藏 4
public static String polishPinyin(String name) {
		if (name == null || "".equals(name))
			return name;
		name = name.replaceAll("[0-9_]+", "");

		StringBuffer buffer = new StringBuffer();
		char[] chars = name.toCharArray();
		int size = chars.length;

		int i = 0;
		boolean flag = true;// 当前检测的是声母还是韵母
		while (i < size) {
			if (flag) {
				// 先判断前两位是不是声母
				if (i + 1 < size && PinyinUtil.isShengmu(chars[i], chars[i + 1])) {
					buffer.append(chars, i, 2);
					i += 2;
					flag = false;
				} else if (PinyinUtil.isShengmu(chars[i])) {
					buffer.append(chars[i]);
					flag = false;
					i++;
				} else {
					i++;
				}
				if (i == size)
					buffer.append("%");
			} else {
				if (i + 2 < size && PinyinUtil.isYunmu(chars[i], chars[i + 1], chars[i + 2])) {
					buffer.append(chars, i, 3);
					i += 3;
				} else if (i + 1 < size && PinyinUtil.isYunmu(chars[i], chars[i + 1])) {
					buffer.append(chars, i, 2);
					i += 2;
				} else if (PinyinUtil.isYunmu(chars[i])) {
					buffer.append(chars[i]);
					i++;
				} else {
					buffer.append("%");
				}
				flag = true;
			}
		}

		return buffer.toString();
	}

public class PinyinUtil {
	private static final String[] Shengmu = { "b", "p", "m", "f", "d", "t", "l", "n", "g", "k", "h", "j", "q", "x", "z",
			"c", "s", "zh", "ch", "sh", "y", "w" };

	private static final String[] Yunmu = { "a", "o", "e", "i", "u", "v", "ai", "ei", "ui", "ao", "ou", "iu", "ie",
			"ue", "ve", "er", "an", "en", "in", "un", "ang", "eng", "ing", "ong" };

	public static boolean isShengmu(String str) {
		for (String shengmu : Shengmu)
			if (shengmu.equalsIgnoreCase(str))
				return true;
		return false;
	}

	public static boolean isShengmu(char c) {
		return isShengmu(String.valueOf(c));
	}

	public static boolean isShengmu(char c1, char c2) {
		char[] chars = { c1, c2 };
		return isShengmu(String.valueOf(chars));
	}

	public static boolean isYunmu(String str) {
		for (String yunmu : Yunmu)
			if (yunmu.equalsIgnoreCase(str))
				return true;
		return false;
	}

	public static boolean isYunmu(char c) {
		return isYunmu(String.valueOf(c));
	}

	public static boolean isYunmu(char c1, char c2) {
		char[] chars = { c1, c2 };
		return isYunmu(String.valueOf(chars));
	}

	public static boolean isYunmu(char c1, char c2, char c3) {
		char[] chars = { c1, c2, c3 };
		return isYunmu(String.valueOf(chars));
	}
}


© 著作权归作者所有

共有 人打赏支持
Acce1erator
粉丝 23
博文 25
码字总数 18001
作品 0
朝阳
程序员
私信 提问
拼音声母汉字 搜索提示匹配

现在需要做一个搜索的关键字提示,例如有如下关键字 长大 输入cd/changda/zd/z大 等提示 长大 我现在的做法是将关键字词库按照拼音+声母的的混合组合 如 长大 拆分拼音为 cd/changda/changd/...

cswy
2014/04/04
924
5
一些有用的python库

一、xpinyin 汉字转拼音的库github, https://github.com/lxneng/xpinyin 用起来很方便的 :github给的一些例子 >>> from xpinyin import Pinyin>>> p = Pinyin()>>> # default splitter is ......

kangxin1234
2015/12/03
80
0
中州韵输入法引擎--rimeime

Rime全名是「中州韵输入法引擎」,它不仅仅是一个输入法,而是一个输入法算法框架。Rime的基础架构十分精良,一套算法支持了拼音、双拼、注音、五笔、仓颉等所有音码和形码输入法,远比基于码...

tsl0922
2012/11/13
5.1K
2
拼音转汉字--Pinyin2Hanzi

拼音转汉字,可以作为拼音输入法的转换引擎,兼容Python 2、Python 3。 安装 Python 2: $ python setup.py install --user Python 3: $ python3 setup.py install --user 使用 下面的示例在...

樂天
2016/02/16
614
0
编程珠玑 - 算法思想 - 词语搜索算法思想

词语搜索算法思想 - 第一步 问题描述 词语搜索算法思想 - 第二步 算法思想 词语搜索算法思想 - 第三步 词语拼音 词语搜索算法思想 - 第四步 拼音组合 词语搜索算法思想 - 第五步 结构实现 自...

方旭
2012/02/25
569
4

没有更多内容

加载失败,请刷新页面

加载更多

jdk8-64

https://pan.baidu.com/s/1sunIF-dBeyDKjFEpuYFyTQ 密码:jhuj

默克鱼
11分钟前
0
0
CentOS 7 网络设置及静态IP配置

一、 CentOS 7 网络设置 使用 CentOS 7 NetInstall(最小安装盘)安装的CentOS默认是没有配置网络的,可以使用 ping 试一下,结果肯定是不能执行的,ping 指定ip不通是没有网络,ping域名不通是...

calmsnow
14分钟前
0
0
前端未来几年的路该怎么走?

在知乎上看到这么一个问题,觉得很有意思,以下是原提问者的见解 过去五年前端的发展过程基本上是一个工程化的过程,框架和工程化工具层出不穷。 近两年其实发展已经比较迟滞了。 框架方面:基...

前端攻城小牛
16分钟前
0
0
LIst的逆向遍历

public class list_demo { public static void main(String[] args) {// TODO Auto-generated method stub List list=new ArrayList<>(); list.add("a"); list.add("b");......

南桥北木
59分钟前
3
0
MySQL插入性能优化

MySQL插入性能优化 标签: 博客 [TOC] 可以从如下几个方面优化MySQL的插入性能。 代码优化 values 多个 即拼接成一个insert values sql, 例如 INSERT INTO MyTable ( Column1, Column2, Co...

蒋先生66
今天
9
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部