文档章节

拼音拆分算法

Acce1erator
 Acce1erator
发布于 2016/01/28 11:00
字数 398
阅读 162
收藏 4
public static String polishPinyin(String name) {
		if (name == null || "".equals(name))
			return name;
		name = name.replaceAll("[0-9_]+", "");

		StringBuffer buffer = new StringBuffer();
		char[] chars = name.toCharArray();
		int size = chars.length;

		int i = 0;
		boolean flag = true;// 当前检测的是声母还是韵母
		while (i < size) {
			if (flag) {
				// 先判断前两位是不是声母
				if (i + 1 < size && PinyinUtil.isShengmu(chars[i], chars[i + 1])) {
					buffer.append(chars, i, 2);
					i += 2;
					flag = false;
				} else if (PinyinUtil.isShengmu(chars[i])) {
					buffer.append(chars[i]);
					flag = false;
					i++;
				} else {
					i++;
				}
				if (i == size)
					buffer.append("%");
			} else {
				if (i + 2 < size && PinyinUtil.isYunmu(chars[i], chars[i + 1], chars[i + 2])) {
					buffer.append(chars, i, 3);
					i += 3;
				} else if (i + 1 < size && PinyinUtil.isYunmu(chars[i], chars[i + 1])) {
					buffer.append(chars, i, 2);
					i += 2;
				} else if (PinyinUtil.isYunmu(chars[i])) {
					buffer.append(chars[i]);
					i++;
				} else {
					buffer.append("%");
				}
				flag = true;
			}
		}

		return buffer.toString();
	}

public class PinyinUtil {
	private static final String[] Shengmu = { "b", "p", "m", "f", "d", "t", "l", "n", "g", "k", "h", "j", "q", "x", "z",
			"c", "s", "zh", "ch", "sh", "y", "w" };

	private static final String[] Yunmu = { "a", "o", "e", "i", "u", "v", "ai", "ei", "ui", "ao", "ou", "iu", "ie",
			"ue", "ve", "er", "an", "en", "in", "un", "ang", "eng", "ing", "ong" };

	public static boolean isShengmu(String str) {
		for (String shengmu : Shengmu)
			if (shengmu.equalsIgnoreCase(str))
				return true;
		return false;
	}

	public static boolean isShengmu(char c) {
		return isShengmu(String.valueOf(c));
	}

	public static boolean isShengmu(char c1, char c2) {
		char[] chars = { c1, c2 };
		return isShengmu(String.valueOf(chars));
	}

	public static boolean isYunmu(String str) {
		for (String yunmu : Yunmu)
			if (yunmu.equalsIgnoreCase(str))
				return true;
		return false;
	}

	public static boolean isYunmu(char c) {
		return isYunmu(String.valueOf(c));
	}

	public static boolean isYunmu(char c1, char c2) {
		char[] chars = { c1, c2 };
		return isYunmu(String.valueOf(chars));
	}

	public static boolean isYunmu(char c1, char c2, char c3) {
		char[] chars = { c1, c2, c3 };
		return isYunmu(String.valueOf(chars));
	}
}


© 著作权归作者所有

共有 人打赏支持
Acce1erator
粉丝 21
博文 25
码字总数 18001
作品 0
朝阳
程序员
拼音声母汉字 搜索提示匹配

现在需要做一个搜索的关键字提示,例如有如下关键字 长大 输入cd/changda/zd/z大 等提示 长大 我现在的做法是将关键字词库按照拼音+声母的的混合组合 如 长大 拆分拼音为 cd/changda/changd/...

cswy
2014/04/04
702
5
中州韵输入法引擎--rimeime

Rime全名是「中州韵输入法引擎」,它不仅仅是一个输入法,而是一个输入法算法框架。Rime的基础架构十分精良,一套算法支持了拼音、双拼、注音、五笔、仓颉等所有音码和形码输入法,远比基于码...

tsl0922
2012/11/13
5.1K
2
一些有用的python库

一、xpinyin 汉字转拼音的库github, https://github.com/lxneng/xpinyin 用起来很方便的 :github给的一些例子 >>> from xpinyin import Pinyin>>> p = Pinyin()>>> # default splitter is ......

kangxin1234
2015/12/03
80
0
编程珠玑 - 算法思想 - 词语搜索算法思想

词语搜索算法思想 - 第一步 问题描述 词语搜索算法思想 - 第二步 算法思想 词语搜索算法思想 - 第三步 词语拼音 词语搜索算法思想 - 第四步 拼音组合 词语搜索算法思想 - 第五步 结构实现 自...

方旭
2012/02/25
557
4
拼音转汉字--Pinyin2Hanzi

拼音转汉字,可以作为拼音输入法的转换引擎,兼容Python 2、Python 3。 安装 Python 2: $ python setup.py install --user Python 3: $ python3 setup.py install --user 使用 下面的示例在...

樂天
2016/02/16
614
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

c语言之内存分配笔记

先看一个数组: short array[5] = {1,2} // 这儿定义的一个int类型的数组,数组第1和第2个元素值是1和2.其余后面默认会给值为0; 或者 short array[] = {1,2};//这儿数组第1和第2个元素,数组...

DannyCoder
今天
2
0
Shell | linux安装包不用选择Y/N的方法

apt-get install -y packageOR echo "y" | sudo apt-get install package

云迹
今天
2
0
Hadoop的大数据生态圈

基于Hadoop的大数据的产品圈 大数据产品的一句话概括 Apache Hadoop: 是Apache开源组织的一个分布式计算开源框架,提供了一个分布式文件系统子项目(HDFS)和支持MapReduce分布式计算的软件架...

zimingforever
今天
5
0
八大包装类型的equals方法

先看其中一个源码 结论:八大包装类型的equals方法都是先判断类型是否相同,不相同则是false,相同则判断值是否相等 注意:包装类型不能直接用==来等值比较,否则编译报错,但是数值的基本类型...

xuklc
今天
2
0
NoSQL , Memcached介绍

什么是NoSQL 非关系型数据库就是NoSQL,关系型数据库代表MySQL 对于关系型数据库来说,是需要把数据存储到库、表、行、字段里,查询的时候根据条件一行一行地去匹配,当量非常大的时候就很耗...

TaoXu
昨天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部