文档章节

拼音拆分算法

Acce1erator
 Acce1erator
发布于 2016/01/28 11:00
字数 398
阅读 169
收藏 4
public static String polishPinyin(String name) {
		if (name == null || "".equals(name))
			return name;
		name = name.replaceAll("[0-9_]+", "");

		StringBuffer buffer = new StringBuffer();
		char[] chars = name.toCharArray();
		int size = chars.length;

		int i = 0;
		boolean flag = true;// 当前检测的是声母还是韵母
		while (i < size) {
			if (flag) {
				// 先判断前两位是不是声母
				if (i + 1 < size && PinyinUtil.isShengmu(chars[i], chars[i + 1])) {
					buffer.append(chars, i, 2);
					i += 2;
					flag = false;
				} else if (PinyinUtil.isShengmu(chars[i])) {
					buffer.append(chars[i]);
					flag = false;
					i++;
				} else {
					i++;
				}
				if (i == size)
					buffer.append("%");
			} else {
				if (i + 2 < size && PinyinUtil.isYunmu(chars[i], chars[i + 1], chars[i + 2])) {
					buffer.append(chars, i, 3);
					i += 3;
				} else if (i + 1 < size && PinyinUtil.isYunmu(chars[i], chars[i + 1])) {
					buffer.append(chars, i, 2);
					i += 2;
				} else if (PinyinUtil.isYunmu(chars[i])) {
					buffer.append(chars[i]);
					i++;
				} else {
					buffer.append("%");
				}
				flag = true;
			}
		}

		return buffer.toString();
	}

public class PinyinUtil {
	private static final String[] Shengmu = { "b", "p", "m", "f", "d", "t", "l", "n", "g", "k", "h", "j", "q", "x", "z",
			"c", "s", "zh", "ch", "sh", "y", "w" };

	private static final String[] Yunmu = { "a", "o", "e", "i", "u", "v", "ai", "ei", "ui", "ao", "ou", "iu", "ie",
			"ue", "ve", "er", "an", "en", "in", "un", "ang", "eng", "ing", "ong" };

	public static boolean isShengmu(String str) {
		for (String shengmu : Shengmu)
			if (shengmu.equalsIgnoreCase(str))
				return true;
		return false;
	}

	public static boolean isShengmu(char c) {
		return isShengmu(String.valueOf(c));
	}

	public static boolean isShengmu(char c1, char c2) {
		char[] chars = { c1, c2 };
		return isShengmu(String.valueOf(chars));
	}

	public static boolean isYunmu(String str) {
		for (String yunmu : Yunmu)
			if (yunmu.equalsIgnoreCase(str))
				return true;
		return false;
	}

	public static boolean isYunmu(char c) {
		return isYunmu(String.valueOf(c));
	}

	public static boolean isYunmu(char c1, char c2) {
		char[] chars = { c1, c2 };
		return isYunmu(String.valueOf(chars));
	}

	public static boolean isYunmu(char c1, char c2, char c3) {
		char[] chars = { c1, c2, c3 };
		return isYunmu(String.valueOf(chars));
	}
}


© 著作权归作者所有

共有 人打赏支持
Acce1erator
粉丝 23
博文 25
码字总数 18001
作品 0
朝阳
程序员
拼音声母汉字 搜索提示匹配

现在需要做一个搜索的关键字提示,例如有如下关键字 长大 输入cd/changda/zd/z大 等提示 长大 我现在的做法是将关键字词库按照拼音+声母的的混合组合 如 长大 拆分拼音为 cd/changda/changd/...

cswy
2014/04/04
702
5
中州韵输入法引擎--rimeime

Rime全名是「中州韵输入法引擎」,它不仅仅是一个输入法,而是一个输入法算法框架。Rime的基础架构十分精良,一套算法支持了拼音、双拼、注音、五笔、仓颉等所有音码和形码输入法,远比基于码...

tsl0922
2012/11/13
5.1K
2
编程珠玑 - 算法思想 - 词语搜索算法思想

词语搜索算法思想 - 第一步 问题描述 词语搜索算法思想 - 第二步 算法思想 词语搜索算法思想 - 第三步 词语拼音 词语搜索算法思想 - 第四步 拼音组合 词语搜索算法思想 - 第五步 结构实现 自...

方旭
2012/02/25
557
4
一些有用的python库

一、xpinyin 汉字转拼音的库github, https://github.com/lxneng/xpinyin 用起来很方便的 :github给的一些例子 >>> from xpinyin import Pinyin>>> p = Pinyin()>>> # default splitter is ......

kangxin1234
2015/12/03
80
0
拼音转汉字--Pinyin2Hanzi

拼音转汉字,可以作为拼音输入法的转换引擎,兼容Python 2、Python 3。 安装 Python 2: $ python setup.py install --user Python 3: $ python3 setup.py install --user 使用 下面的示例在...

樂天
2016/02/16
614
0

没有更多内容

加载失败,请刷新页面

加载更多

Spring Boot 入门 - 进阶篇(4)- REST访问(RestTemplate)

经常需要发送一个GET/POST请求到其他系统(REST API),通过JDK自带的HttpURLConnection、Apache HttpClient、Netty 4、OkHTTP 2/3都可以实现。 HttpClient的使用:http://rensanning.iteye.c...

onedotdot
14分钟前
1
0
Wi-Fi也有版本号了!

据Solidot消息,行业组织 Wi-Fi 联盟宣布当前的版本 Wi-Fi 802.11ac 重命名为 Wi-Fi 5,而下一个版本 802.11ax 重命名为 Wi-Fi 6,之前的版本 802.11n 改名为 Wi-Fi 4。 Wi-Fi 标准之前使用单...

linux-tao
16分钟前
3
0
项目经验不丰富、技术不突出的程序员怎么打动面试官?

前言 相信不少的程序员都有过类似的困惑:如果我没有大型的项目经历,也不能靠技术征服面试官,那我要怎么才能给面试官留下一个好印象呢? 按照本人的面试经验来说,面试主要看几点:项目经验...

Mamba1
26分钟前
2
0
MyBatis 源码分析----MyBatis 整体架构概要说明

MyBatis整体架构 MyBatis的整体架构分为三层1:基础支持层,2:核心处理层,3:接口层 1:基础支持层: 1-1反射模块: 该模块对Java 原生的反射进行了良好的封装,提供了更加简洁易用的API ,...

西瓜1994
32分钟前
6
0
如何让 J2Cache 在多种编程语言环境中使用

现在的系统是越来越复杂了,不仅仅是功能复杂,系统结构也非常复杂,而且经常在一个系统里包含几种不同语言编写的子系统。例如用 JavaScript 做前端开发、用 Java/PHP 等等做后端,C/C++/Go ...

红薯
33分钟前
44
1

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部