拼音拆分算法
拼音拆分算法
Acce1erator 发表于2年前
拼音拆分算法
  • 发表于 2年前
  • 阅读 155
  • 收藏 4
  • 点赞 1
  • 评论 0

移动开发云端新模式探索实践 >>>   

摘要: 在web工程中,很多时候需要通过拼音首字母进行检索,这时候需要把完整或不玩的拼音拆分成以声母开头的模糊关键字,比如kaiyuanzhongguo或者kaiyzg或者kaiyuanzg都要变成k%y%z%g%的形式,通过java解决了这一算法
public static String polishPinyin(String name) {
		if (name == null || "".equals(name))
			return name;
		name = name.replaceAll("[0-9_]+", "");

		StringBuffer buffer = new StringBuffer();
		char[] chars = name.toCharArray();
		int size = chars.length;

		int i = 0;
		boolean flag = true;// 当前检测的是声母还是韵母
		while (i < size) {
			if (flag) {
				// 先判断前两位是不是声母
				if (i + 1 < size && PinyinUtil.isShengmu(chars[i], chars[i + 1])) {
					buffer.append(chars, i, 2);
					i += 2;
					flag = false;
				} else if (PinyinUtil.isShengmu(chars[i])) {
					buffer.append(chars[i]);
					flag = false;
					i++;
				} else {
					i++;
				}
				if (i == size)
					buffer.append("%");
			} else {
				if (i + 2 < size && PinyinUtil.isYunmu(chars[i], chars[i + 1], chars[i + 2])) {
					buffer.append(chars, i, 3);
					i += 3;
				} else if (i + 1 < size && PinyinUtil.isYunmu(chars[i], chars[i + 1])) {
					buffer.append(chars, i, 2);
					i += 2;
				} else if (PinyinUtil.isYunmu(chars[i])) {
					buffer.append(chars[i]);
					i++;
				} else {
					buffer.append("%");
				}
				flag = true;
			}
		}

		return buffer.toString();
	}

public class PinyinUtil {
	private static final String[] Shengmu = { "b", "p", "m", "f", "d", "t", "l", "n", "g", "k", "h", "j", "q", "x", "z",
			"c", "s", "zh", "ch", "sh", "y", "w" };

	private static final String[] Yunmu = { "a", "o", "e", "i", "u", "v", "ai", "ei", "ui", "ao", "ou", "iu", "ie",
			"ue", "ve", "er", "an", "en", "in", "un", "ang", "eng", "ing", "ong" };

	public static boolean isShengmu(String str) {
		for (String shengmu : Shengmu)
			if (shengmu.equalsIgnoreCase(str))
				return true;
		return false;
	}

	public static boolean isShengmu(char c) {
		return isShengmu(String.valueOf(c));
	}

	public static boolean isShengmu(char c1, char c2) {
		char[] chars = { c1, c2 };
		return isShengmu(String.valueOf(chars));
	}

	public static boolean isYunmu(String str) {
		for (String yunmu : Yunmu)
			if (yunmu.equalsIgnoreCase(str))
				return true;
		return false;
	}

	public static boolean isYunmu(char c) {
		return isYunmu(String.valueOf(c));
	}

	public static boolean isYunmu(char c1, char c2) {
		char[] chars = { c1, c2 };
		return isYunmu(String.valueOf(chars));
	}

	public static boolean isYunmu(char c1, char c2, char c3) {
		char[] chars = { c1, c2, c3 };
		return isYunmu(String.valueOf(chars));
	}
}


  • 打赏
  • 点赞
  • 收藏
  • 分享
共有 人打赏支持
粉丝 21
博文 25
码字总数 18001
×
Acce1erator
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: