关于中文 Word Simialrity 的一个新思路

2010/04/27 15:04
阅读数 130
今天在用一个 谷歌金山词霸 查词的时候突然迸发了这个灵感。

我们可以借助现有第三成熟语言(特指词相似性已经做得很不错的语言,比如英语)来进行中文词相似性的研究。

比如,在国外已经比较成熟的中英互译和英语词相似的基础上来进行中文的词相似研究。假设我们要寻找与“电脑”最相似的词我们可以这样做(以下方法都用 谷歌金山词霸 做为工具):
1.在翻译软件中,找到“电脑”的可能翻译单词(但我只取它的最准确的翻译),即:Computer
2.再根据 英语词相似软件 找到 它的同义和近义词的集合 S1.
3.再用翻译软件把 S1 中的单词翻译为中文,那么这些中文就是电脑的最相似的词。  

我们还可以用这样的思路来进行拓展。 阅读全文
类别: 自然语言处理  查看评论
展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
1 收藏
0
分享
返回顶部
顶部