CS224n研究热点3 高效文本分类的锦囊妙计
博客专区 > hankcs 的博客 > 博客详情
CS224n研究热点3 高效文本分类的锦囊妙计
hankcs 发表于7个月前
CS224n研究热点3 高效文本分类的锦囊妙计
  • 发表于 7个月前
  • 阅读 2
  • 收藏 0
  • 点赞 0
  • 评论 0

标题:腾讯云 新注册用户域名抢购1元起>>>   

摘要:  知识共享署名-非商业性使用-相同方式共享:码农场 » CS224n研究热点3 高效文本分类的锦囊妙计
本文由码农场同步,最新版本请查看原文:http://www.hankcs.com/nlp/cs224n-bag-of-tricks-for-efficient-text-classification.html
CS224n研究热点3 高效文本分类的锦囊妙计
Facebook的fastText 文本分类是NLP中常见的任务,比如情感分析:词袋模型虽然词袋模型只是所有词向量的某种平均,但其维度可以做到很低:为了抵抗词序丢失带来的语义丢失问题,可以用ngram特征来代替。简单的线性模型这并不是神经网络,因为从输入到隐藏层只是一个look-up table,而隐藏层到输出则是一个逻辑斯谛回归线性分类器。训练用交叉熵作为损失函数:Hierarchical softmax与其用一个超大的softmax层,不如用多个Hierarchical softmax:类似于...

继续阅读码农场 » CS224n研究热点3 高效文本分类的锦囊妙计

原文链接http://www.hankcs.com/nlp/cs224n-bag-of-tricks-for-efficient-text-classification.html


感谢阅读本文,欢迎 查看原文或访问 码农场 获取更多内容

标签: CS224n
共有 人打赏支持
粉丝 27
博文 220
码字总数 53391
作品 1
评论 (0)
×
hankcs
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: