文档章节

《SwissCheese at SemEval-2016 Task 4: Sentiment Classification Using an Ensemble of Convolutional ...

AllenOR灵感
 AllenOR灵感
发布于 2017/09/10 01:22
字数 538
阅读 2
收藏 0

作者:Jan Deriu, Maurice Gonzenbach, Fatih Uzdilli, Aurelien Lucchi, Valeria De Luca Martin Jaggi

单位:ETH Zurich

关键词:Sentiment Classification, Convolutional Neural Networks

来源:SemEval-2016 Task 4,论文下载

代码:github

简读:

该论文描述了作者在参加SemEval-2016 Task4时所设计的CNN模型,用来解决推特的一个短文本情感分类问题,下面是具体的模型架构图:


CNN的架构图

数据准备:通过Word2Vec或者GloVe将单词转换成词向量,即把一个句子转换成一个句子矩阵(Sentence Matrix),其中 d 表示每个单词转换成词向量的维度, n 表示句子中一共包含n个单词。

第一个卷积层:m1表示一共有m1个卷积核。每个卷积核的维度是 dh1 ,所以每个卷积核得到 n-h1+1 个元素,即最后得到的元素总个数是 m1 (n-h1+1),表示m1个通道,每个通道中有 n-h1+1 个元素。

第一个池化层:论文中采用取最大值的策略。池化区域是 s1*1 的维度,所以最后每个通道中存在的值的个数是 (n-h1+1)/s1 个元素,输出通道还是 m1 个通道。

第二个卷积层:该卷积层的输入通道是 m1 个,输出通道是 m2 个,每个输出通道中存在 l1-h2+1 个元素。

第二个池化层:论文中采用取最大值的策略。池化区域是 (l1-h2+1)*1 的维度,所以最后每个通道中只存在一个值,输出通道数还是 m2 个通道。

隐藏层:这个一个全连接层,relu函数作为激活函数。

输出层:输出层是用softmax函数来作为最后的判断,进行文本分类。


我利用Tensorflow框架将论文中的模型实现了一下。为了更加方便理解论文,这个代码只考虑了如何实现CNN架构,所以不适合用在真实环境中。当然如果你熟悉Tensorflow,可以非常容易将它进行改写,使得它满足你的要求。

本文转载自:http://www.jianshu.com/p/4bb889f88632

共有 人打赏支持
AllenOR灵感
粉丝 11
博文 2635
码字总数 83001
作品 0
程序员
私信 提问
自然语言处理领域重要论文&资源全索引

选自GitHub 作者:Kyubyong Park 机器之心编译 参与:刘晓坤、李泽南 自然语言处理(NLP)是人工智能研究中极具挑战的一个分支。随着深度学习等技术的引入,NLP领域正在以前所未有的速度向前...

机器之心
2017/10/15
0
0
从 Quora 的 187 个问题中学习机器学习和NLP

Quora 已经变成了一个获取重要资源的有效途径。许多的顶尖研究人员都会积极的在现场回答问题。 以下是一些在 Quora 上有关 AI 的主题。如果你已经在 Quora 上面注册了账号,你可以订阅这些主...

chen_h
2017/10/31
0
0
NLP常用数据集

原文地址: https://machinelearningmastery.com/datasets-natural-language-processing/ 针对NLP中常见的7个问题进行分类,归纳常用数据集,mark之 Text Classification Text classificatio......

Gavin__Zhou
2017/10/19
0
0
Aspect Extraction for Opinion Mining with a Deep Convolutional Neural Network

Sandro Cavallari, PhD Candidate, NTU Aspect Extraction based on frequent words (occurrences and co-ocurrences of noun and noun phrases) by exploiting opinion and target relation......

Shuailong
2017/04/27
0
0
每周论文清单:知识图谱,文本匹配,图像翻译,视频对象分割

[ 自然语言处理 ] Knowledge Graph Embedding: A Survey of Approaches and Applications @jerryshi 推荐 Knowledge Graph 本文对当下流行的 Knowledge Graph Eembedding 进行汇总,主要介绍......

技术小能手
2017/12/27
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Jmeter参数的AES加密使用

在Jmeter日常实践中,大家应该都遇到过接口传参需要加密的情况。以登陆为例,用户名和密码一般都需要进行加密传输,在服务端再进行解密,这样安全系数会更高,但在使用jmeter进行接口测试的时...

程序猿拿Q
12分钟前
0
0
MYSQL 日期函数 Date and Time Functions

Table 12.13 Date and Time Functions Name Description ADDDATE() Add time values (intervals) to a date value ADDTIME() Add time CONVERT_TZ() Convert from one time zone to another ......

_liucui_
18分钟前
0
0
Android代码混淆ProGuard工作原理简介

ProGuard能够对Java类中的代码进行压缩(Shrink),优化(Optimize),混淆(Obfuscate),预检(Preveirfy)。    1. 压缩(Shrink): 在压缩处理这一步中,用于检测和删除没有使用的类,字段...

SuShine
20分钟前
0
0
Idea 2018激活

教程地址: https://www.52pojie.cn/thread-781394-1-1.html 亲测可用

一个不正经的程序员
26分钟前
0
0
Android组件化开发实践和案例分享

目录介绍 1.为什么要组件化 1.1 为什么要组件化 1.2 现阶段遇到的问题 2.组件化的概念 2.1 什么是组件化 2.2 区分模块化与组件化 2.3 组件化优势好处 2.4 区分组件化和插件化 2.5 applicatio...

潇湘剑雨
27分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部