文档章节

标记问题:介绍

AllenOR灵感
 AllenOR灵感
发布于 2017/09/10 01:19
字数 498
阅读 1
收藏 0

该系列将描述一些自然语言处理方面的技术,完整目录请点击这里


在很多的 NLP 问题中,我们想对两个序列进行建模,词性标注(POS)问题可能是最早也是最有名的一个案例。在词性标注中,我们的目标是建立一个模型,它的输入是一个句子序列,比如:


模型的输出也是一个标签系列,比如:


(其中,D 表示定语,N 表示名词,V 表示动词)。标签序列的长度和输入序列的长度是一样的,也就是说每个词都会得到一个标签。(在本例子中,Dthe 的标签,Ndog 的标签,Vsaw 的标签,等等以此类推。)

我们使用 x1 . . . xn 序列来表示标记模型的输入:我们将这个称之为一个句子。比如上面的例子,我们的长度为 n = 5,其中 x1 = the,x2 = dog,x3 = saw,x4 = the,x5 = cat。我们将使用 y1,....,yn 表示标记模型的输出:我们将这个序列称为标签序列或者状态序列。在上面的例子中,我们有 y1 = D,y2 = N,y3 = V,等等。

这种类型的问题,其中的关键问题就是一个句子序列 x1,....,xn 映射到标签序列 y1,....,yn 。一般,我们将这个问题称为序列标注问题。


图一:标记问题。模型的输入是一个句子,模型的输出是一个标记好的句子,其中句子的每个词都被标记上了一个标签,比如:N 表示名词,V 表示动词,P 表示介词等等。

我们假设,我们有一个训练集:


其中,x^(i) 表示一个句子序列,y^(i) 表示一个标记序列,即:


我们的任务就是在训练集上面学习出一个映射模型,从输入序列映射到标记序列。

本文转载自:http://www.jianshu.com/p/3b902670d8ba

共有 人打赏支持
AllenOR灵感
粉丝 10
博文 2634
码字总数 82983
作品 0
程序员
基于nio的socket编程

io编程中存在两个问题,io是阻塞的,而且保持多个连接的时候需要加入多线程来保持socket连接。这种方式比较浪费资源,因为每个连接都需要一个线程来保持,这在连接比较多的时候是一个浪费的资...

少不读水浒
2016/10/15
20
0
JFinal后台部署在云服务器的tomcat上,访问失败

@JFinal 波总您好,想跟你请教个问题: 我把一个JFinal写的后台项目部署在云服务器的tomcat上,结果访问失败,提示HTTP Status 404. 部署方法是按照您在博客里介绍的在 webapps 目录之外建目...

南柯三梦
2016/05/13
419
2
Security+认证考试备考经验分享(七)

考试背景 我本身从事的就是信息安全行业的工作,在工作中会接触到各种各样的安全产品和安全知识。公司在安全牛上也购买了企业课程,平时也零零碎碎的跟安全牛课堂学习。虽然一直从事安全行业...

悠悠啊
08/07
0
0
图论 应用篇

上次写了篇图的基本构造方法,运用图这种强大的数据结构结构,还能解决实际应用中的许多问题,今天这篇就主要整理一些常见的应用 一、路径问题 路径问题在图的处理领域是非常重要的。如我们最...

丶legend
2017/11/05
0
0
Apache Struts 2.3.20 发布

Apache Struts 2.3.20 发布了,改进包括: 合并后的安全修补程序版本中,2.3.16.1、 2.3.16.2、 2.3.16.3 扩展现有的安全机制,来阻止访问给 Java 包和类 RedirectResult 参数集合 在默认情况...

Nori
2014/12/12
7.5K
29

没有更多内容

加载失败,请刷新页面

加载更多

下一页

iOS开发用到的图片尺寸汇总

启动图 型号 竖屏 横屏 iPhone SE 640px × 1136px 1136px × 640px iPhone 6s 750px × 1334px 1334px × 750px iPhone 6s Plus 1242px × 2208px 2208px × 1242px iPhone 7 750px × 1334......

业界小白
25分钟前
0
0
浅谈redis

redis是一个开源,内存式的健值存储数据库,也被称为健值存储的字典服务器。健值类型有字符串,hash(哈希类型),set(集合),list(列表) 和有序集合 特征细节: 内存式:redis将健值存储在主...

拐美人
32分钟前
0
0
无限扩容,按需使用!ZStack推出基于阿里云NAS的文件存储服务

日前,ZStack发布2.6.0版本,正式宣布推出基于阿里云NAS的文件存储服务。得益于业界领先的阿里云分布式存储架构,融合NAS后的ZStack 2.6.0拥有高性能、高可靠、容量无限扩展、一键操作、按需...

ZStack社区版
34分钟前
1
0
崛起于Springboot2.X之Mongodb多数据源处理(35)

多数据源:4个mongodb库! 目录结构图: 1、添加pom依赖 <dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-data-mongodb</artifactId>......

木九天
40分钟前
0
0
如何获取显示器的EDID信息

Q1: 为什么要写这篇文章? A1:在最近的工作中遇到了不少问题,其中很多都是和EDID相关的。可以说,作为一家以“显示”为生的企业,我们时时刻刻在与EDID打交道。EDID这东西很简单,但是如果...

DB_Terrill
41分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部