文档章节

作文自动批阅程序简介

Kanonpy
 Kanonpy
发布于 2017/03/17 10:49
字数 948
阅读 292
收藏 1

教育一直以来都是各方相争得热点,最近整合了一个python库开发了一个作文自动批阅小应用,前端支持微信交互操作和web操作,有兴趣得道友可以fork下本项目github地址

应用简介


英文作文自动批阅程序,主要包括拼写检测、语法检测、语句一致性检测与主题检测等几个部分。

主要技术栈:

  • Web: Flask、Mako。
  • 语法单词检查:pylinkgrammar、PyEnchant。
  • 学习算法:链语法、决策树。
  • 微信接口库: itchat

效果: 微信示意图 微信示意图

程序架构

程序主要包括了五个模块,拼写检测模块、语法检测模块、统计信息模块、评分模块和前端模块。

模块关系图

1、拼写检查模块

拼写检查模块用PyEnchant对单词进行检查。其通过一个带有正确拼写得字典,判断文章中得词是否为正确拼写,如果不在正确拼写词典中则根据概率返回最可能得拼写单词。

2、语法检查模块

语法检查模块采用pylinkgrammar库,主要通过语法链对语义进行分析。

链语法算法利用词典文件中词条的链接子表达式分析输入文本的句法结构,符合语法的句子会形成完整的链路图(linkpage),而不符合语法的句子会形成局部的链路图(partial linkpage)。更多可见grammar-link

>>> from pylinkgrammar.linkgrammar import Parser
>>> p = Parser()
>>> linkages = p.parse_sent("This is a simple sentence.")
>>> len(linkages)
2
>>> print linkages[0].diagram

        +-------------------Xp------------------+
        |              +--------Ost-------+     |
        |              |  +-------Ds------+     |
        +---Wd---+-Ss*b+  |     +----A----+     |
        |        |     |  |     |         |     |
    LEFT-WALL this.p is.v a simple.a sentence.n .

链语法通过词语的链接属性,来对句子进行分析,将语言知识完全落实到词汇基础上。 在分析不合语法的输人时,链语法分析器能够跨越句子中不合语法的单词,找到后面的词汇,并连接构成有句法意义的词对,比如主语动词,动词宾语和助动词动词等。

3、统计信息模块

这里的统计信息主要包括单词个数,句子平均长度,句子长度方差等。 在很多英文作文的评分中,都会对句子长度、核心单词的数量等指标进行关注,因此在指标中加入了这类的统计信息。

4、评分模块

评分模块功能主要是对单词拼写、句法评分、统计信息三个维度的特征进行整合,输出评分机制。 评分模块主要采用机器学习的方法对给定的样本数据打分情况进行学习,拟合出最接近样本数据的各项评分权重值,从而实现接近人类的评分结果。

5、前端模块

前端主要包括了两种,一种是Web页面,一种是微信端。 Web页面采用Flask构建,模板采用Mako语法。 微信端采用itchat构建。

TODO

  • [ ] 语法检查模块加入马尔科夫链进行检测,对于低分的句子给出正确的修改方法。
  • [ ] 引入主题相关性维度,计算各句之间的相关性,对偏离主题的文章给予低分。
  • [ ] 完善评分模块,加入机器学习训练算法。
  • [ ] 完善微信端功能,使得系统支持ORC图片识别功能,可以让用户直接通过微信拍照上传作文进行批阅。

欢迎关注shikanon~~

标题党

© 著作权归作者所有

Kanonpy
粉丝 16
博文 42
码字总数 45373
作品 0
广州
程序员
私信 提问
教师解放新前沿:让机器给作文打分

计算机智能的发展快速而高效。强大的工具迅速更迭,教师的工作效率也显著提高。其中自动为文章打分的智能软件便应用甚广。作文是大规模语言考试中的必备题型。通过作文可以综合检测应试者运用...

段小凡
2018/10/28
0
0
CNCC2018中国计算机大会:自然语言生成,让机器掌握文字创作的本领

本论坛是2018中国计算机大会(CNCC)的分论坛之一:自然语言生成,让机器掌握文字创作的本领。涉及自然语言生成目前成果总结、产业应用及前景展望。包括微软小冰、阿里小蜜、高考议论文自动生...

子豪兄
2018/10/31
0
0
CMS二次开发

找个人或公司,对CMS进行二次开发订制网站 网站类别:中小学生作文发表网 要求: 一.程序开发语言:PHP+mysql ,可在知名的开源CMS(如帝国等)基础上进行二次开发,也可以整套自主开发。 二....

昊阳
2015/11/19
25
1
在线测试系统数据库表的创建

@红薯 你好,想跟你请教个问题:我现在做一个在线测试系统。题型有选择题、填空题、判断题、问答题。 学生的功能:1、在线测试; 2.查看自己做过的试卷 老师的功能:1.增删改题目; 2.批阅卷...

g084120209
2015/11/02
484
1
android开发中,关于SD卡中PDF文件在android客户端屏幕上显示

android虚拟机上运行。 我想实现android客户端屏幕上显示PDF文件并且可以对该文件进行操作。 阅读或批阅到一半还可以以PDF的格式存回去。

zml1991
2012/07/23
415
0

没有更多内容

加载失败,请刷新页面

加载更多

sync.Mutex 互斥锁

说明: 互斥锁用来保证在任一时刻,只能有一个例程访问某对象。Mutex 的初始值为解锁状态。Mutex 通常作为其它结构体的匿名字段使用,使该结构体具有 Lock 和 Unlock 方法。Mutex 可...

李琼涛
25分钟前
6
0
自建redis笔记

自建redis笔记 最近在linux安装了一下redis,特做一些笔记! 本文先单节点启动redis,然后再进行持久化配置,在次基础上,再分享搭建主从模式的配置以及Sentinel 哨兵模式及集群的搭建 单节点...

北极之北
28分钟前
4
0
扛住阿里双十一高并发流量,Sentinel是怎么做到的?

Sentinel 承接了阿里巴巴近 10 年的双十一大促流量的核心场景 本文介绍阿里开源限流熔断方案Sentinel功能、原理、架构、快速入门以及相关框架比较 基本介绍 1 名词解释 服务限流 :当系统资源...

分布式系统架构
29分钟前
5
0
事假杨晨龙(Z16021)月薪请假单

svn co URL --username xxx-- password yyy ./

桃花飞舞
53分钟前
7
0
当Activity关闭后,网络请求回调的处理

当我们在使用网络请求的时候,一般都是通过回调来获取请求到的数据。对于网络请求的回调需要注意的几个点 比如我们的回调在Activity中处理数据,当我们把Activity关闭后,如果获取到数据时,...

shzwork
54分钟前
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部