文档章节

当英语作文遇见大数据

灵玖lingjoin
 灵玖lingjoin
发布于 2014/06/19 15:53
字数 2132
阅读 3
收藏 0

如果你是一名在校大学生,或者你是一位大学英语教师,你或许想知道:一篇优秀的英语作文平均句长多少最合适,哪些不地道的“中国式”英语搭配出镜率最高,如何让多少有些让人望而生畏的英语写作变得“喜闻乐见”?新近出炉的《中国学生英语写作能力调查蓝皮书》会告诉你答案。


为调研中国学生英语写作能力,中国高校英语写作教学协同创新联盟(以下简称“联盟”)今年4月以命题作文的形式,征集10万篇学生作品。截止到5月10日,共有近30万名学生在线提交了自己的英语作文。联盟对收集到的英语作文进行初步分析,形成《中国学生英语写作能力调查蓝皮书》的数据报告部分,对相关数据进行深度分析和挖掘的工作正在进行中。


首都师范大学副校长周建设在接受科技日报记者采访时指出,中国目前有超过1亿在校学生学习英语,通过对海量教学数据的收集和分析更能客观真实地反映学生英语能力和教学效果。“大数据时代,如何将大数据技术应用到英语写作教学中,向学生和老师们提供更多数据支持是我们一直在探索的课题”。


大数据分析为英语作文提供“诊断”标准


“语言是人类思维的载体,研究语言,研究怎么应用语言,这是非常值得做的事情,尤其是在大数据时代”,中国工程院院士李德毅表示。他是在近日召开的语言智能与外语能力提升学术研讨会上做上述表述的。


为了帮助大家更好地理解大数据技术在英语写作中的应用,北京语言智能协同研究院副院长张跃举了个形象的例子。人们去医院体检会测量血压,医生会根据测到的数值高低给予相应的治疗。这里涉及到两个问题,首先需要一个测量血压的工具来获取数据,同时对获取到的数据进行评判还要有一个诊断标准。而诊断标准缘何而来呢,势必要通过对海量数据的长期跟踪研究。对英文作文的“诊断”,自然也不例外。


周建设表示,联盟通过在线平台批改网在一个月的时间里搜集到近30万篇英语作文,在较短的时间里获得体量如此庞大的英语作文电子数据,这在过去没有相应技术支持的情况下是难以想象的。“接下来,更重要的是对海量数据进行分析挖掘,获取有助于英语作文评判的数据标准,同时对提高学生英语作文能力提供有针对性的建议”。


事实上,评判一篇英语作文的优劣有很多客观的维度,比如词汇丰富度、从句密度、搭配错误率等等。通过对数据的初步分析,张跃和同事们有了一些发现。他告诉科技日报记者,本次搜集到的作文中,平均句长是20.29个单词,系统共标记2348695处错误,其中出现频率最高的错误是主谓不一致,占比为16.83%,紧随其后的是疑似误用名词词组,占比8.83%。


据介绍,此次英语作文在线征集活动共吸引了来自全国30个省份463所学校的300814名学生和3876位教师的参与。根据学校类别的不同,报告中对985院校、211院校、普通本科、独立学院、高职高专的学生作文进行了比较分析。“对于参加人数超过3000的学校,我们会单独为其出具一份报告,便于其更好地了解学生英语写作的水平”,张跃表示。


在线互动模式让英语写作化身“升级”游戏


在英语作文调研活动筹备会议上,张跃和同事们最初预想的目标是能征集5到10万篇作文。活动开始后,学生和老师们的参与热情着实出乎张跃的预料。5月10日本是作文征集活动的截止日期,但仍有不少此前没赶上参加的学校要求加入。


对学生写作行为数据的分析是此次调研分析的重点之一。报告显示,参与本次活动的学生平均修改3.88次,即学生在老师看到其最终版本之前,已经自行修改了3.88次。在收到的265684篇有效学生作文中,修改2次及以上的篇数为167234篇,占比62.94%。


令张跃感到吃惊的是,来自北京工商大学的一位王同学将作文修改了225次,其修改次数位列榜首。


是什么吸引着学生投入如此大的热情来参与此次活动?张跃分析道,一个很重要的原因在于,学生在线提交作文后只需等待几秒钟,就能得到机器给出的分数和修改建议,根据反馈修改后再次提交,会得到比先前更高的分数。“及时的互动性和分数不断攀升带来的成就感,是学生如此投入的原动力,就像打赢了一场场升级游戏一样。”


和批改网的及时反馈相比,现实中,高校学生从老师那得到的对英语作文的反馈相对滞后。清华大学外语学院教授张文霞介绍,由于高校英语老师教学任务繁重,学生交上来的英文作文往往在半个月之后才能批改完,收到反馈时学生甚至可能都忘记了当时的写作内容。


对此,周建设有着相同的看法。他多次参与教育部组织的教学评估,一次抽查英语作业本时发现一整个班的英文作文没有被批改完。“这不是说老师懒,而是老师的工作量确实太大了,批改作文是一项耗时费力的细活,如果有好的技术来替代这部分工作又何乐而不为呢?”


机器能欣赏到英语作文的美感吗?


人工智能之父、英国科学家阿兰·麦席森·图灵,早在1950年,就发表了一篇题为《机器能思考吗?》的论文,成为划时代之作。


机器能否像人一样欣赏英文作文的美感,从立意的角度对作文进行评判?采访中,科技日报记者一再向专家们求证这一问题。毕竟一篇作文是有一定思想内涵的,不只是一串串没有温度的字符。


对此,周建设坦言,目前人工智能技术没有发展到能让机器从立意的角度去考量一篇英语作文。但是,目前英语考试中的作文部分更多的是考察作者的


表达是否规范,遣词造句是否符合语法要求,从这个角度而言,机器批改作文是可行的。“事实上,托福和GRE等大型考试的作文部分都是机器来阅卷的”。
批改网在得到许多学生和老师支持的同时,也面临着“更看重语言的形式,而不是看语言的内容”的批评。南京大学外语学院教授王海啸则认为,批改网的不足给后来者留下了改进的空间。“大数据时代的数据是没有止尽的,关键在于我们怎么挖!”
清华大学张文霞教授补充道,批改网提供的数据可用于英语写作课堂教学、评测等多个方面,下一步,应将批改网和老师的反馈相结合,按照各自的需求建立所在学校的数据库,同时,对动态的数据要且建且用且增加。

© 著作权归作者所有

共有 人打赏支持
灵玖lingjoin
粉丝 85
博文 2884
码字总数 4069557
作品 0
东城
机器语法纠错能力新突破,微软小英变身英语写作老师

  编者按:机器自动语法纠错是自然语言处理领域的一个经典研究问题,由于能够作为训练数据的句对语料非常有限,机器语法纠错能力长久以来始终无法达到理想的效果。最近,微软亚洲研究院采用...

微软亚洲研究院
07/19
0
0
英语作文:What's a Healthy Family

整理废纸的时候,发现一篇好几年以前读研究生时的英语作文 《什么是健康的家庭》(What's a Healthy Family) 。当时的英语课规定每两周交一篇小作文。我差不多已经都忘了。 重读一遍,我感到...

阮一峰
2007/03/26
0
0
跟托福说分手

练习听力 美国家公共广播电台NPR http://www.npr.org/ 特点:标准美式英语。 建议:每天花三十分钟左右,反复听英语广播,这是听力过关的必经之路。点击网页中左边“BROWSE TOPICS”下面的“...

Fire_to_cheat_
01/20
0
0
小时候如果让AI来批改作业,求情也不能及格了...

  ...   小时候和朋友聊天说的总是   ‘以后要怎样怎样’   现在每次和朋友聊天说的都是   ‘记得以前怎样怎样’   ...   你被机器批改过作业么?抄作业会不会被AI发现啊?  ...

乌镇智库
06/01
0
0
人工智能将在2018高考题中出现?

“汇新杯”新兴科技+互联网创新大赛报名火热进行中 大赛报名入口:https://www.chuangcheng.org.cn/455 距离2018年高考还剩9天, 00后小鲜肉即将步入大学校园。 距高考还有9天,高三学子一定...

创成汇
05/28
0
0

没有更多内容

加载失败,请刷新页面

加载更多

腾讯投资最高1.75亿美元正式进军菲律宾移动支付市场

菲律宾长途电话公司(PLDT)公司今日宣布,中国互联网巨头腾讯和私募股权公司KKR将获得该公司旗下金融科技公司Voyager Innovations的少数股权。 PLDT在一份声明中称:“腾讯和KKR最多将分别收...

linuxCool
30分钟前
2
0
正则介绍及grep/egrep用法

10月16日任务 9.1 正则介绍_grep上 9.2 grep中 9.3 grep下 扩展 把一个目录下,过滤所有*.php文档中含有eval的行 grep -r --include="*.php" 'eval' /data 正则介绍 正则就是一串有规律的字符...

hhpuppy
41分钟前
1
0
J2Cache 中使用 Lettuce 替代 Jedis 管理 Redis 连接

一直以来 J2Cache 都是使用 Jedis 连接 Redis 服务的。Jedis 是一个很老牌的 Redis 的 Java 开发包,使用很稳定,作者维护很勤勉,社区上能搜到的文章也非常非常多。算是使用范围最广的 Redi...

红薯
今天
13
0
一个可能的NEO链上安全随机数解决方案

0x00 困境 链上安全随机数生成应该算是一个比较蛋疼的问题,哪怕你的系统再牛逼,合约程序困在小小的虚拟机里,哪怕天大的本事也施展不开。 更悲催的是,交易执行的时候,是在每一个节点都执...

暖冰
今天
1
0
【大福利】极客时间专栏返现二维码大汇总

我已经购买了如下专栏,大家通过我的二维码你可以获得一定额度的返现! 然后,再给大家来个福利,只要你通过我的二维码购买,并且关注了【飞鱼说编程】公众号,可以加我微信或者私聊我,我再...

飞鱼说编程
今天
5
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部