跳转到路径导航栏
跳转到正文内容

对话“反剽窃”软件开发者

http://www.sina.com.cn  2009年06月10日12:20  中国新闻周刊

  全部通过

  “测谎仪”引起的轩然大波,迅速转化为一股对抗与破解的力量。在韩彦坤的校园里,在张晴的校园里,“小白鼠”们讨论最多的,是如何应对这个系统。

  有人探讨抄书的可行性,觉得书不会进论文库。其想法很快被否定,“谁能保证你抄的这本书N年前没有被别人抄过?”

  有人跳出来说,那个系统没这么强大,只要把抄来的句子改成自己的表述,就没问题了。事实上,多数人的选择也确实是对自己的论文“大兴土木”,逐字逐句地进行颠覆性的修改,劳动强度甚至超过当初完成论文。有人举例说明,一句“物质决定意识”如何被改成了“自己的语言”——“我们知道,在物质与意识的关系上,认为后者能够决定前者是不正确的,马克思主义者得出的结论与上述结论是恰恰相反的。前者只能反作用后者,后者起到了决定性的作用。”

  对于这样的修改,有人认为很好,认为“避免抄袭,又多了字数”,也有人认为,“计算机不认可废话,可能还是过不了”。一个大家公认的结论是——“论文水平直线下降”,因为要“写出优质的长篇废话”。

  离毕业答辩的期限越来越近。已有人抛弃掉这种“原始”的修改论文的方式,直接想出了更加高明的办法——“答辩交一个纸质版本;给系统检测的时候送审另外一个版本的电子版”;还有更高明的——把一部分文字变成图片格式,系统就检测不出来了。

  在接受《中国新闻周刊》采访时,沈阳并不否认,在人脑与系统的“测谎”博弈中,后者处于劣势。

  在四川大学,韩彦坤的论文经过修改,通过了检测,马平则要像其他14位本科生和20多位博士生一样,要延迟半年答辩了。

  在华中科技大学,已经被张晴改得面目全非的论文最终通过了答辩,但是被批为“毫无学术含量”。一天以后,张晴所在的院系,接到教务的通知,“全院通过论文检测。”他们对“测谎仪”的战绩非常优异。

  包括张晴在内一批同学在QQ群里互相恭喜——“这是个皆大欢喜的结局”。★

  (部分受访者为化名)

  对话“反剽窃”软件开发者、武汉大学副教授沈阳

  “如果都揭出来不亚于一场政治运动”

  文/凌冰

  中国新闻周刊:武大版的软件在推广的过程中遇到了怎样的阻力,为什么没有率先推广?

  沈阳:国内研究这个的有六七家,真正能够给社会提供实用服务的,可能就只有我们和清华同方。2008年4月完成它的时候,还是希望能推广,但是推了一圈之后发现,问题比较大。很多人一听这个东西,第一是不相信,第二呢,他害怕。没有谁不怕这个东西,哪怕是教授博导之类的。

  中国新闻周刊:华中科技大学这边的情况是,学生们为了应付这个系统,想出了不少“高招”。比如加入一些字节,就不会被查出来。是这样吗?

  沈阳:是的。这个技术暂时还不可能靠语义来辨别。不过在加的不多的情况下,系统还是可以模糊匹配,给出一个很高的相似度。

  中国新闻周刊:许多人质疑:为什么只针对学生,不针对老师?

  沈阳:这个软件并非针对学生的。至于为什么没有查老师(的论文),这个问题我把他叫作“学术原罪”,就是说,经过50万篇论文的抽样发现,这个(指老师的论文抄袭)量非常大,抄袭的人非常多,严重抄袭的人非常多。这就是说,如果都揭露出来,会不亚于一场政治运动。所以我想这个问题可能还需要去讨论。

  中国新闻周刊:是什么导致学术不端行为越来越严重?

  沈阳:社会网络中,这个现象叫做“偏好依附”,就是看到某个人做了这个事情,还得了利,别的人也跟着学,所以最终呢,就是越抄越猛。

  中国新闻周刊:评价论文一般涉及两个问题,一个是学术水平高低,另一个是诚信。但这个软件只能检测出后一个问题。

  沈阳:它不是水平评价软件。我们很多时候对技术的期望值过高,希望世界上有一种东西能够包治百病,但是反剽窃软件只是简单的字符串的对比软件。在很多情况下,人都不能评价人的水平高低,何况是电脑。

  中国新闻周刊:这个系统在国外推行的时候也是很容易破解吗?

  沈阳:这个问题在国际上也都是有的。但是国外还有的人从另外一个角度来分析这个问题。就是说,对于本科生而言,或者对于低端的硕士生而言,他利用这种系统来做改写,对能力的锻炼也很有价值——就是不完全从反剽窃的角度来考虑了。

  中国新闻周刊:你如何判断这个博弈的走向?是系统占上风还是人的破解力量更强大?

  沈阳:从中国的情况来看,今后反剽窃软件推广后,学界抄袭现象依然不容乐观。今后高校将大量出现首先拷贝他人论文,然后修改得面目全非、文理不通的奇观,还是抄,只是抄得更加隐蔽,更加辛苦而已。国外的大学里面,他们平常的作业和小论文如果是抄的,被发现都会被退学,更不用说是答辩的论文了。国外对学者的要求是非常高的,这就是国内和国外的学术廉耻心以及整体学术环境的区别。技术只能跟着人走。

  中国新闻周刊:这样的博弈,会不会让你觉得很沮丧?

  沈阳:学生在拼命修改他们的论文,我也希望逐步去修改我们的软件。这是事物发展的正常规律,我很能理解这种情况,只要我们的剽窃的根源还存在的话,那么这种现象是肯定得不到根治的。所以从技术角度而言,我们只是想着怎样去把这个软件做得更好一点,在技术上做更多的探讨。    ★

  “反剽窃”在路上

  本刊特约撰稿/凌冰 李渝

  国内对学术论文“造假”的监督并非始自今日。2000年3月,上海师范大学法商学院的何云峰教授单枪匹马地建了一个“好汉网”,豪气十足地叫板校园里势头渐旺的剽窃抄袭等不良学风。

  同年,著名“打假斗士”方舟子也创办了中文学术打假网站“新语丝立此存照”,陆续揭露了500多起学术涉假案例,其中包括“核糖核酸”、清华大学医学院“刘辉造假事件”等引起广泛关注的学术造假和腐败事件。方舟子们的学术打假多通过网友检举,并没有专业的仪器进行技术支撑。

  2003年,武汉大学信息管理学院副教授沈阳在国家自然科学基金的资助下,研发了一套与“学位论文学术不端检测系统”功能相似的系统——ROST反剽窃系统,也称为“学术不端行为检测系统”,并于2008年4月研制成功,目前已在全国20多所高校院系推广和100多家期刊社使用,但没有大规模推广。用沈阳的话说,“就像原子弹一样,它是大规模杀伤性武器,这需要核军控的”。

  在2009年“两会”前夕,爆出两起院士涉嫌学术不端行为的事件。6名教授联名投诉中国工程院院士刘兴土涉嫌“抄袭剽窃”。此前不久,浙江大学原副教授贺海波盗用他人研究结果发表多篇论文。贺海波的博士后合作导师、中国工程院院士、浙江大学药学院院长李连达的名字也出现在这些“问题论文”上。随后,教育部部长周济就“贺海波论文造假”事件及处理结果表示,对学术不端行为要像体育界反兴奋剂一样“零容忍”。

  2009年3月19日,教育部发出了《关于严肃处理高等学校学术不端行为的通知》,这是我国教育部门首次就处理学术不端行为发出通知。通知明确高校对本校有关机构或者个人的学术不端行为的查处负有直接责任,应建立健全处理学术不端行为的工作机构。整个学术界颇有山雨欲来的感觉。

  正是在这样的背景下,由中国学术期刊(光盘版)电子杂志社与清华同方知网共同研制的“学位论文学术不端检测系统”(简称“TMLC”)开始在高校推广。

  检测的方法涉及一个专业术语——“自适应多阶指纹”。什么是信息指纹?沈阳副教授打了个比方,就是每个人说话都有口头禅,这个口头禅就是你的一个特征,这个特征就叫信息指纹。具体到一篇文章来说,比如研究金庸小说,金庸喜欢用什么字,用字的规律是多少,每个字在整个文章出现的概率是多少,这就是一个指纹。CNKI科研诚信管理系统研究中心主任孙雄勇向《中国新闻周刊》记者介绍,如果说得通俗一点,就是两篇文章,如果有一个句子相同,哪怕有一些改写,都能检测出来。

  “测谎”工具的检测工作需要强大的后台数据库支持,TMLC的后台是覆盖了超过5000万的学术文献数据库。

  “测谎”技术在目前来说,已经是一个成熟技术了,国外早已广泛应用于多所高校及科研机构。

  在一系列反剽窃网站中,最为出色、应用最广泛的莫过于“Turnitin”,中文意思是“交上来”,它也是全球第一个检测剽窃行为的网站。该网站目前已阻止了世界范围内将近600万的学生和教育者的剽窃行为,在使用高峰期,每天可收到2万篇论文。

  “Turnitin”通过三个数据库的内容来检测交上来的作品:公众可以查到互联网上所有存档的文件(超过45亿页,每天更新4000万页);成百万的已经出版的作品,包括商业数据库、期刊摘要等,还有上万本电子书籍,包括古登堡经典文献收藏;成百万篇学生交到网站的论文。

  在中国,数据库也在不断完善之中。不过,“反剽窃”系统要面对的,似乎远远不是技术难题。                       ★

上一页 1 2 下一页

     新浪独家稿件声明:该作品(文字、图片、图表及音视频)特供新浪使用,未经授权,任何媒体和个人不得全部或部分转载。

已有_COUNT_条评论我要评论

Powered By Google

更多关于 反剽窃 论文测谎仪  的新闻

新浪简介About Sina广告服务联系我们招聘信息网站律师SINA English会员注册产品答疑┊Copyright © 1996-2009 SINA Corporation, All Rights Reserved

新浪公司 版权所有