新闻中心新浪首页 > 新闻中心 > 国内新闻 > 正文

中国人叫王涛的最多


http://www.sina.com.cn 2006年01月23日12:10 新闻晚报

  博客中国副总裁、高能物理研究所粒子物理硕士卢亮,提起自己的一个小发明就感到兴奋:2005年,他仅用一个小时的时间就制作了一个小程序,用于统计在博客中国网站中出现的重名重姓数量。他原以为只是玩玩,没想到,这个小程序竟然引来每天30万的点击量,到昨天为止,点击量已累积达1000万次,“大家都想来看看,中国到底有多少人与自己重名。”

  卢亮自己也承认,这个程序只是统计在博客中国里注册的网名,还不够客观。但中国科学院中国姓氏研究专家王大良几十年的研究数据,就有一定的可信性,昨天,他向记者讲述了自己研究中的发现以及中国人姓名中鲜为人知的秘密。

  姓名搜索器程序编写者每天招来30万点击率

  “往常,我们对博客数据库进行开发时,通常把注册者的姓名数据当垃圾信息来处理。”卢亮告诉记者,2005年1月,他突发奇想,编写了一个小程序,只要网民在对话框中输入自己的姓名,按一下回车,不到两秒钟,程序就可以告诉你全中国有多少人与你同名同姓。

  根据卢亮的统计,他公布了如下数据:

  中国人叫刘波的最多,达到130余万人,叫李刚的排名第二,有105万人,叫李海的有90万人,叫张勇的有81万人,其后的王军、王勇、张伟、刘伟、王伟、李伟也都各达70余万人。

  卢亮编完后,将程序放到自己的博客上,三天后,当他再次打开博客时顿时惊呆了,每天30万的点击率让他的访客数成了天文数字,这一数字仍在不断刷新,而他的博客也在短短3天时间里,一跃成为全球博客点击率排名前3000位的主打。

  “此时,我才认识到人们对自己的姓名有多关心。”

  于是他把程序放到了博客网上,一时间,这个程序和公布的数据引起了轩然大波。记者发现,仅连接这个程序的网站就达到数万个,很多媒体也把卢亮公布的数据当作权威数据发表,“一千个人里就有一个叫刘波”的新闻标题充斥着网络,“叫我这个名的居然有3万多人!”的帖子也开始出现。

  我的数据并不权威

  “实际上,我的数据并不权威。”卢亮在接受记者采访时,解释了这个程序的原理。“很简单,这个程序的搜索范围就是在博客中国中,所有博客网页里出现的姓名。”比如一个叫“张三”的人,程序先统计出“张”字在博客网页姓名中出现的频率百分比,然后再统计“三”字的百分比,把两个百分比相乘,就得出“张三”这个名字在博客网页中出现的重复率。

  由于当时博客网页的姓名库有40万个注册姓名,把这个重复率套用到13亿人上,就得到程序给出的答案,包括“刘波有130万”的结果。

  “这个结果肯定是不准确的。”卢亮对记者说,“首先,博客里的注册名不一定是真名。其次,可能会出现一个人注册好几次的情况。另外,中国上网使用博客的人毕竟只占很少比重,随意把这个重复率套用到13亿人上很不准确,只能算出个大概。”

  但卢亮也认为,只要轻点鼠标,就可以知道与自己同名同姓的大概人数,这比到派出所花钱花时间在全国人口户籍库中去查找要方便得多,“而且,公安部的户籍库也只有4亿个姓名。”

  卢亮的程序还有一个功能,就是把所有查询过数据库的人的名字传输到自己的服务器中,“人们用我的程序查询,肯定用的是真名,现在我已经拥有了1000万人的真姓名数据库。”卢亮告诉记者,他浏览了一下这个数据库,发现已有3000多个不同的姓,并得到了姓氏数量的排序,他还发现叫两字名的人特别多,“基本重名重姓排在前20的全是两字名。”

  目前,已有公司要与他合作,把这个程序继续延伸,“我一直在更新这个程序,但最近太忙了。”身为博客中国副总裁的卢亮一直忙于开会、加班,接受记者采访时已经是晚上11点,他还在办公室里。

  名人中的王涛名人王涛真不少

  10万王涛中不乏名人。乒乓世界冠军当然声名远播,足球界还有大小王涛。同是艺术家,有书法王涛,画家王涛和摄影师王涛。中国工程院院士王涛是一女性,为林业专家。宁夏的一位王涛是舍己救人的小英雄。湖北还有一位“专家型工人”。一位1925年入党的33岁新四军烈士也叫王涛。

  中国姓名研究专家统计全国人口姓名难度大

  “统计姓名可没这么简单,这不是一个小程序就能解决的问题。”中国姓名研究中心主任王大良昨天在接受记者采访时很明确地表示,仅仅依靠统计网民的形式来计算全国姓名的重复比例并不可信,“样本数量太少,再说在网上注册名字的可靠性也值得商榷。”

  王大良告诉记者,与前段时间统计姓氏不同,对全中国人姓名的统计难度特别大。

  曾经对中国姓氏进行统计,并排列出最新百家姓的中科院遗传研究所研究员袁义达昨天在接受记者采访时,述说统计姓名的难度。

  “曾经有人问过,中国已经进行了多次人口普查,已经对全中国人口进行过统计,为什么不能直接利用?实际上,普查过程中如果涉及姓名统计,那么工作量将是惊人的。”他告诉记者,中国人的姓氏有4000多个,还算简单,名字则千奇百怪,“很多生僻字无法拼写,还有少数民族地区的姓名完全摸不到规律,就现阶段的技术,人口普查并不能涉及名字。”

  而最近一次对中国人姓名进行统计还是在上世纪90年代,当时派出所使用的还是卡片管理户籍,研究人员曾经统计过这些卡片。

  重复最多的名字应是“王涛”

  “实际上,重名重姓现象还是比较严重的,而且有越来越严重的趋势。”王大良告诉记者,平时常用的姓氏有2000多个,而常用的名则只有3000多个,如果按照能够与姓氏搭配的关系,常用的也就2000个左右,中国有13亿人口,重复的姓名就很多。

  根据他从各地户籍的粗略统计来看,中国最多的重复名应该是王涛,“但也没有100万,充其量只有10万余人。”

  一个程序可以吸引1000万的点击量,其原因在于中国人对自己姓名的重视,“这种重视是中华传统的力量,是一种凝聚力,也是我们研究姓名的原因。”

  袁义达也告诉记者,自从新百家姓公布后,引起了全国的普遍重视,很多地方给他打来电话,诉说自己所在地方的奇怪姓氏,“实际上人们一直把姓氏看得很重要,只是需要一个事件来激发他们的这种关注罢了。”

  三字名才是正宗中国名字

  “实际上,正规的中国名字应该由姓、谱名、名,三个成分构成。”王大良告诉记者,谱名一般是一个家族修家谱时所确定,三十年一小修,六十年一大修,确定谱名和其排序,“一般,谱名有其固定顺序,可以是一首诗,或者是家族老人认为压韵的话语,然后按照辈分,在名字中加入谱名,而最后的名则可自行随意确定。”

  据王大良讲,关于中国姓氏的立法起源于秦朝,当时规定所有山川河流,百姓姓名都不能与皇帝姓名重合,而谱名的规定也从那时开始。

  这个确定姓名的方式除了可以区分辈分外,还起到了消除同名同姓的作用。而到了东汉,两字名突然开始兴起,“王莽篡权后,为了强调自己革新的作用,要求百姓全部使用两字名,由此,中国两字名开始兴起,同名的现象也开始加剧。”

  之后到了唐代,谱名才又重新被人们重视,三字名数量才逐渐增多,但两字名的地位也已确定下来。

  据王大良讲,现在的孔、孟、曾这几大姓仍然在严谨地遵循着谱名的要求,而其他姓氏,谱名的作用则慢慢消失,“现在,除了少数边远地区还在修家谱,用谱名外,城市里已经很少有沿用谱名的情况了。”

  “这也是同名同姓现象如此严重的原因。”作者:□晚报记者 李宁源 制图 邬思蓓


爱问(iAsk.com)

收藏此页】【 】【下载点点通】【打印】【关闭
 
 


新闻中心意见反馈留言板 电话:010-82612286   欢迎批评指正

新浪简介 | About Sina | 广告服务 | 招聘信息 | 网站律师 | SINA English | 产品答疑

Copyright © 1996 - 2006 SINA Inc. All Rights Reserved

版权所有 新浪网