当前,大数据深刻改变着人类的生产生活。国家在“十三五”期间实施大数据战略。广东也出台了相应的促进大数据发展行动计划,力争抢占数据产业发展高地,建成具有国际竞争力的国家大数据综合试验区。
执大数据慧剑,登顶数据创新应用高峰。6月20日,“我行我数”第二届广东大中专学生大数据应用创新大赛决赛在广州举行,20支入围决赛队伍在高校学者、行业专家、投资机构和各大媒体的见证下现场PK,决出冠、亚、季军和优秀奖。
本次大赛由共青团广东省委员会、广东省教育厅、广东省科学技术厅、广东省大数据管理局、广东省科学技术协会、广东省学生联合会、南方报业传媒集团主办,由南方舆情数据研究院承办。
南方报业传媒集团党委副书记、总经理王垂林,共青团广东省委员会副巡视员林乔林出席活动并为获奖者颁奖。南方报业传媒集团副总编辑、南方舆情数据研究院执行副院长曹轲,华南理工大学计算机学院副院长许勇出席活动并致辞。决赛由华南师范大学计算机学院副院长赵淦森主持。
●南方日报记者 谢庆裕 实习生 陈叶艳 贺元双
统筹:谢思佳
推动大数据的“新力军”
曹轲表示,近年来南方报业一直都在努力为大数据发展鼓与呼,并身体力行地参与到大数据发展建设之中。南方舆情数据研究院成立四年来,依托集团强大的资源支持,建立了良好的平台机制、服务体系以及运营机制,目前南方舆情数据服务覆盖了全省21个地市。去年更联合省经信委、省大数据管理局举办了“大数据应用及产业发展大会”。接下来南方舆情数据研究院将加快自身转型升级步伐,以“舆情+数据”为方向,全面提升服务能力与服务水平,力争早日建设成为国内有影响力的新型智库。希望能够通过这次大赛,汇集大数据发展的智慧与能量,展望大数据应用创新的前景和方向,为大数据发展创造良好的条件,增加发展动力。
许勇指出,以“90后”为代表的年轻人,70%在小学或初中便开始接触互联网,被称为“互联网的原住民”,机灵、好奇、创新和特立独行是其个性。作为“数字青年”,在广泛接触各种信息资源的基础上形成了多元的价值观念,拥有比父辈更广阔的视野,因此,“90后”是推动大数据创新发展的“新力军”。
许勇透露,广东省作为人口大省、经济大省、制造业大省,更是数据大省。据统计,广东的信息产业产值超过3万亿元,占全国的三分之一,在数据量方面,2015年,广东数据存储量超过2300EB,约占全国的20%,居全国首位。“这样海量的数据规模,正等待着各地各高校的年轻人共同探究”。
6支高校团队分获冠亚季军
本次大赛是2017年广东大学生科技学术节的重要组成部分,自今年4月启动以来,吸引了全省大中专院校学生踊跃参与,共有来自20余所高校的139支队伍参赛,经专家评审团评审和网络投票,共20份作品入围了决赛。
主办方介绍,最终入选决赛的20个参赛作品中,既有利用大数据对空气质量、政务公开、共享经济、全面二孩、网络购物等社会热点议题进行的探索,也有借助大数据对海洋生物、音乐动态、历史保护、体育球队等领域进行的研究。
决赛赛程比照首届,由各参赛队伍派出成员登台演讲,进行5分钟PPT现场演示,阐释入围作品精华内容,现场互动接受评审专家的辛辣提问、点评。各评审专家综合评估作品内容和队伍答辩情况,评出获奖队伍。
最终,来自华南师范大学团队的《基于GIS与深度信念网络的PM2.5时空预测》作品获得冠军,奖金10000元;来自华南师范大学团队的《POI数据在历史街区保护与开发中的应用》、华南理工大广州学院团队的《关于16年两大黑天鹅事件的分析报告——基于维基百科》作品获得亚军,奖金5000元;来自五邑大学团队的《商品期货量化交易模型与策略选择》、中山大学团队的《大数据视角下政府信息公开与政府信任关系的探究》、北京理工大学珠海学院团队的《基于多元统计NBA各球队状况分析》获得季军,奖金3000元;余下14份作品获得优秀奖,各获得奖金1000元。
除了奖金奖励,本次竞赛表现优异的选手均有机会获得南方舆情数据研究院(南方报业传媒集团)等知名机构推荐工作/实习机会,且部分优秀作品将在第十一届广东大中专学生科技学术节成果展上进行展示。
正如赵淦森在决赛中所点评到的,当今时代,数据已成为国家基础性战略资源,大数据正日益对全球经济运行机制、社会生活方式和国家治理能力产生重要影响。作为中国改革开放排头兵的广东,应积极应对“新常态下”的大数据产业发展现状,培育更多的大数据人才,继续在全面深化改革中走在前列,这正是举办第二届“我行我数”广东大中专学生大数据应用创新大赛的终极目的。
获奖作品简介
冠军
《基于GIS与深度信念网络的PM2.5时空预测》:
以大数据“训练”机器模型预测PM2.5
PM2.5是近年来大气环境问题的研究热点,存在多种预测方法。华南师范大学团队的作品《基于GIS与深度信念网络的PM2.5时空预测》,通过海量的大数据以及利用机器模型的不断“训练”、“学习”,并与GIS相结合,为PM2.5在不同时空尺度的预测提供了一种可参考的途径。其中气象和环境数据来自50个环境监测站点,记录了2016年5月20日00时至2017年1月31日23时,时间步长为1小时,有效数据样本共238603条。
亚军
《POI数据在历史街区保护与开发中的应用》
分析地理数据 支招传统粤式餐饮
在北京路逛街吃饭的时候,你是否和朋友讨论过传统粤式美食和外来地方美食,谁更受欢迎的问题?来自华南师范大学的参赛队伍把这个问题引申到历史街区的保护与开发,利用POI数据对北京路的餐饮和商业布局进行了分析,并建议政府对广东“老字号”加以保护和引导,注重对自身特色文化产业的培养。
《关于16年两大黑天鹅事件的分析报告——基于维基百科》
维基数据揭示英国脱欧和美国大选的关系
英国公投脱离欧盟,特拉普当选美国总统,两只“黑天鹅”的诞生是否有什么内在联系?来自华南理工大学广州学院“维基队”的梁俊伟和李冠岭通过对英文维基百科的访问数据进行分析,研究结果表明支持英国脱欧和支持特朗普的群众具有相似性。
季军
《商品期货量化交易模型与策略选择》
建模型预测期货量化交易风险
以资金流的走向探究量化交易,并以此建立模型。他们选取上海、郑州、大连等全国重要期货市场的2011-2013年共三年的商品期货分钟级K线数据进行分析,获取了海量的数据。在数据处理的基础上,分析资金流向对未来商品期货价格的影响、当前的资金流向与未来的资金流向的关系。
《大数据视角下政府信息公开与政府信任关系的探究》
政府信息是否越透明越能获取信任
信息不公开成为政府面临信任危机的原因之一,但中山大学“炫技”团队却在他们的报告中认为并不能如此笼统解释。
《基于多元统计NBA各球队状况分析》:
NBA各队三分出手次数呈逐年递增的趋势
来自北京理工大学珠海学院的庞朝曦代表HELLO DATA团队从球队队员配置入手,研究各支球队薪资水平、球员身体素质和NBA比赛经验这三个方面在很大程度上决定了队伍的阵容竞争力。
责任编辑:邹少欢