一个大三学生、一个中年人和一场大数据创意大赛

现在,没有所谓的大数据热点,哪个领域在做大数据,哪个领域就是热点。大数据不仅仅对搞计算机的人来说是一个机会,它对所有人来说都是一个机会。大数据应用的普及要靠整个社会来推动。

1月10日,星期日的下午,虽然是假日,但是在中国科学院大学中关村校区的一所礼堂内,一场热烈的答辩会正在进行中。原来,2015“中国好创意”CCF(中国计算机学会)全国青年大数据创新大赛复审暨颁奖典礼正在这里举行。

经过上、下午两轮的现场展示和公开答辩,大赛最终产生了一等奖队伍13支、二等奖队伍26支、三等奖和单项奖队伍8支,来自中国科学技术大学的hczh团队凭借他们针对北京国双科技有限公司提供的赛题——“判决文书中的金额项提取”的创新方案,获得了本次大赛的最高奖——综合特等奖。由60余位院士、名校教授和企业专家组成的超豪华的评审团见证了这一激动人心的时刻。

本届大赛由国家互联网信息办公室网络数据与技术局指导,CCF主办,CCF大数据专家委员会、易班、北京数联众创科技有限公司共同承办,其宗旨是创造大数据的良性发展环境,促进大数据、云计算与“互联网+”等战略新兴产业的融合,培养大数据专业技术人才,进一步推进“大众创业、万众创新”。

大赛之“最”

本次大赛创下了大赛连续举办3年以来的数项之“最”:本次大赛设置了大数据“创新程序”和“创意应用”两类共13道赛题,吸引了1438支队伍参赛,参赛人数近6000人,提交作品5647个,各项数字均是历届大赛之最。

大赛组委会对参赛的数据进行了统计和分析,高校仍是参赛的主力军。77%的参赛队伍来自全国27个省、市、自治区的131所高校和科研院所,涵盖了大部分“985”和“211”院校。这也体现了大赛希望从高校中选拔优秀的大数据后备人才的初衷。

其他的参赛队伍则来自30多家企业,还有一些自由职业者,涉及的企业既有像百度、阿里巴巴、美团、亚信数据这样的新兴互联网企业和IT界的龙头企业,也有中国建行、中国农行、中国平安、长虹等传统行业的百强企业。值得关注的是,还有来自美国、英国和新加坡等境外的参赛队伍近10支。

本次大赛自2015年9月19日启动以来,历时4个月,经过几轮筛选和评比,最终有45支代表队进入复审阶段,其中“创新程序”类有26支队伍,“创意应用”类有19支队伍。评委们对本届参赛队伍展现出的高技术水平给予了充分肯定。

北京国双科技有限公司提供的“创新程序类”赛题——“判决文书中的金额项提取”具有很强的实战性,主要考察参赛队在信息抽取和相关算法方面的技术水平。参赛队要通过文本挖掘技术提取出文书中的涉案金额,使得检索系统可以通过过滤金额来达到进一步检索的目的,从而弥补传统的法律检索工具的不足。有评委认为,本次大赛是一场高技术水平选手之间的竞技,为培养大数据技术生力军提供了种子和土壤,同时也为创新、创业营造了良好的生态环境。

记者注意到,十多家支持本次大赛的企业全部是中国企业,其中既有像百度、阿里、中国联通、中国移动这样的知名企业,也有一些名不见经传的专注于大数据领域的企业。大赛工作委员会主席、CCF大数据专家委员会秘书长程学旗告诉记者:“虽然有些企业的知名度并不高,但是大家的目标一致,都想做一些实实在在的事,推动大数据应用在中国的落地。”

处处皆热点

2015年8月底,国务院发布了《促进大数据发展行动纲要》,标志着大数据已经上升为一项国家战略。虽然我国的一些互联网企业和知名IT企业在大数据的研究与应用方面做了一些有益的尝试,为大数据应用的推广奠定了初步基础,而且中国的大数据市场潜力巨大,但是在大数据的应用方面,问题还是显而易见的,比如大数据技术创新能力不足,大数据的应用领域还不够广泛,专业技术人才匮乏等。

大赛组委会共同主席、CCF大数据专家委员会主任李国杰院士表示:“在此背景下,我们举办大赛的目的就是为广大学生和大数据爱好者提供创新、创业的平台,为业界培养和挖掘优秀的技术人才,为企业寻求好的技术创新方案,为投资人寻觅好的大数据创业项目,最终建成良性发展的大数据生态系统,促进整个大数据产业的健康发展。”

现在一谈起IT业界的热点,言必提大数据。那么,大数据的热点究竟在哪里?是数据的开放和共享,还是建设更多的大数据交易所,或是在某些垂直行业落地大数据项目?“其实,政府、金融、医疗、生物信息等各行各业都少不了大数据。大数据覆盖的领域非常广泛。”程学旗表示,“现在,没有所谓的大数据热点,哪个领域在做大数据,哪个领域就是热点。大数据不仅仅对搞计算机的人来说是一个机会,它对所有人来说都是一个机会。大数据应用的普及要靠整个社会来推动。这也是我们一直强调要构建大数据生态圈的原因。”

大赛力求打造一个集数据共享、管理、建模和分析于一体的在线大数据云平台,汇聚企事业单位和政府机构的大数据资源,以及大数据分析处理的实际应用需求,吸引一群有志于大数据技术研发和产业应用的技术人才,针对企业和政府提供的数据和题目设计创新算法,研发应用系统,提出有创意的解决方案,进而推动大数据创业。

平台化是目标

“中国好创意”CCF全国青年大数据创新大赛已经连续成功举办了三届,每年都会有新的突破。第一届大赛有600多支参赛队伍,本届大赛猛增到1400多支,参与的企业和赛题的数量也翻了一番,赛事奖金增长了好几倍。这主要得益于中国大数据产业的快速发展,以及业内各方的大力支持。CCF全国青年大数据创新大赛已经成了一个进行大数据技术交流、挖掘和选拔大数据人才的平台。

大赛工作委员会共同主席、Intel研究院院长吴甘沙举例说:“来自大连的一个今年读大三的学生在演示完自己的成果后,评委中一位来自北大的教授表示,愿意给这个学生提供一个读研究生的机会。就像‘中国好声音’这样的电视节目一样,大赛给普通人提供了一个展示的平台。”

还有一个例子更让人感动。有一位中年人,他的年龄几乎要超过此次青年大赛规定的参赛年龄限制。他一直期待国内能有这样一个平台。虽然平时工作非常忙,但他还是挤出时间参加了此次大赛。最终,他没有取得理想的名次。但他表示,参加大赛就是为了有一次真实的体验。赛后,他洋洋洒洒地写了一篇参赛体会,并提出了大赛未来应该改进的地方。

由CCF主办的一年一度的大数据技术大会、CCF全国青年大数据创新大赛,以及形式各样的大数据交流活动,为中国大数据产业的蓬勃发展撒下了希望的种子。如今,这些种子已经开始发芽、开花。

程学旗表示:“我们举办大赛的目的是,更好地推动大数据生态体系的建设和发展。国家倡导数据公开、共享,并为此建立健全相关的法律法规,也是为了构建一个良好的、开放的大数据生态系统。”

积极支持本次大赛的企业代表,包括海量信息技术有限公司董事长郝玺龙、华大基因研究院刘心副院长、北京拓尔思信息技术股份有限公司高级副总裁林春雨等在致辞时一致表示,希望大赛这个平台能够进一步发展,吸引更多的人参与进来,形成良好的生态圈,让社会更加了解大数据领域,同时也让大数据领域的技术创意能够帮助企业更好地解决实际问题。

“目前,大赛还是围绕着大数据分析设置参赛题目。未来,我们也许会弱化‘大数据’这个提法,着重强调‘数据为大,价值为大’。大量的中小企业也有强烈的数据需求,而它们未必都拥有大数据。其实,只要是与数据相关的问题都可以放到大赛这个平台上来解决。真正的价值在于数据本身,而不是它的体量大小。”程学旗表示。

按照大赛主办方的计划,从2016年开始,CCF全国青年大数据创新大赛将通过进一步创新实现平台化、常态化和支持专业化。吴甘沙相信:“在庞大的专家群体、广大参赛队伍和相关社会各界的共同努力下,大赛将发掘出更多的创新成果和更多的优秀人才,形成更高的品牌价值,为促进我国大数据产业的良性发展做出更大贡献。”