2016年大数据应用创新大赛

大赛宗旨

公平、公正、融合、创新、开放

本次大数赛秉承“公平、公正、融合、创新、开放”的宗旨,旨在通过政府提供政务数据和互联网数据,创新城市大数据的多维度深度应用,探索政务数据与互联网数据的融合创新,促进城市大数据的融汇集成、深度挖掘,创造大数据在智慧城市建设过程中的良性发展环境。同时推动万众创新,促进大数据专业技术人才的培养,为大数据从业者及爱好者提供“头脑风暴”的专业交流平台,将梦想照进现实,为智慧城市建设添砖加瓦。

大赛主题

本次大赛以“政务数据与互联网数据融合应用”为主题,鼓励参赛个人或团队运用无锡市政府相关部门提供的内部数据、开放数据以及公开获取的互联网数据,创造“智慧化”产品(原型)及解决方案,展示在智慧民生、智慧环保、智慧交通、智慧城管、城市安全等各领域的奇思妙想,以有效解决现实中的城市问题,服务城市、造福大众。

组织机构

支持单位

无锡市人民政府

中国电子学会

江苏省大数据产业联盟

中关村大数据产业联盟

主办单位

无锡市信息化和无线电管理局

承办单位

无锡智慧城市建设发展有限公司

无锡市信息化协会

软通动力

合作单位

浪潮集团

360

阿里巴巴

腾讯

百度

江南大学    南京大学

清华大学大数据科学研究院

复旦大学数字治理与移动政务实验室

参赛对象及规则

1.参赛对象

本次大赛面向全社会开放,秉承开放共享的大数据精神,所有对大数据分析及挖掘、大数据应用、大数据创新等方面感兴趣的高等院校、科研院所、IT企业、大数据从业人员及爱好者,均可以个人或团体名义报名参加,参赛选手年龄不限、国籍不限、专业范围和所属院校(单位)不限,主要包括:

  • 企业、个人及创业团队:企业及企业中对大数据应用创新开发有兴趣的员工团队或有志向的个人及创业团队;
  • 境内高校:全国高等学校(本科类和高职高专类院校)具有正式学籍的全日制在校学生(含2016年应届毕业生、本专科、研究生不限),以及教师团队;
  • 境外高校:包括部分港澳台和海外高校学生团队、教师团队;
  • 科研院所:科研院所中从事信息技术类相关的科研工作者。

2.组队规则

  • 参赛团队应至少由1人组成,最多人数不限;
  • 参赛团队可以自由组合(允许跨单位);
  • 大赛鼓励高校学生和企事业单位在职人员联合组队,也鼓励参赛队伍找企业进行冠名;
  • 参赛团队必须确认“团队名称”;
  • 禁止不同参赛团队共用队员;
  • 高校团队可邀请指导老师;
  • 参赛团队需指派1名队长,队长必须为中国国籍且年满18周岁,以负责竞赛沟通事宜。

3.参赛要求

  • 参赛个人或团队选择赛题的数量不限;
  • 所有参赛人员必须保证报名信息准确、真实、有效,否则将被取消参赛资格及奖励。大赛组织方承诺个人信息仅用于赛事数据授权与颁奖,对其中涉及个人隐私的内容予以保密;
  • 参赛过程中不得做出任何攻击平台的行为,否则将被取消参赛资格及奖励,主办方保有追究相应责任的权利;
  • 大赛组织方雇员和其他直接参与大赛组织、评审的工作人员及其直系亲属不得参加大赛;
  • 其他相关要求请参见具体赛题要求。

参赛方式

1.报名时间

2016年10月29日启动报名,2016年12月15日结束报名。

2.报名方式

本次大赛采用网络报名方式。参赛个人或团队必须登录大赛官网(http://xdj.wuxi.gov.cn/ztzl/dss/index.shtml)进行报名,经组委会审核并予以通过后,参赛个人或团队方可获得参赛资格。

为方便参赛个人或团队联络并咨询相关问题,现公布组委会咨询组联系方式如下:0510-85980110 曾娜

3.数据说明及作品方案提交

1. 数据的分类及说明

政务开放数据

是指可在线访问及获取政府和公共机构依据职责所生产、创造、收集、处理和存储的数据,数据格式开放且标准,并允许再利用和传播,具有普遍参与性和非歧视性,能够广泛服务于人民福祉。无锡市政务开放数据已经集中在无锡市政府数据服务网(网址http://opendata.wuxi.gov.cn)。

政务业务数据

是指政府和公共机构各部门、各层级因其业务本身需要,以数据形式存在的一些行为,如部门预算,财政拨款,工商、司法、公安等部门因各项审批、监管留存的数据等。此次大赛将提供2个数据集,周期划分为3个月和6-8个月。数据集目录详见《大数据大赛政务业务数据集目录》(点击下载附件)。

互联网数据

是指用户可通过无处不在的智能终端、随时在线的网络传输、互动频繁的社交网络等各种渠道,随时随地获取各行各业、各类群体每天产生的海量数据信息,并可从这些数据中挖掘更多的价值。

1.参赛个人或团队必须遵守并签署《大数据大赛专用数据集授权和使用规则》(点击下载附件);

2.通过大赛官网、竞赛平台提交参赛作品及方案。初赛、复赛及决赛阶段,均需将所有指定材料上传至大赛官网指定位置,并以参赛个人或团队为单位。

赛程安排:

初赛时间:共70天

D1:大赛启动,赛题确认,参赛报名及初赛创意提交开放

D45:参赛报名截止

D70:初赛作品提交截止

初赛评审:共5天

D71:初赛作品筛选分类,评委进行综合评审。

D76:评委评审结束,公布初赛结果,选出50支优胜的参赛团队,入围复赛

复赛时间:共55天(含春节假期)

D77:复赛作品提交开放,模拟样例数据开放。

D132:复赛作品提交截止

复赛评审:共6天

D133:复赛作品筛选分类,评委开始评审

D139:评委评审结束,公布复赛结果,选出15支优胜的参赛团队,入围决赛。

决赛准备时间:共11天

D140-D151:提供累计周期6-8个月的脱敏数据,决赛队伍基于数据准备,提交最终作品。

决赛:

D152:通过现场路演的方式,由大赛评审委员会从15支入围团队中选出一等奖、二等奖、三等奖的获得者,并颁发证书及奖金。

项目孵化:

D153之后:对接创投资本和相关企业,对优秀项目开展资本对接,促成项目落地和产业化。

首届“智慧中国杯”全国大数据创新应用大赛

首届“智慧中国杯”全国大数据创新应用大赛

一、大赛主题

智慧中国,数据先行

二、大赛目的

通过新一代大数据科学技术及应用构建数据创新、开放创新、大众创新为特征的可持续发展的国家数据智慧生态,以促进社会运营体系的几大关键板块(交通、金融、教育等)以更加精细和动态的方式运作,从而实现城市及国家的数据智慧式管理和发展。

三、组织机构

(一)指导单位:国家信息中心

(二)主办单位:成都市人民政府

(三)支持单位:成都市经济和信息化委员会

成都市大数据管理局

(四)承办单位:成都大数据产业联盟

成都数聚城堡科技有限公司

(五)协办单位:国家信息中心大数据创新创业(成都)基地

郫县人民政府

(六)技术指导:中国大数据产业应用协同创新研究院

电子科技大学大数据研究中心

四、大赛流程

本次大赛将由“3大主题算法资格赛(初赛)”、“创新应用赛(复赛)”和“72小时全明星总决赛(决赛)”三大板块组成,面向全国征集3大行业中以大数据技术为驱动的应用方案,并对优秀团队进行深度指导,对接优质投资资源。

(一)初赛阶段(2016年11月3日至2017年2月28日)

(1)参赛者根据大赛要求,选择感兴趣的相关主题资格赛(初赛)进行报名,报名网址:http://www.pkbigdata.com/common/zhzgbCmptDetails.html?slxydc=ZHZGB52jsw;

(2)参赛者通过构建模型,优化算法,提交初赛任务结果,获得资格赛排名;

(3)各资格赛排行榜前200名(3大资格赛共600名),需提交算法文档等相关材料进行验证;通过验证的团队获得进入复赛的通行证,获得提交创意应用的机会。

(二)复赛阶段(2017年3月1日至2017年6月10日)

(1)复赛阶段,参赛者需提交创意应用方案,应用方案可以是产品计划书、商业计划书、应用开发方案等,具体形式不强制要求;

(2)专家评审团根据应用的商业价值、创意度、技术壁垒、可执行性、方案完整度等维度综合评分;

(3)综合评分后,选拔入围团队进入集训营和72小时全明星总决赛。

(三)决赛阶段(2017年6月)

(1)针对决赛项目,大赛组织专家进行有针对性的辅导和集训,助力参赛单位或团队赛出水平、赛出实力;

(2)决赛通过现场产品或技术演示,以及现场答辩的方式分别决出总决赛冠军;集训和决赛安排在成都市举行,大赛成果将在2017年的中国·成都全球创新创业交易会上进行展示。

五、参赛资格

(一)本次大赛面向社会各界人士开放,海内外的在校生、从业者、企业均可报名参赛;

(二)为了保障比赛的公正性,一个参赛者在本次大赛中只能加入一支参赛队伍,参赛者需实名认证后方可提交竞赛结果;

(三)每支参赛团队人数上限为5人。

六、大赛奖励及支持

(一)大赛奖励

对初赛3大主题资格赛中成绩优异的团队,做阶段性的小型奖励。向各资格赛金奖、银奖、铜奖获得者发放人民币3万元、2万元、1万元的奖金,并颁发获奖证书;

对通过复赛进入总决赛的优秀项目颁发2万元入围奖和获奖证书;对决赛最优秀的团队颁发72万元的超级大奖和获奖证书。

(二)优秀项目支持

1.参赛项目推荐。将成功进入决赛的参赛项目汇编成册,向相关领域和单位推荐;

2.融资支持。对决赛优秀项目提供投融资对接服务。

3.宣传推广。对进入决赛的优秀项目,在相关主流媒体、行业媒体,提供优先宣传推广服务。

大赛官网:http://www.pkbigdata.com/common/zhzgbCmptDetails.html?slxydc=ZHZGB52jsw

贵阳大数据寰球中心大厦概念性规划设计方案全球征集

贵阳大数据寰球中心大厦概念性规划设计方案全球征集

一、活动背景

2016年3月1日,中国首个国家大数据(贵州)综合试验区挂牌成立,“十三五”期间,贵阳市以大数据为引领打造创新型中心城市,贵阳国家高新区作为全市要素高度集聚、新兴产业发达、政策资源充分的开发区,将全力打造成为创新型中心城市示范区。贵阳大数据寰球中心大厦位于贵阳国家高新区,集5A甲级云端总部办公、五星级酒店、现代化商业零售、娱乐功能于一体的综合性超高层地标建筑。项目建成后将为大数据企业提供高品质的服务配套及办公场地。

二、活动时间

8月1日-10月31日

三、活动流程安排

1、方案征集(2016年8月1日-2016年9月15日)

8月1日起,面向全球征集贵阳大数据寰球中心大厦项目概念性规划设计方案,报名单位需填写《贵阳大数据寰球中心大厦活动报名表》并加盖公章,同时提供下述报名材料,经审核通过的单位将以邮件形式派发《贵阳大数据寰球中心大厦概念性规划方案设计邀请书》,视为报名成功;

报名要求:

  • 必须具备建筑工程设计甲级资质;
  • 拥有超高层建筑设计经验。

报名需提供材料:

  • 贵阳大数据寰球中心大厦活动报名表(加盖公章)
  • 工商营业执照、组织机构代码证和税务登记证(扫描件);
  • 建筑设计资质证书(扫描件);
  • 企业简介及超高层建筑设计案例(至少有1栋建筑物已建成)。

2、方案设计

9月16日起进入方案设计阶段,将统一向设计单位派发《贵阳大数据寰球中心大厦概念性规划方案设计说明》,设计单位需严格按照说明开展设计工作,并在截止日期内以电子邮件的形式提交一套设计方案供征集单位海选使用。

3、方案评选

由活动征集单位特邀的专家评审小组从海选版方案中筛选出5个入围方案。入围单位需按照要求深化形成汇报版方案,供贵阳国家高新区党工委相关领导及专家组成的方案评审委员会最终评选使用。评选进度请关注贵阳高科控股集团有限公司官方网站以及官方微信公众号。

4、结果公示

将通过报纸、杂志、微信及网络等多种媒体公布中奖名单及获奖方案。

四、征集方案的运用

受邀参加方案征集的单位,海选过程中所提供的设计成果视为同意征集单位作为评选使用,其中获奖方案的所有权归征集单位所有,所有资料一律不予退还,一等奖的获得者作为设计合作的优选单位。

五、奖项的设置

一等奖:30万元(1名)

二等奖:10万元(1名)

三等奖:5万元(1名)

入围奖:2万元(2名)

六、活动联系方式

征集单位:贵阳高科控股集团有限公司

地址:贵阳国家高新区下坝山路一号服务站

报名热线:0851-84124152

联系人:彭建

高科官网:www.guiyanggk.com

E-mail:  gygk_sheji@163.com

说明:

1、报名单位需对所提供的一切材料的真实性负责,一经发现存在虚假信息或冒用他人名义的,征集单位有权立即取消该单位的参与资格;由此引起的一切后果由报名单位承担;

2、本次国际邀请设计活动受中华人民共和国法律管辖,评选工作和所有方案成果文件均适用中国法律。

3、提供给设计单位的所有基础资料(文字、图纸、电子数据等)均受版权保护。未经授权,任何人不得将内容复制、改编、分发、发布、外借、转让或者以其他任何方式披露、使用上述基础资料,否则将承担相关法律责任。

4、本活动仅为邀约设计,最终解释权归贵阳高科控股集团有限公司所有。

2016厦门大数据大赛(ABD 2016)

2016厦门大数据大赛(ABD 2016)

大赛简介

当前,大数据产业方兴未艾,各地纷纷建立大数据产业园区,政府数据开放的社会知晓度和公众参与度也得到了明显的提高。数据开放是释放大数据价值的重要途径,也是实现社会创新的有效方式。为了进一步推动企业及个人对大数据资源的开发和应用,展示大数据研究价值,促进大数据技术交流,厦门市经济和信息化局联合湖里区人民政府共同主办本次大赛。本次大赛将秉承开放、共享的大数据精神,欢迎各企业、高校、科研院所和大数据从业人员及爱好者参与。

我们大赛的宗旨是

1.拓宽就业渠道。参赛者及相关研究者通过大赛,全方位了解更多大数据相关企业信息和人才需求,发现更多就业职位。

2.发现高端人才。通过大赛,企业和人才零距离接触,帮助企业挖掘大数据人才,为企业输送高品质人才。

3.推动产业升级。为大数据应用产业探索创新的应用模式,为厦门市信息化产业发展营造氛围,进一步促进数据资源向社会开放。

4.展示创新风采。通过大赛,激发大数据创新思维,促进大数据创新发展,多方面展示大数据前沿研究和产业进展。

奖项设置

一等奖(1组)

二等奖(2组)

三等奖(3组)

单项奖(3组)

最佳数据应用模型奖

最佳可视化奖

最具商业价值奖

共3个奖项,每个奖项各1组。

最佳组织奖(5组)

入围奖(15组)

凡入围决赛的队伍皆可获得!

比赛日期

5月29日 大数据大赛启动仪式

6月12日 题主企业征集截止

6月30日 参赛团队报名截止

8月20日 参赛作品提交截止

9月10日 组委会公布入围作品

10月16日 决赛路演&颁奖仪式

大赛数据

数据堂将开放本次大赛的数据专区,由数据堂及各参与单位提供下载。大赛的数据专区便于悬赏出题的企业上传数据,也有利于参赛团队下载数据。

企业通过数据堂上传数据,必须提供尽量详细的数据信息,包含了具体数据项、数据格式、提供数据的时间范围等信息。数据上传网址(http://www.datamall.com/cooperate)

数据的使用规则详见数据堂大赛专区(http://www.datamall.com/match)

免责声明:本文来源于网络,欧米网仅转载以供参考。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

2016第二届百度&西安交通大学大数据竞赛

百度&西交大第二届大数据竞赛

大数据竞赛是由百度和西安交通大学联合主办,旨在通过全国高校范围内,挖掘、发现大数据尖端人才,并为其提供更好的发展环境和实践机会。第一届百度西安交通大学大数据竞赛于2015年5月正式启动,历时四个月,吸引了全国高校近900支团队参加。第一届竞赛题目是基于百度的“知识图谱”技术展开,以挖掘明星(人物)关系为场景,进而构建知识挖掘系统。

今年,竞赛题将围绕用户消费决策影响因素展开,从评价性文本片段中,结合上下文,提取核心内容,为用户判断提供有力依据。本届竞赛要求参赛者给出一个算法或模型,从评价性文本片段中,结合上下文提取子句中的核心实体,即识别出该子句所讨论的最重要的实体。

一、任务设定

本次竞赛要求参赛者给出一个算法或模型,从评价性文本片段数据集中,结合上下文提取文本片段中的核心实体,即识别文本片段所讨论最重要的实体。竞赛数据由若干文本片段组成,每个文本片段单独占一行,可能包含多个子句,每个子句以半角句号结尾,要求参赛选手识别出每个文本片段子句及其核心实体。

输入输出说明:

输入:逐行读取文本片段;

输出:逐行输出该文本片段的子句以及提取到的核心实体,以json形式分装,格式如下:

[

{

“content”: “子句1”,

“core_entity”: [

“entity1”,

“entity2”

]

},

{

“content”: “子句2”,

“core_entity”: [

“entity1”,

“entity2”

]

}

]

样例数据:

文本片段:

不得不说锤子手机在很多功能操作上的优化真的很用心,尤其是一些看上去并没有什么卵用但让人感觉确实舒服的小设计。如果说苹果的设计是强行的改变用户习惯,我宁愿选择这个能够随时迁就用户个性的锤子。

答案:

[

{

“content”: “不得不说锤子手机在很多功能操作上的优化真的很用心,尤其是一些 看上去并没有什么卵用但让人感觉确实舒服的小设计。”,

“core_entity”: [

“锤子手机”

]

},

{

“content”: “如果说苹果的设计是强行的改变用户习惯,我宁愿选择这个能够随时 迁就用户个性的锤子。”,

“core_entity”: [

“苹果”,

“锤子”

]

}

]

二、评分标准

正确识别文本片段中至少一个核心实体得1分,如文本片段包含多个核心实体,每多正确识别一个加0.5分,识别错误反扣0.5直到该子句得分为0为止,实体名称以该实体首次出现在文本片段中的名称为准。

三、竞赛阶段

Ø  训练阶段(4-8月):

参赛者获得训练数据,开始训练模型;

发布1.2万条语料片段的训练数据集;

Ø  测试阶段(8-9月):

参赛者获得测试数据,得到模型运行结果后,在线提交,实时刷新测试成绩;

发布20万条语料测试数据集;

Ø  验证阶段(9月):

排行榜前10名队伍上传源代码及说明文档,竞赛评委组使用官方验证数据集进行测试,最终给出排名;

发布20万条语料验证数据集;

注:

1、参赛者可以任意使用其他公开的外部数据源或者词典作为辅助数据,但提交时需要说明清楚使用方式并将使用到的外部数据一并提交,同 时禁止人工标注数据用于系统优化,如有发现成绩归零。

2、说明文档至少包含编译环境说明,算法、代码等说明。

3、报名截止日期:8月10日。

训练数据 

数据集包含1.2万个文本片段,每个文本片段后给出Json格式的子句及其核心实体;

下载链接(百度网盘分享):http://pan.baidu.com/s/1pLtfjSZ

密码:jzy9

该数据为竞赛专用,严禁用于商业用途!

参赛对象

全日制在校学生均可报名参加,参赛队伍可以是单人组队,或者自由组合,但是最多不超过三人;4月9日早8点开放报名!

注:

1、每人只能参加一支队伍;

2、保证参赛队员报名信息准确有效,否则会被取消参赛资格及激励;

3、报名方式:用百度账号登入官网、填写完个人信息,可报名参赛。

4、百度西交大大数据竞赛官方交流群,QQ群:482699741

奖项分为两类:普通奖项和特别贡献奖,各奖项均以团队进行评比;获奖团队成员优先推荐进入百度实习或工作。

注:一个团队不可同时获得两类奖项

普通奖项

一等奖  2万元人民币

二等奖  1万元人民币

三等奖  5千元人民币

特别贡献奖

10万元人民币(1名)

免责声明:本文来源于网络,欧米网仅转载以供参考。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。

2016年第四届“泰迪杯”全国数据挖掘挑战赛

2016-04-17_154541

各高等院校数学、计算机、经管及相关院系:

为推广我国高校数据挖掘实践教学,培养学生数据挖掘的应用和创新能力,增加校企交流合作和信息共享,提升我国高校的教学质量和企业的竞争能力,由全国大学生数学建模竞赛组织委员会发起的第四届“泰迪杯”全国数据挖掘挑战赛如期举行。本届竞赛由全国大学生数学建模竞赛组织委员会主办,广州泰迪智能科技有限公司承办,广东省工业与应用数学学会、华南师范大学数学科学学院协办。现将有关事项说明如下:

一、组织单位

主办单位:全国大学生数学建模竞赛组织委员会

承办单位:广州泰迪智能科技有限公司

协办单位1:广东省工业与应用数学学会

协办单位2:华南师范大学数学科学学院

二、竞赛说明

  1. 竞赛设赛题三个,学生任选其中一个参赛即可。
  2. 学生以队为单位在竞赛网站上自行登记参赛,每队人数不超过3人(必须属于同一所学校),各年级、各专业均可报名参加。
  3. 参赛选手必须同意竞赛组织委员会设立的竞赛相关规则,报名申请时须填写参赛队伍的真实信息,以便于核对身份并颁发奖品。竞赛组织委员会保证所收集到的学生个人信息资料仅用于竞赛有关工作,不会公开和泄露。
  4. 指导老师可以是本校老师,也可由学生自行指定,老师在竞赛期间可以全程指导队员。
  5. 组委会提供以下方式供参赛者交流:1)竞赛交流QQ群(188789557),加群时附加信息说明“数据挖掘竞赛”,加群后请按“单位名称_姓名”修改群名片,如“华南师大_李建波”,有问题可咨询群内指导老师。2)微信公众号(TipDataMining)。加入QQ群/微信后可第一时间获取最新竞赛咨讯和答疑资源。
  6. 本次竞赛每队收取 报名费 100元。

三、报名方式

参加竞赛的报名步骤如下:

  1. 在全国大学生数据竞赛网站(http://www.tipdm.org )注册成为会员;
  2. 登陆“泰迪杯”全国数据挖掘挑战赛网站;
  3. 进入会员中心;
  4. 点击左侧“竞赛列表”;
  5. 报名参赛;
  6. 缴纳报名费。

详见步骤见:http://www.tipdm.org/notice/614.jhtml。

四、竞赛时间安排

经数据挖掘竞赛组织委员会决研究定,竞赛时间安排如下:

  1. 报名时间:2016年4月1日—-2016年4月30日
  2. 开题时间:2016年4月1日(公布赛题和部分示例数据)
  3. 竞赛时间:2016年5月1日—-2016年5月15日(公布全部数据)
  4. 第一轮评阅时间:2016年5月18日—-2016年6月3日
  5. 第二轮评阅时间:2016年6月4日—-2016年6月7日(视频答辩)
  6. 获奖公示:2016年6月8日——2016年6月18日
  7. 颁奖时间及赛题讲解:2016年7月23-24日

五、技术支持

泰迪科技将为本次数据挖掘竞赛提供技术支持。数据挖掘需要使用专业的软件平台来实现,如IBM公司的SPSS Modeler(前身为SPSS的Clementine)、SAS公司的Entelprise Miner,以及开源软件R及Python,也可采用由泰迪科技提供的TipDM数据挖掘平台。

2016年“泰迪杯”数据挖掘挑战赛-A题讨论区:http://www.shumo.com/forum/forum.php?mod=forumdisplay&fid=159

2016年“泰迪杯”数据挖掘挑战赛-B题讨论区:http://www.shumo.com/forum/forum.php?mod=forumdisplay&fid=158

2016年“泰迪杯”数据挖掘挑战赛-C题讨论区:http://www.shumo.com/forum/forum.php?mod=forumdisplay&fid=157

六、论文评审

1、作品基本要求:数据预处理的完整性、对相关领域背景问题的理解程度、对挖掘模型评价的客观性、模型应用的创新性、结果的正确性和文字表述的清晰程度。

2、主要评判原则:以出题企业的实际应用需求满足程度作为主要评判依据。

七、获奖奖励

本次“泰迪杯”全国数据挖掘挑战赛获奖奖励办法如下:

  1. 凡完成合格论文报告要求者可获得“泰迪杯”数据挖掘挑战赛成功参赛证书。
  2. 特等奖并获得出题企业冠名:3名,采用视频答辩的形式,由高校和企业专家综合评审,从一等奖里面评取。颁发“泰迪杯”数据挖掘挑战赛特等奖荣誉证书、出题企业冠名奖杯,并提供每队20000元奖金。
  3. 特等奖:3名,采用视频答辩的形式,由高校和企业专家综合评审,从一等奖里面评取。颁发“泰迪杯”数据挖掘挑战赛特等奖荣誉证书,并提供每队10000元奖金。
  4. 一等奖:54名,颁发“泰迪杯”数据挖掘挑战赛一等奖荣誉证书。
  5. 二等奖:约5%,颁发“泰迪杯”数据挖掘挑战赛二等奖荣誉证书。
  6. 三等奖:约10%,颁发“泰迪杯”数据挖掘”挑战赛三等奖荣誉证书。
  7. 特等奖、一、二、三等奖获得者可优先得到泰迪科技实习及推荐工作机会。实习优秀者将获优先签约权。
  8. 组委会设立创新基金(资金来源于出题企业,共10万元),为获得创新、特等、一等及二等奖的队伍提供后续研究开发的资助(有书面的证书或协议,以项目或者实习方式实现),一年内提交研究成果。(在获奖公布后提交申请)

八、获奖名单公布

获奖名单将在竞赛网站、全国大学生数学建模竞赛组织委员会、广东省工业与应用数学学会、华南师范大学数学科学学院网站及泰迪科技官网上发布。

九、竞赛组织委员会联系方式

地址:广东省广州市科学城科珠路232号(邮编:510663 )

电话:(020)82039399

联系人:张尚佳:18682289783,zhangshangjia@tipdm.com

张颖峰:13379798731,zhangyingfeng@tipdm.com

杨坦:18903011449,fling_yang@163.com

赛题及下载:http://www.tipdm.org/qk/729.jhtml

中国高校计算机大赛–大数据挑战赛

20160325140039_26632

竞赛宗旨

2016中国高校计算机大赛——大数据挑战赛(Big Data Challenge)是由教育部高等学校计算机类专业教学指导委员会、软件工程专业教学指导委员会、计算机课程教学指导委会和全国高等学校计算机教育研究会联合主办,清华大学和阿里云联合承办,在“天池大数据众智平台”上开展的高端算法竞赛。大赛面向全球开放,旨在通过竞技的方式提升人们对数据分析与处理的算法研究与技术应用能力,探索大数据的核心科学与技术问题,尝试创新大数据技术,推动大数据的产学研用。

组织机构

主办单位

教育部高等学校计算机类专业教学指导委员会

教育部高等学校软件工程专业教学指导委员会

教育部高等学校大学计算机课程教学指导委会

全国高等学校计算机教育研究会

承办单位:清华大学

赞助单位:阿里巴巴集团(阿里音乐、阿里云)

指导委员会

主任:杜小勇(中国人民大学)

委员:宋 柯(阿里巴巴集团)

侯义斌(北京工业大学)

陈新河(中关村大数据产业联盟)

骆斌(南京大学)

专家委员会

主任:王建民(清华大学)

副主任:臧斌宇(上海交通大学)

委员:陈恩红(中国科技大学)

胡学钢(合肥工业大学)

李雁翎(东北师范大学)

滕桂法(河北农业大学)

王宏志(哈尔滨工业大学)

王腾蛟(北京大学)

吴黎兵(武汉大学)

肖侬(国防科学技术大学)

于炯(新疆大学)

张瑞生(兰州大学)

组织委员会

主任:刘强(清华大学)

副主任:王一婷(阿里巴巴集团)

委员:洪玫(四川大学)

舒坚(南昌航空航天大学)

杨永健(吉林大学)

张莉(北京航空航天大学)

赵文耘(复旦大学)

左保河(华南理工大学)

竞赛题目

本次大数据挑战赛以阿里音乐用户的历史播放数据为基础,参赛队伍通过对阿里音乐平台上每个时间段内艺人的试听量进行预测,挖掘出即将成为潮流的艺人,从而实现对一个时间段内音乐流行趋势的准确把控。

大赛将开放一定规模的抽样歌曲艺人数据以及与这些艺人相关的用户行为,参赛队伍需要设计相应的算法进行数据分析和处理,比赛结果按照规定的评价指标使用在线评测程序进行评阅和排名,结果最优者获胜。

竞赛题目:阿里音乐流行趋势预测

经过7年的发展与沉淀,目前阿里音乐拥有数百万的曲库资源,每天千万的用户活跃在平台上,拥有数亿人次的用户试听、收藏等行为。在原创艺人和作品方面,更是拥有数万的独立音乐人,每月上传上万个原创作品,形成超过几十万首曲目的原创作品库,如此庞大的数据资源库对于音乐流行趋势的把握有着极为重要的指引作用。

本次大赛以阿里音乐用户的历史播放数据为基础,期望参赛者可以通过对阿里音乐平台上每个阶段艺人的试听量的预测,挖掘出即将成为潮流的艺人,从而实现对一个时间段内音乐流行趋势的准确把控。

竞赛数据

大赛开放抽样的歌曲艺人数据,以及和这些艺人相关的6个月内(20150301-20150831)的用户行为历史记录。

用户行为表(mars_tianchi_user_actions):

列名         类型         说明         示例

user_id     String        用户唯一标识         7063b3d0c075a4d276c5f06f4327cf4a

song_id    String        歌曲唯一标识         effb071415be51f11e845884e67c0f8c

gmt_create      String        用户播放时间(unix时间戳表示)精确到小时 1426406400

action_type      String        行为类型:1,播放;2,下载,3,收藏  1

Ds    String        记录收集日(分区)     20150315

注:用户对歌曲的任意行为为一行数据。

歌曲艺人(mars_tianchi_songs)

列名         类型         说明         示例

song_id    String        歌曲唯一标识         c81f89cf7edd24930641afa2e411b09c

artist_id   String        歌曲所属的艺人Id         03c6699ea836decbc5c8fc2dbae7bd3b

publish_time    String        歌曲发行时间,精确到天     20150325

song_init_plays        String        歌曲的初始播放数,表明该歌曲的初始热度     0

Language          String        数字表示1,2,3…   100

Gender     String        1,2,3         1

注:每个阶段更换数据时,表名加前缀”p2_”(如p2_mars_tianchi_user_actions)

结果集

选手需要预测艺人随后2个月,即60天(20150901-20151030)的播放数据。

选手提交结果表(mars_tianchi_artist_plays_predict)

列名         类型         说明         示例

artist_id   String        歌曲所属的艺人Id         023406156015ef87f99521f3b343f71f

Plays         String        艺人当天的播放数据     5000

Ds    String        日期         20150901

选手需要预测9月1日至10月30日(60天)内所有艺人的结果。

初赛:

选手通过天池网站提交结果

文件命名方式:mars_tianchi_artist_plays_predict.csv

复赛:

选手直接在平台上提交自己所在项目产出结果mars_tianchi_artist_plays_predict即可

表结构(字段名,字段类型,字段顺序)需保持一致

评估标准

设艺人j在第k天的实际播放数为T(j,k),参赛队伍集合为U,艺人集合为W,参赛队伍i的程序计算得到艺人j在第k天的播放数为S(i,j,k),则参赛队伍i对艺人j的播放预测的归一化均方差σ(i,j)为:

σi,j=1N∑k=1N((Si,j,k−Tj,k)/(Tj,k))2

而艺人j的权重根据艺人的播放量等大小单调递增(具体公式不公布)

ϕj=F(S)

参赛队伍i的最终得分

Fi=∑j∈W(1−σi,j)∗ϕj

最终排名按照F值评判,F值越大,代表结果越优,排名越靠前。

赛制说明

本次大赛分为初赛、复赛和决赛三个阶段,其中:初赛由参赛队伍下载数据在本地进行算法设计和调试;复赛要求参赛者在线进行数据分析和处理;决赛要求参赛者进行现场演示和答辩。具体安排和要求如下:

初赛(5月17日—6月14日)

参赛队伍可从大赛网站下载数据,在本地进行算法设计和调试,在规定时间内提交结果。若参赛队伍在一天内多次提交结果,新结果版本将覆盖旧版本。

从5月17日起,系统每天进行一次评测和排名,评测开始时间为当天10:00 AM,按照评测指标从高到低进行排序,每天更新排行榜;排行榜将选择参赛队伍在本阶段的历史最优成绩进行排名展示。

系统在6月7日将进行数据切换,参赛队伍在访问赛题数据时须注意更换表名,初赛成绩排行榜将选取6月8日起产生的成绩进行排名。

初赛截止时间是6月14日10:00AM,成绩排名前500名且通过支付宝实名认证的参赛队伍将进入复赛。(认证入口:天池网站-个人中心-认证-支付宝实名认证,要求初赛截止日期前完成认证)

复赛(6月17日—7月15日)

复赛的数据不可下载,选手需要使用平台完成数据处理、建模、算法调试、产出结果等所有环节,可使用基于ODPS的Map Reduce、SQL、GRAPH及平台集成的各种机器学习算法包/模型。

从6月17日起,系统每天进行一次评测和排名,评测开始时间为当天10:00 AM,按照评测指标从高到低进行排序,每天更新排行榜。

系统在7月8日12:00AM将进行一次数据切换,参赛队伍在访问赛题数据时须注意更换表名,复赛成绩排行榜将选取7月9日起产生的成绩进行排名。

复赛截止时间是7月15日10:00AM,成绩排名前5名的选手将受邀参加决赛的现场答辩。

决赛(8月下旬)

决赛将以现场答辩会的形式进行,具体安排另行通知。

参赛队伍应提前准备现场答辩材料,包括PPT、算法代码。

组委会将根据参赛队伍的算法原理、历史成绩和评委打分,评选出整个大数据挑战赛的冠亚季军,并现场颁发奖金及证书。

报名方式

参赛对象

本次大赛面向全社会开放,高等学校、科研单位、互联网企业、创客团队等人员均可报名参赛。参赛队伍可以单人参赛或自由组队(最多不超过3人,可以跨单位组队)。

参赛队伍要求:

每人只能参加一支队伍。

保证参赛队员报名信息准确有效,否则将被取消参赛资格及奖励。

大赛主办单位和技术支持单位中有机会接触赛题相关数据的人员不允许参赛。

提交的参赛作品必须是团队或个人独立完成的原创作品,不得抄袭,不得违反任何相关的法律法规,否则将取消参赛资格。

大赛所提供的数据集和平台仅限于此次大赛使用,不得用于其他任何目的。若因违反此规定而给数据提供方或平台提供方造成损失的,参赛队伍所在单位和选手须承担全部责任。

报名方式

报名方式:访问天池大数据众智平台,进入“大数据挑战赛”模块,用淘宝或阿里云账号登录,完成个人信息注册,即可报名参赛。

报名、组队变更和实名认证截止时间均为2016年6月7日10:00 AM。

大赛官方交流群——旺旺群:1270938233。

奖项设置

初赛奖项

一等奖:第1名队伍,奖金叁万元,颁发获奖证书

二等奖:第2-3名队伍,奖金壹万元,颁发获奖证书

三等奖:第4-10名队伍,奖金伍仟元,颁发获奖证书

说明:上述奖项将结合参赛队伍的总结PPT、算法原理、历史成绩进行评审,确定最终排名及奖项;如有必要将组织现场答辩(解释权归组委会)。

决赛奖项:

冠军:1支队伍,奖金贰拾万元,颁发获奖证书

亚军:1支队伍,奖金伍万元,颁发获奖证书

季军:1支队伍,奖金贰万元,颁发获奖证书

说明:上述奖项以决赛现场答辩的最终名次决定,复赛排名TOP10的主要参赛选手可直接入围阿里校招终面(在校期间均有效)。

周星星

自大赛排行榜开榜起,每周一榜单排名前三名的参赛队伍将成为周星星,其队员可获得天池礼品一份。

分享优质参赛故事或心得的选手可获得天池书包一只。

极客奖

复赛排名TOP20的选手将获得极客奖证书,并入围阿里巴巴校园招聘绿色通道(即招聘流程省略简历筛选及笔试筛选阶段,直接进入面试阶段,在校期间均有效)。

免责声明:本文来源于网络,欧米网仅转载以供参考。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。