概述
新型冠状病毒具有潜伏期长,无症状可传播的特点,防止传染殊为不易。此次疫情来势汹汹,通过数学模型预测病毒的传播,以及疫情在各地可能的爆发模式,对于疫情防控有非常重要的意义。
经过一个多月的努力,国内的疫情开始出现好转的势头,多个省级行政区甚至已经保持了多日的0增长。但是近期,多个国家先后出现新冠肺炎病例,甚至面临爆发趋势。据统计,新冠肺炎已经蔓延到全球20多个国家,从第三轮开始,大赛转为预测以国家为单位的疫情发展,而疫情在国内各地的发展,或许对预测也有一定参考意义。
竞赛协议
《未来杯“战疫”特别赛事 选手报名协议》
赛程
本赛道为持续比赛,将在疫情得到控制或其他主办方认为应结束时结束。
目前设定每周一开启一轮比赛,每两周为一个预测轮次,交错进行,具体详见“赛程安排”
报名与组队
选手以组队形式参赛,每支队伍可包含1-5名成员,队长创建队伍成功后,可邀请成员加入队伍并完成审核。报名截止后,组队信息不可再进行变更。
若队伍解散重组,之前轮次取得的成绩无效,不计入最终积分。
报名选手必须为高校在校学生,并按要求完成实名认证。
综合评审与晋级
根据每轮有效提交的得分排名,为队伍记录相应积分。比赛共进行七轮,取各队排名最高的三轮,其积分总和为最终线上得分。线上排名前列的选手可入围最终答辩。以客观名次和答辩评审的综合评分决定最终成绩和排名。
各队累计积分如下:
名次 |
队伍编号 |
队伍名 |
第一轮 |
第二轮 |
第三轮 |
第四轮 |
第五轮 |
第六轮 |
第七轮 |
总积分 |
1 |
2518 |
ZXCV |
5 |
4 |
5 |
5 |
5 |
5 |
5 |
15 |
2 |
2565 |
New Tab |
3 |
5 |
|
4 |
2 |
|
|
12 |
3 |
2552 |
小本拉 |
|
1 |
|
1 |
4 |
4 |
3 |
11 |
3 |
2600 |
圈圈队 |
1 |
|
4 |
|
3 |
|
4 |
11 |
5 |
2556 |
和兴路天团 |
4 |
3 |
1 |
3 |
|
2 |
2 |
10 |
6 |
2625 |
战疫突击队 |
|
|
|
2 |
|
3 |
|
5 |
7 |
2549 |
忘了她我们去华为 |
|
2 |
2 |
|
|
|
|
4 |
7 |
2641 |
随便试试队 |
|
|
3 |
|
1 |
|
|
4 |
9 |
2538 |
Fuhealth |
2 |
|
|
|
|
|
|
2 |
10 |
2515 |
武汉加油 |
|
|
|
|
|
1 |
|
1 |
10 |
2548 |
匹诺曹 |
|
|
|
|
|
|
1 |
1 |
奖项设置
总奖金额 8,000元。
奖学金及奖品
- 第一名队伍:5,000元及获奖证书;
- 第二名队伍:2,000元及获奖证书;
- 第三名队伍:1,000元及获奖证书;
- 优胜奖:获奖证书。
以下日程表有可能会随着大赛进程细化和调整,参赛选手需要关注大赛官网和微信小助手消息,及时获取最新的日程表。
第一轮
2020年02月17日-2020年03月01日
- 需预测2020年02月24日-2020年02月28日以省级行政区(港澳台除外)为单位的的疫情数据
- 2020年02月17日(周一) 提交通道开启
- 2020年02月21日(周五) 提交通道关闭
- 2020年03月01日(周日) 第一轮线上成绩公布
第二轮
2020年02月24日-2020年03月08日
- 需预测2020年03月02日-2020年03月06日以省级行政区(港澳台除外)为单位的的疫情数据
- 2020年02月24日(周一) 提交通道开启
- 2020年02月28日(周五) 提交通道关闭
- 2020年03月08日(周日) 第二轮线上成绩公布
第三轮
2020年03月02日-2020年03月15日
- 需预测2020年03月09日-2020年03月13日以国家为单位的的疫情数据
- 2020年03月02日(周一) 提交通道开启
- 2020年03月06日(周五) 提交通道关闭
- 2020年03月15日(周日) 第三轮线上成绩公布
第四轮
2020年03月09日-2020年03月22日
- 需预测2020年03月16日-2020年03月20日以国家为单位的的疫情数据
- 2020年03月09日(周一) 提交通道开启
- 2020年03月13日(周五) 提交通道关闭
- 2020年03月22日(周日) 第四轮线上成绩公布
第五轮
2020年03月16日-2020年03月29日
- 需预测2020年03月23日-2020年03月27日以国家为单位的的疫情数据
- 2020年03月16日(周一) 提交通道开启
- 2020年03月20日(周五) 提交通道关闭
- 2020年03月29日(周日) 第五轮线上成绩公布
第六轮
2020年03月23日-2020年04月05日
- 需预测2020年03月30日-2020年04月03日以国家为单位的的疫情数据
- 2020年03月23日(周一) 提交通道开启
- 2020年03月27日(周五) 提交通道关闭
- 2020年04月05日(周日) 第六轮线上成绩公布
第七轮
2020年03月30日-2020年04月12日
赛题说明
参赛选手自行设计方案,使用大赛提供的数据和自选数据建立并训练模型。使之能够预测未来指定日期每日以国家为单位的累计确诊人数。
大赛数据(每轮开启时更新)
- 以省级行政区(港澳台除外)为单位的的疫情数据(各地卫健委发布);
- 以地级行政区、新疆生产建设兵团师团或其他来源为单位的疫情数据(多个接口采集综合);
- 以国家为单位的疫情数据(采集自今日头条接口);
2020年1月1日-2020年1月22日从武汉天河国际机场(WUH)出发的航班信息;
2020年1月1日-2020年1月22日经由武汉、武昌、汉口火车站的列车信息;
- 可以使用其他有依据的相关数据,需标明数据来源;
- 欢迎向大赛提供其他数据集,主办方将在整理后提供给所有选手下载。
预测
参赛选手需要运用生成的模型对每轮比赛指定日期(具体详见“赛程安排”),每日以国家为单位的累计确诊人数预测,需预测的国家为每轮比赛数据集中最新一日存在疫情的所有国家。
评分
对每日每国家累计确诊人数计算和方差SSE,SSE越小,排名越高。
分数计算方法为:
$SSE = \sum_{i=1}^n(\hat{y_i}-y_i)^2$
其中:
n 为 需预测的国家 * 5天
${y_i}$ 为实际发布的累计确诊人数
$\hat{y_i}$ 为预测的人数。
结果提交
大赛将于每周周一开启当轮提交通道,周五关闭,选手需要在5日内提交预测结果、模型和代码,详见“结果提交”页面。每队选手每轮有5次提交机会,取最好成绩作为当轮客观成绩。
比赛要求
- 参赛选手需要同时提交说明文档、预测结果、训练和预测代码、模型(参数集),详见【结果提交要求】。
- 参赛选手所提交程序应可在Linux环境顺利运行。建议(不强制)使用Python 2.7或Python3.6作为首选编程环境。不限制第三方软件包使用,但须获得合法授权和软件拷贝,以确保主办方可以复现程序运行过程。
- 参赛选手提交的程序须满足输入输出的要求,参见“结果提交”页面。 参数选手的提交物需要可完整复现训练和预测过程,主办方不会做任何代码修改,如无法复现的,视作无效提交。
- 参赛选手可以使用公开开源的数据集和预训练模型,但需要取得合法授权并可向主办方提供作为复现参赛结果之用途。
- 不得将自行手工标注的结果运用于训练和测试。