快速入门数据科学竞赛
上期给大家介绍了数据科学竞赛是什么
这期跟大家聊聊
- 为什么要参加数据科学竞赛竞赛?-
- 如何入门数据科学竞赛?-
- 为什么要参加数据科学竞赛竞赛?
一、核心:自我提升
1. 可以提升自己的代码能力、建模能力、思考能力、沟通能力和解决问题的能力。
2. 通过真实的数据,检验自己对于书本知识的掌握情况,检验顶会文章是否真的work。
二、结识志同道合的朋友,拓宽人脉
1. 这些竞赛的选手可能是高校在读的优秀学生,也有可能是在职场游刃有余的技术大牛。大家可以一起学习交流,获取更多知识。
2. 后续可以有进一步的交流合作(打比赛&合著论文),工作内推……
三、有工作机会,绿色通道
有不少企业办赛会给优秀选手提供绿色通道实习或者全职的工作机会
例如:字节、招商银行、华为、中兴、腾讯、阿里等
四、奖金可观
除了学习赛,其他的竞赛一般都有奖金,从1000元到100万元不等, 需要足够的实力以争得名次,一般奖金越高,竞争压力越大。
五、有加分、保送机会,发表顶会文章
1. 部分学校认可CCF BDCI系列的比赛成绩。
2. 高校计算机大赛,拿到全国一、二、三等奖的可以奖学金加分、保研加分。
3. 顶会比赛取得Top名次有机会发表对应会议的Workshop。
- 如何入门数据科学竞赛?
一、获取最新赛事资讯
详情见上一篇文章: 竞赛平台大合集
二、了解比赛的赛题背景,明确赛题任务,选择适合自己的
1. 查阅官网详细说明,确认自己是否具有参赛或者获奖资格。
因为有一些比赛是学生、地区或企业等限定,也有一些是限定人群能参与提交,但是不能参与奖金瓜分。
2. 确认赛题任务以及所属类别,看看是否是自己擅长的或是想学习的类型比赛。
比赛类型 大致可以分为:
- 结构化类
- 计算机视觉类(cv)
- 自然语言处理类(nlp)
- 音频类
- 其他类
如果自己本身是做某个方向的研究,可以优先选择该方向赛题来入手学习,不然的话,推荐先参加 结构化类 的比赛,这个方向相对比较容易上手。
三、了解比赛提交的时间节点
1. 即便是同一个赛事的不同题目,时间周期都可能不相同。
为了避免痛失摸奖机会,要多留意一下比赛的时间节点。
2. 有些比赛存在初赛、复赛、决赛等多级赛制,需要明确各个赛程的时间节点。
四、了解组队规则和提交(评分)规则
1. 有些比赛是需要先成团才能报名
例如说最近有个比赛就是规定了三人人满才能开团
2. 有些比赛是所有成员提交次数累加不能超过限制,需额外注意控制提交次数
3. 有些比赛存在
AB榜
(公榜与私榜)
测试集数据以某种规则或者随机切分成A榜和B榜,我们提交立刻得到反馈得分是通过A榜的数据进行指标计算得到的,B榜一般是最终确定成绩的榜单,使用除A榜数据外的剩余数据进行指标计算得到。
4. 有些比赛规定需要使用docker提交代码进行线上评测
如何进行docker提交详见
竞赛Docker提交指南
五、注意特殊规则
1. 模型限制
例如禁止使用预训练模型,或者仅允许使用深度学习模型,或者模型大小不能超过多少G等……
2. 训练、推理时长限制
例如推理时长不超过10分钟等……
3. 融合限制
例如仅允许使用单一模型等……
为了大家能更好的沟
(日)
通
(常)
交
(吹)
流
(水)
,我创建了一个
群
,感兴趣的可以扫码入群,欢迎大家!!(若码失效了,可后台私信我)