你参加过爬虫相关的比赛吗?这有一个
“阅读本文大概需要 3 分钟”
同样是做爬虫,为什么别人月薪三万,而你月薪只有三千?别人爬的数据能做出来好多东西,而你爬下来的数据可能就只是数据(还可能是照片,技术男都懂)
你要明白,爬虫是一种提升效率的工具,能“解放双手还我自由”,但你要思考的不只是怎么爬数据,而是爬取下来的数据该怎么用,这才是拉开工资差距的根本原因。
相信关注我公众号的人,都是喜欢编程,喜欢爬虫的,所以我今天给大家介绍一场比赛,适合学生党和上班族:
“让数据回家”为主题的数据爬虫开发大赛!
这个比赛不仅仅是爬数据,还可以开动大脑,基于数据做创意应用。不但能增加实战经验,还能给你的简历增光添彩,为接下来的秋招做准备!
大赛旨在旨在为开发者和数据爬虫爱好者提供一个有趣的框架平台,尽情的表达关于数据的灵感。
参赛者可以通过爬虫技术,将属于自己的数据从互联网拿回自己手中,然后基于这些数据开发出各类有趣的应用,做数据的主人!
这次比赛的奖项真的很诱人!
获奖制度
AWARD SETTINGS
1.奖金预设
一等奖(1支队伍):10000元 + 证书;
二等奖(3支队伍):5000元 + 证书;
三等奖(6支队伍):2000元 + 证书;
优秀奖(若干):将根据实际参赛队伍数量确定优秀奖名额,将获得神秘礼品。
2.开源爬虫奖
对于基于GitHub项目( https://github.com/MyDataHomes/Spider )开发的爬虫工具,主办方将挑选优秀作品提交至Github项目库中,被选作品将获得“开源爬虫奖”,并获得神秘礼物。(本奖项与前述奖项不冲突,可同时获取)
参赛规则
RULES OF ENTRY
01
组队要求
个人或自由组队参赛,每支队伍不超过3人,每人只能参加一支队伍,以队伍参赛须确定一名队长,便于后续赛事联系和通知;
参赛选手报名须提供真实联系信息。
02
参赛作品
作品内容:爬虫工具(含源代码、使用文档、测试用例等),作品介绍材料;
作品要求:
进行爬虫工具的开发,爬虫工具能够帮助用户抓取自己的个人数据,抓取的数据源类型不限(如淘宝、京东等);
参赛者可基于爬虫工具获取的数据,自主进行数据应用的设计,本要求为可选项;
参赛作品可基于比赛指定Github项目( https://github.com/MyDataHomes/Spider )进行开发,也可自行开发;
参赛作品的开发语言不限;
作品介绍文档需涵盖爬虫算法思路、实现方法、爬虫运行与测试方法、数据应用介绍(如有)等,介绍文档格式不限。
03
评审标准
由来自隔镜科技、上海交通大学软件学院以及其他机构的专家评判打分,评分标准如下:
爬虫评分(100分)
爬虫性能(40%):包括爬取数据的完整度、性能,爬虫鲁棒性等指标;
代码质量(30%):包括代码撰写是否规范、接口定义是否清晰、注释是否完整等;
创新性(30%):包括在数据获取方式、爬虫算法设计等方面的创新等。
附加分(20分)
用户界面(10%):良好的用户界面设计,操作方式、风格等方面具有创意和美感;
数据应用(10%):数据应用的实用价值、创新性等;
赛事日程
EVENT SCHEDULE
6月
29日
开启报名
(1)关注公众号我的数据百宝箱(微信号:mydatabox),回复“报名”,获取报名链接;
(2)通过社区论坛置顶链接报名,论坛地址:https://mydata.homes/
加比赛群
添加大赛客服微信:mydatahome,回复“开发者+姓名”,加入大赛技术协作群;
准备作品
首先想到一个关于个人数据采集的好点子;
我们准备了一个简单的框架和一些爬虫样例,我们希望您fork我们的爬虫代码库( https://github.com/MyDataHomes/Spider ),并基于此进行创作;您也可以选择其他语言和框架进行开发。
完成的作品应当具备完整可运行的代码、测试用例、使用文档、项目介绍材料(可以包括文档、PPT、视频等)。
提交作品
确认已经完成了报名流程(提交了团队信息,并且同意了参赛协议);
确认比赛作品已经完成,并且可以通过阅读项目README文档获取所有资料。如果是私有库,请确认已经给官方账号(id: MyDataHomes)添加了阅读权限;
fork本仓库,拷贝作品提交模板( https://github.com/MyDataHomes/GeJing-Cup )来创建一份副本,仔细阅读模板并填充团队和项目信息,注意不要遗漏必填项,也不要修改其他任何文件;
重命名为 团队名称.md;
发起一次pull request完成作品提交申请。
7月
22日
报名&提交作品截止
在7月22日 22:00 前完成报名,并提交作品,请注意合理安排项目进程,避免错过提交作品时间;
8月
07日
评比公布
参赛作品由评审委员会评审并打分,全部评分完毕后将通过公众号、论坛、邮箱等公布成绩!
获奖用户领奖
获得一二三等奖的用户,在10个工作日内联系主办方领取奖品,优秀奖、开源爬虫奖用户获得神秘礼品一份!
用代码来唤醒沉睡的数据资产,赢现金大奖!
点
阅读原文,立即报名!