划水2年,研三才开始做科研还有救吗?
12-1月写代码+做实验
这个时候如果还从0开始写代码未免太费时间了,建议你直接在Github上搜索相关仓库或者基于比赛平台开源方案做修改。科研并不代表从0做到1。
大家一定要重视毕业论文的实验部分,相比绪论、背景介绍,这是论文中最能体现你工作量的部分。
那么实验可以做哪些内容呢?
其实很简单。首先基于数据集,可以做各种对比实验、消融实验,证明各模块的有效性;其次和已有方案进行对比,证明算法的先进性;最后通过分析badcase,分析算法的不足,延伸出未来的研究方向。
在已有方案的选择上也是有讲究的,一般需要选择近3年权威数据集上的SOTA模型,这样比较有信服力。
如果在该数据集上没法超过SOTA模型怎么办?毕竟人家也是在自己选的数据集上“精调细选”出来的。这个时候可以“移花接木”,只跑自己选取的数据集。
再分享一个小技巧,为了体现工作量,你还可以把选取的数据集进行拆分:10%、50%、100%等,并附上说明:为了更好地验证低资源数据集对模型性能的影响。
另外,跑实验过程中必须要及时地记录实验数据,方便后续对比和分析,附上当时我用emacs做的实验记录:
1-2月撰写毕业论文
经过前面代码和实验积累,写好毕业论文就是水到渠成的事了。说实话,我当时真正写完3万字的毕业论文,只用了20天。
下面我们来一步步拆解毕业论文的写法。
首先论文题目要精确到特定领域,比如对于医疗领域的实体抽取,可以命题:中文医疗领域的命名实体抽取方法研究。让评审老师直观地明白你写的内容,切忌假大空。
中英文摘要务必要精炼,一般不超过300字,是对论文的整体总结,要让人看完摘要后立刻明白你做了哪些东西。
论文目录一般包含6-7章:
论文中涉及的模型图,可以用PPT画图然后导出高分辨率的pdf。这里推荐另一款非常好用的免费画图工具:diagrams,很多顶会论文的图都是用这个工具画的。
制作表格可以用Excel,为了体现工作量,还可以把同一个实验数据表格通过Excel制作成直方图放进论文里,显得数据多样化。
如何优雅地在Word中插入参考文献也是一门学问,这里推荐一款自动文献管理软件Zotero,具体可以参考这篇推文:算法工程师如何顺利毕业?
最后当你手握这本厚厚的毕业论文时,你会为这半年的辛勤付出感到骄傲和自豪!
后记
推荐阅读
原创不易,有收获的话请帮忙点击分享、点赞、在看🙏