清华大学力作!一个「PPT」框架,让超大模型调参变简单
机器学习算法与Python实战
共 4728字,需浏览 10分钟
·
2021-09-14 05:09
↑↑↑点击上方蓝字,回复资料,10个G的惊喜
转自:机器之心
随着参数数量的增加,FT 的性能有所提升。
在大多数数据集中,PPT 明显优于 Vanilla PT 和 LM Adaption。
PPT 在所有中文数据集和大多数英文数据集上都优于 10B 模型的 FT。
PPT 在大多数数据集上会产生较小的方差,相比之下,一般的 few-shot 学习常存在不稳定性,例如 Vanilla PT。
推荐阅读
(点击标题可跳转阅读)
老铁,三连支持一下,好吗?↓↓↓
评论