GPT-J自然语言处理 AI 模型

联合创作 · 2023-09-25 23:02

GPT-J 是一个基于 GPT-3，由 60 亿个参数组成的自然语言处理 AI 模型。该模型在一个 800GB 的开源文本数据集上进行训练，并且能够与类似规模的 GPT-3 模型相媲美。

该模型通过利用 Google Cloud 的 v3-256 TPU 以及 EleutherAI 的 The Pile 数据集进行训练的，历时大约五周时间。

性能对比：

Model	Weights	Training FLOPs	LAMBADA PPL ↓	LAMBADA Acc ↑	Winogrande ↑	Hellaswag ↑	PIQA ↑	Dataset Size (GB)
Chance	✔	0	~a lot	~0%	50%	25%	25%	0
GPT-3-Ada‡	✘	-----	9.95	51.6%	52.9%	43.4%	70.5%	-----
GPT-2-1.5B	✔	-----	10.63	51.21%	59.4%	50.9%	70.8%	40
GPTNeo-1.3B‡	✔	3.0e21	7.50	57.2%	55.0%	48.9%	71.1%	825
Megatron-2.5B*	✘	2.4e21	-----	61.7%	-----	-----	-----	174
GPTNeo-2.7B‡	✔	6.8e21	5.63	62.2%	56.5%	55.8%	73.0%	825
GPT-3-1.3B*‡	✘	2.4e21	5.44	63.6%	58.7%	54.7%	75.1%	~800
GPT-3-Babbage‡	✘	-----	5.58	62.4%	59.0%	54.5%	75.5%	-----
Megatron-8.3B*	✘	7.8e21	-----	66.5%	-----	-----	-----	174
GPT-3-2.7B*‡	✘	4.8e21	4.60	67.1%	62.3%	62.8%	75.6%	~800
Megatron-11B†	✔	1.0e22	-----	-----	-----	-----	-----	161
GPT-J-6B‡	✔	1.5e22	3.99	69.7%	65.3%	66.1%	76.5%	825
GPT-3-6.7B*‡	✘	1.2e22	4.00	70.3%	64.5%	67.4%	78.0%	~800
GPT-3-Curie‡	✘	-----	4.00	69.3%	65.6%	68.5%	77.9%	-----
GPT-3-13B*‡	✘	2.3e22	3.56	72.5%	67.9%	70.9%	78.5%	~800
GPT-3-175B*‡	✘	3.1e23	3.00	76.2%	70.2%	78.9%	81.0%	~800
GPT-3-Davinci‡	✘	-----	3.0	75%	72%	78%	80%	-----

浏览 19

点赞

收藏

分享

举报

评论

图片

表情

GPT-J自然语言处理 AI 模型

GPT-J是一个基于GPT-3，由60亿个参数组成的自然语言处理AI模型。该模型在一个800GB的开源文本数据集上进行训练，并且能够与类似规模的GPT-3模型相媲美。该模型通过利用GoogleClou

BLOOM自然语言处理大模型

Bloom 是用于自然语言处理的大语言模型，包含 1760 亿个参数，支持 46 种自然语言（包括中

自然语言处理的形式模型

本书对自然语言处理中的各种形式模型进行了系统的梳理，分别讨论了基于短语结构语法的形式模型、基于合一运

BLOOM自然语言处理大模型

Bloom是用于自然语言处理的大语言模型，包含1760亿个参数，支持46种自然语言（包括中文）和13种编程语言，可以用来回答问题、翻译文本、从文件中提取信息片段，还能像GitHubCopilot一样用

自然语言处理的形式模型

自然语言处理的形式模型

Cerebras-GPT自然语言处理领域大模型

Cerebras GPT 是由 Cerebras 公司开源的自然语言处理领域的预训练大模型，其模型参

Cerebras-GPT自然语言处理领域大模型

CerebrasGPT是由Cerebras公司开源的自然语言处理领域的预训练大模型，其模型参数规模最小1.11亿，最大130亿，共7个模型。与业界的模型相比，Cerebras-GPT几乎是各个方面完全

自然语言处理实战

自然语言处理实战

HanLP自然语言处理

HanLP: Han Language Processing汉语言处理包HanLP 是由一系列模型与

Python自然语言处理

自然语言处理（natural language processing，nlp）是计算机科学领域与人工

点赞

收藏

分享

举报