ExllamaLlama HF 转换器重写

联合创作 · 2023-09-25 23:39

Exllama 是对 Llama 的 HF 转换器实现进行更高效的内存重写，以用于量化权重。

设计用于量化权重
快速且节省内存的推理（不仅仅是注意力）
跨多个设备映射
内置（多）LoRA 支持
funky 采样函数的配套库

注意，该项目处于概念验证&预览阶段，可能发生大型变更。

硬件/软件要求

作者在 RTX 4090 和 RTX 3070-Ti 上进行开发。两种卡都支持 CUDA 内核，但可能与旧卡不兼容。

作者没有更低的显卡，所以不知道老显卡行不行。

另外，不知道这是否适用于 Windows/WSL。

依赖关系

此列表可能不完整：

torch使用 cu118 在 2.1.0（nightly）上进行测试，也可能适用于较旧的 CUDA 版本
safetensors0.3.1
sentencepiece
ninja

限制

截至目前（正在处理）：

不支持没有 groupsize 的 v1 模型
遇到过具有非标准布局和数据类型的模型（例如 float32 嵌入表）。确保支持所有可能的排列需要一段时间。

浏览 1

点赞

收藏

分享

举报

评论

图片

表情

ExllamaLlama HF 转换器重写

Exllama是对Llama的HF转换器实现进行更高效的内存重写，以用于量化权重。设计用于量化权重快速且节省内存的推理（不仅仅是注意力）跨多个设备映射内置（多）LoRA支持funky采样函数的配套库注

安吉恒丰卫生材料有限公司位于浙江，成立于2006年2月，占地面积约12000平方米，建筑面积8500

安吉恒丰卫生材料有限公司位于浙江，成立于2006年2月，占地面积约12000平方米，建筑面积8500平方米。公司有200多名员工，员工中有15%是技术人员。公司主要产品有面罩、医用弹力绷带、绉纱绷带、

HFEnterprisesInc.是一家多元化控股公司，主要通过其子公司从事房地产开发，数字转换技术和生物健康活动，并在美国，新加坡，香港和澳大利亚开展业务。HFEnterprisesInc.是一家多

创建于1996年，国内较早一批集研究、开发和制造于一体的专业不锈钢啤酒桶公司，可生产20L、30L、50L、60L以及60L以下等不同容量的不锈钢啤酒桶宁波合丰容器制造有限公司（宁波鹤峰厨具有限公司）

创建于1996年，国内较早一批集研究、开发和制造于一体的专业不锈钢啤酒桶公司，可生产20L、30L、

点赞

收藏

分享

举报