LLaSM中英文双语语音-语言助手

联合创作 · 2023-09-26 00:09

LLaSM 是第一个支持中英文双语语音-文本多模态对话的开源可商用对话模型。便捷的语音输入将大幅改善以文本为输入的大模型的使用体验,同时避免了基于 ASR 解决方案的繁琐流程以及可能引入的错误。

同时发布的还有中英文语音 SFT 数据集 LLaSM-Audio-Instructions。包含 19.9 万个对话和 50.8 万个语音-文本样本,是目前所知最大的中英文语音-文本跨模态指令跟随数据集。

模型框架

基础演示

在线试玩

Talk is cheap, Show you the Demo.

资源下载

浏览 9
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑
举报