LLaSM中英文双语语音-语言助手

联合创作 · 2023-09-26 00:09

LLaSM 是第一个支持中英文双语语音-文本多模态对话的开源可商用对话模型。便捷的语音输入将大幅改善以文本为输入的大模型的使用体验,同时避免了基于 ASR 解决方案的繁琐流程以及可能引入的错误。

同时发布的还有中英文语音 SFT 数据集 LLaSM-Audio-Instructions。包含 19.9 万个对话和 50.8 万个语音-文本样本,是目前所知最大的中英文语音-文本跨模态指令跟随数据集。

模型框架

基础演示

在线试玩

Talk is cheap, Show you the Demo.

资源下载

浏览 18
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

编辑 分享
举报