LLaSM中英文双语语音-语言助手
LLaSM 是第一个支持中英文双语语音-文本多模态对话的开源可商用对话模型。便捷的语音输入将大幅改善以文本为输入的大模型的使用体验,同时避免了基于 ASR 解决方案的繁琐流程以及可能引入的错误。
同时发布的还有中英文语音 SFT 数据集 LLaSM-Audio-Instructions。包含 19.9 万个对话和 50.8 万个语音-文本样本,是目前所知最大的中英文语音-文本跨模态指令跟随数据集。
模型框架
基础演示
在线试玩
Talk is cheap, Show you the Demo.
资源下载
-
Hugging Face模型下载:
-
百度网盘下载:
-
语言模型:
评论