使用Python三步完成文本到语音的转换

小白学视觉

共 1855字,需浏览 4分钟

 ·

2020-10-29 15:04

点击上方小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

一篇文章带你了解文本到语音转换步骤


在《这篇文章》中,我们有简单提到“文本语音转换”的相关内容,本文将继续讲述其详细实现步骤。


这里小编将介绍文本到语音翻译的基础知识。简要介绍文本语音转换,然后介绍如何开始安装Google文本语音转换(gTTS)模块。然后继续了解gTTS模块的工作原理,并编写一个简单的程序以更好地掌握总体概念。最后将探索更多有关使用此模块可以完成的工作的想法,然后尝试理解可以使用gTTS完成的许多实际用例。


P.S  本文将通过互联网使用Google API进行文本到语音的翻译,所以请大家保持网络连接正常。


注意:这是语言建模教程的第一部分。在本教程系列中,我们将介绍如何使用gTTS进行语音转换,光学字符识别,深度学习模型(如序列到注意力序列模型)以及其他有趣的东西。


TTS简介


文本语音转换(TTS)是将单词转换为语音形式的过程。程序,工具或软件从用户处获取输入文本,并使用自然语言处理方法来理解所用语言的语言学,并对文本进行逻辑推断。该处理后的文本被传递到下一个块,在该块中对处理后的文本执行数字信号处理。经过一些算法的处理,最终转换为语音格式。这整个过程涉及语音的合成。下面是一个简单的流程框图,可以帮助理解上述过程。


乍一看,这似乎是一个相当复杂的过程,但是有了python和gTTS模块,该过程可以简化为仅仅几行代码。从框图中了解到,首先通过自然语言处理对传递的文本进行预处理,然后使用数字信号处理将其转换为语音。


事不宜迟,让我们快速开始~


安装gTTs模块:


在本教程的其余部分中都将使用python。请保证电脑中有安装Python哦~


gTTS模块的安装非常简单,可以在命令提示符中使用以下命令来完成:

pip install gTTS


转换:


安装完成后,我们可以继续编写一个非常简单的程序,以了解如何使用此模块将输入的文本转换为语音。 来看一下我们的示例程序:

from gtts import gTTS
text = "Hello! My name is Bharath."tts = gTTS(text)tts.save("hi.mp3")

gTTS(Google文本语音转换)是一个Python库和CLI工具,可与Google的文本语音转换API进行交互。我们将从gtts模块导入gTTS库,并用该库进行语音翻译。


文本变量是用于存储用户输入的字符串。文本可以替换为引号内的任何内容。另一种方法是在每次运行程序时使用input语句让用户自己输入。上述过程可按如下方式进行:

text = input("Enter your text: ")tts = gTTS(text)tts.save("user_input.mp3")

tts变量用于对用户的输入执行Google文本到语音转换。转换后的文本以语音形式存储在tts变量中。


tts.save函数允许以声音格式文件的形式来保存转换后得到的语音。在这里保存为一个名为user_inpurt,格式为.mp3的文件。当然也可以使用其他格式,如.wav等。


经过上述步骤已成功完成文件的保存。


读取:


1. 直接从文件夹运行保存的文件:可以在运行python程序的同一文件夹下找到保存的文件,并且直接播放。


2. 使用Python中的OS模块:使用python的OS模块直接从程序中运行文件。这样做的命令如下:

import os os.system("user_input.mp3")

3. 使用playsound模块:playsound模块可以用一个简单的命令"pip install playsound"安装,然后使用以下命令继续播放文件中的音频:

from playsound import playsoundos.system("user_input.mp3")


结论:


gTTS模块也可以广泛用于其他语言,例如法语,德语,印地语等。当存在通信障碍并且用户无法将其消息传达给人们时,这个模块就显得非常有用了。文字转语音对视力障碍者或其他残疾人士也有很大的帮助,因为它可以通过协助文字到语音的翻译来帮助他们。

·  END  ·



HAPPY LIFE


浏览 38
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报