使用Python三步完成文本到语音的转换-轻识

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

一篇文章带你了解文本到语音转换步骤

在《这篇文章》中，我们有简单提到“文本语音转换”的相关内容，本文将继续讲述其详细实现步骤。

这里小编将介绍文本到语音翻译的基础知识。简要介绍文本语音转换，然后介绍如何开始安装Google文本语音转换（gTTS）模块。然后继续了解gTTS模块的工作原理，并编写一个简单的程序以更好地掌握总体概念。最后将探索更多有关使用此模块可以完成的工作的想法，然后尝试理解可以使用gTTS完成的许多实际用例。

P.S 本文将通过互联网使用Google API进行文本到语音的翻译，所以请大家保持网络连接正常。

注意：这是语言建模教程的第一部分。在本教程系列中，我们将介绍如何使用gTTS进行语音转换，光学字符识别，深度学习模型（如序列到注意力序列模型）以及其他有趣的东西。

TTS简介

文本语音转换（TTS）是将单词转换为语音形式的过程。程序，工具或软件从用户处获取输入文本，并使用自然语言处理方法来理解所用语言的语言学，并对文本进行逻辑推断。该处理后的文本被传递到下一个块，在该块中对处理后的文本执行数字信号处理。经过一些算法的处理，最终转换为语音格式。这整个过程涉及语音的合成。下面是一个简单的流程框图，可以帮助理解上述过程。

乍一看，这似乎是一个相当复杂的过程，但是有了python和gTTS模块，该过程可以简化为仅仅几行代码。从框图中了解到，首先通过自然语言处理对传递的文本进行预处理，然后使用数字信号处理将其转换为语音。

事不宜迟，让我们快速开始~

安装gTTs模块：

在本教程的其余部分中都将使用python。请保证电脑中有安装Python哦~

gTTS模块的安装非常简单，可以在命令提示符中使用以下命令来完成：

pip install gTTS

转换：

安装完成后，我们可以继续编写一个非常简单的程序，以了解如何使用此模块将输入的文本转换为语音。来看一下我们的示例程序：

from gtts import gTTS
text = "Hello! My name is Bharath."tts = gTTS(text)tts.save("hi.mp3")

gTTS（Google文本语音转换）是一个Python库和CLI工具，可与Google的文本语音转换API进行交互。我们将从gtts模块导入gTTS库，并用该库进行语音翻译。

文本变量是用于存储用户输入的字符串。文本可以替换为引号内的任何内容。另一种方法是在每次运行程序时使用input语句让用户自己输入。上述过程可按如下方式进行：

text = input("Enter your text: ")tts = gTTS(text)tts.save("user_input.mp3")

tts变量用于对用户的输入执行Google文本到语音转换。转换后的文本以语音形式存储在tts变量中。

tts.save函数允许以声音格式文件的形式来保存转换后得到的语音。在这里保存为一个名为user_inpurt，格式为.mp3的文件。当然也可以使用其他格式，如.wav等。

经过上述步骤已成功完成文件的保存。

读取：

1. 直接从文件夹运行保存的文件：可以在运行python程序的同一文件夹下找到保存的文件，并且直接播放。

2. 使用Python中的OS模块：使用python的OS模块直接从程序中运行文件。这样做的命令如下：

import os os.system("user_input.mp3")

3. 使用playsound模块：playsound模块可以用一个简单的命令"pip install playsound"安装，然后使用以下命令继续播放文件中的音频：

from playsound import playsoundos.system("user_input.mp3")

结论：

gTTS模块也可以广泛用于其他语言，例如法语，德语，印地语等。当存在通信障碍并且用户无法将其消息传达给人们时，这个模块就显得非常有用了。文字转语音对视力障碍者或其他残疾人士也有很大的帮助，因为它可以通过协助文字到语音的翻译来帮助他们。

· END ·

HAPPY LIFE