1、背景本篇目录(大约需要花费3分钟):
1、背景
2、实践
3、反思一下
4、转换方法实现
5、重新尝试总结,
今天要做一个文本转语音接口,研究了一天TTSs,不想使用花钱的接口,不想放弃,尝试了python使用pyttsx3方式实现
在windows上实验还可以,但是linux上的结果不尽人意,特别不满意。所以今天写下感受。最终先使用了讯飞的语音合成api,先完成接口开发,后面有时间再研究其他的方式
2、实现过程首先就是查找资料并实现
pyttsx3是Python中的文本到语音转换库。与其他库不同,它可以脱机工作,并且与Python 2和3兼容
实现步骤如下:
第一步:安装库(centos 、debian 需要还安装 espeak,ffmpeg,否则转换时会报错)
pip3 install pyttsx3
第二步实现的代码:
import pyttsx3
engine = pyttsx3.init() # object creation
""" 把语音存储到文件 """
engine.save_to_file("Hello World!!!",'~/abc.mp3')
"""更改速率"""
rate = engine.getProperty('rate') # getting details of current speaking rate
print (rate) #printing current voice rate
engine.setProperty('rate', 125) # setting up new voice rate
"""更改音量"""
volume = engine.getProperty('volume') #getting to know current volume level (min=0 and max=1)
print (volume) #printing current volume level
engine.setProperty('volume',1.0) # setting up volume level between 0 and 1
"""更改声音"""
voices = engine.getProperty('voices') #得到当前voices的详情
#engine.setProperty('voice', voices[0].id) #改变下标,可以更换vocie,转换男声和女声
#engine.setProperty('voice', 'zh') #linux 转换中文,使用此voive,同时支持英文
engine.setProperty('voice', voices[1].id) #改变下标,可以更换vocie
engine.say("Hello World!")
engine.say('My current speaking rate is ' str(rate))
engine.runAndWait()
engine.stop()
以上内容转自:https://www.jianshu.com/p/1a5f5d450c12
在windows上和linux上都能实现,但是linux上的voice和windows的不一样,导致转出的效果差别很大。最终linux服务器上不是很满意。因为没有现成的windows服务器,暂时放弃了这种方案。
3、反思一下为什么会出现windows上和linux上的不同,我去查找了官网,发现了一段话,翻译过来就是
Windows上使用的是sapi5语音合成引擎,Mac OS X上是nsspeech合成器,eSpeak 其他平台上使用,即,linux上使用的espeak。
4、转换方法实现为了完成目前的接口开发,我使用了讯飞语音合成,新用户(企业用户)一年有50万的免费使用,那么我先使用讯飞的api实现接口。
昨天发了个微头条,发现很多人对这个感兴趣,所以就总结下,发下自己的感受。
5、重新尝试总结这次进行了tts的尝试,没有成功使用pyttsx3实现我的接口开发,但是收获了很多。比如发现了一个网站可以免费的转换,也发现了微软接口的一个实现。
如果大家感兴趣的,可以在评论区留言“666”,我下期分享下自己找到的资料。