自读音和解释

开头

自读音和解释在语音识别领域是个关键点,其实很简单,就是让机器学会自己读出文字的意思。
### 展开 先说最重要的,自读音通常指的是语音合成技术,比如去年我们跑的那个项目,大概3000量级,就是用这个技术让机器像人一样说话。另外一点,解释则是指语音识别技术,它能将人说话的内容转换成文字。有个细节挺关键的,比如在解释中,我一开始也以为自读音和解释是同一个东西,后来发现不对,它们实际上是语音识别和语音合成的两个不同环节。
### 思维痕迹 等等,还有个事,很多人没注意到,自读音和解释的准确度直接影响到用户体验。我觉得值得试试,在开发语音应用时,先测试一下自读音和解释的准确度,这样用户才会觉得更自然。
### 结尾 说实话挺坑的,有时候一个小小的延迟就能导致整个语音识别系统崩溃,用行话说叫雪崩效应,其实就是前面一个小延迟把后面全拖垮了。所以,在设计和优化语音识别系统时,一定要特别注意这一点。

相关推荐