自动语音识别(Automatic Speech Recognition, ASR)是一种将语音信号转换为文字的技术。其过程通常包括声学模型、语言模型和解码器的应用。首先,声学模型负责从音频中提取特征,识别出语音的基本单元;接着
版本:版本2.4.4