售前电话
135-3656-7657
售前电话 : 135-3656-7657
释放双眼,带上耳机,听听看~!
00:00
00:00
产生64kbit/s PCM语音要经过三个步骤:以足够高的频率对输入的模拟波形进行抽样,以求能准确地复制出原来的信号;对样值量化以产生连串的“0”“1”比特流,以此表示模拟波形:最后要对量化的比特进行编码,以适于在长距离链路上传输。
实际上,现在主要有两种方式来产生。第一种也是长期以来唯一让人满意的把语音数字化的方法,是尽可能地用一串“0”和“1”来对模拟波形进行模仿,这就是64kbit/s PCM。但这不是产生数字语音的唯一方法。
可以把模拟波形看作一个整体,并对那些在语音中产生的波形而不是对任意的波形进行编码。模仿语音的设备被称为语音编码器,或简称为声码器,这一节主要与波形模仿有关,下一节将详细说明主要运用在VoIP中的些语音编码方法。
经过这三个步骤在发送端由模拟语音产生了64kbit/s PCM语音。但是在语音数字化系统中模/数(A/D)转换仅仅是完成了一半,在接收端还需有个数/模(DIA)转换过程把到达的比特还原成声音。可以说,数字语音的复杂性集中在发送器的A/D处。当然并不是说接收不重要,只是相对而言比较简单而已,它只是接收比特流并按照顺序恢复声音。
这三个数字化步骤的详细过程,数学家和电子工程师们已经用一系列复杂的基本公式定义过了。公式是数学和工程的共同语言,为了准确的描述这三个步骤,许多电话技术文章采用了图形、表格和公式等手段,精确地阐述了每一个步骤是如何使语音信号失真达到最小化的。不过,本书中对这些步骤的处理比较简洁,而且在数学上也不是十分严格。但是,为了描述清语音数字化的过程,对每一步骤仍有许多内容有待阐述,因为在一本工程书中,起码的数学和工程概念是应被掌握的。
这儿更多是用类比的方法对工程概念作一般意义上的说明。考虑到这本书所针对的读者,以易懂为目的,在严格性上做出一点牺牲是可以原谅的。
1、抽样为了模拟任意的波形,要做的第一件事便是建立一套定时机制,以决定何时对输入波形进行抽样。典型的做法是进行等间隔抽样,不过为何要设定相同的抽样间隔时间却没有什么数学上的原因,只是这种做法更简单罢了。从抽样定理中我们得知,如果抽样频率足够高,就能在链路的另端完全恢复出输入的模拟波形。只要在接收端采用一种名为“低通滤波器”的电路来“平滑”抽样过程中产生的样值即可。
抽样过程会产生脉冲振幅调制(PAM)样值。在接收器一端只要有足够多的PAM样值,就可以像绘图似的把样值端点“连接”起来,以恢复输入波形。不过,现在还不能在广域网上传送PAM样值。这一基本思想如图2-6所示。
图2-6 PAM抽样
PAM这一术语的意思是对一系列的样值脉冲序列进行调制以模仿模拟波形。于是,它被称为脉冲振幅调制。
在1933年,尼奎斯特给出了为再生模拟波形所需的最小抽样频率,也就是尼金斯特频率,其大小是输入的模拟波形中最高频率成分的两倍,有时也称为两倍带宽。这里,带宽只是衡量输入信号频率范围的尺度。这样,如果一个上限为3400Hz的模拟语音信号要以尼奎斯特速率进行抽样,则抽样频率至少必须是其两倍,即6800Hz,或说每秒抽样6800次。
抽样并非一定要在尼奎斯特频率进行。尼奎斯特速率是复制出输入波形所需的最小频率,不过抽样可在更高或更低的速率上进行。如果抽样低于尼奎斯特速率,会导致波形畸变,原因是抽样速率没有跟上输入信号的变化速度,所以在输出端就不能把它准确地复制出来。若以尼奎斯特速率或更高的速率进行抽样,则不会产生这种现象。
抽样速率为何要大于尼奎斯特速率?因为只有这样接收器才可获得比必需更多的信息来重建输出波形。这样,如果有样值出错,检测出来后就可以丢弃,毫不影响重建模拟波形。不管对语音还是音乐的模拟波形进行数字化,都是在高于尼奎斯特速率的情况下进行的,这被称作“过量化”