售前电话
135-3656-7657
售前电话 : 135-3656-7657
在现代通信技术中音频信息主要是指由自然界中各种音源发出的可闻声和由计算机通过专门设备合成的语音或音乐。按表示媒体的不同,此类声音主要有三类,即语音、音乐声和效果声等。音频信号是随时间变化的连续媒体,对音频信号的处理要求有比较强的时序性,即较小的延时和时延抖动。对音频信号的处理涉及音频信号的获取、编解码、传输、语音的识别与理解、语音与音乐的合成等内容。
视频信息即活动或运动的图像信息,它由一系列周期呈现的画面所组成,每幅画面称为一帧,帧是构成视频信息的最基本单元。视频信息在现代通信系统所传输的信息中占有重要的地位,因为人类接受的信息约有70%来自视觉,视频信息具有准确、直观、具体生动、高效、应用广泛、信息容量大等特点。
一、听觉特性与音频信号1.人的听觉特性
(1)人对声音强弱的感觉
通过对大量人群的测量发现,当声音信号的强度按指数规律增长时,人会大体上感到声音在均匀地增强,即将声音声强取对数后,才与人对声音的强弱感相对应。根据人类听觉的这一特点,通常用声强值或声压有效值的对数来表示声音的强弱,称为声强级LI或声压级LP单位为分贝(dB)。
(2)人对声音频率的感觉
人对声音频率的感觉表现为音调的高低,且当声音的频率按指数规律上升时,音调的感觉线性升高。这意味着只有对声音信号的频率取对数,才会与人的音高感觉成线性关系。
为了适应人类听觉的音高感规律,在声学和音乐当中表示频率的坐标经常采用对数刻度。音乐里为了使音阶的排列使听起来音高的变化是均匀的,音阶的划分是在频率的对数刻度上取等分得到的。
(3)人类听觉的频响特性
人类听觉对声音频率的感觉不仅表现为音调的高低,而且在声音强度相同条件下声音主观感觉的强弱也是不同的,即人类听觉的频率响应不是平坦的。此外,人的听觉频响还随声压级的变化而变化。人类听觉频响的特点是:声压级越高,听觉频响越平直;随声音声压级的降低,听觉频响变坏,低频响应下降明显。对于高于20kHz和低于20Hz的声音信号,不论声压级多高,一般人也不会听到,即人的听觉频带为20Hz~20kHz,在此频率范围内的声音称为“可闻声气高于20kHz的声音称为“超声”,低于20Hz的声音的称为“次声”。不论声压级高低,人对3kHz~5kHz频率的声音最敏感。
(4)人类听觉的掩蔽效应
在人类听觉系统中的另一个现象是一个声音的存在会影响人们对其他声音的听觉能力,使一个声音在听觉上掩蔽了另一个声音,即所谓的“掩蔽效应”。掩蔽效应常在电声系统中被加以利用,使有用声音信号掩蔽掉那些不需要的声音信号,并根据有用信号的强度来规定允许的最大噪声强度。此外,在音频信号数字编码技术中,还可利用人类听觉系统的掩蔽效应实现高效率的压缩编码。
2.音频信号特性
对于不同类型的发声体来说,其声音信号的频谱分布各不相同。一般人讲话声音的主要能量分布较窄,以频带下降25dB计大概为100Hz~5kHz,因此在电话通信中每一话路的频带一般限制在300Hz~3.4kHz即可将语声信号中的大部分能量发送出去,同时保持一定的可懂度和声色的平衡。相对于语音频谱,歌唱声的频谱要宽得多,一般男低音可唱到比中央C低十三度的E音,其基频为82.407Hz,而女高音可唱到比中央C高两个八度的C音或更高,其基频为1046.5Hz,它的第十次谐波已经超过10kHz。与人的发声器官相比,各种乐器发声的频谱范围则明显要宽的多,从完美传送和记录音乐的角度,电声设备的频带下限一般要到20Hz以下,而其频带上限一般要到20kHz以上。
实际声音信号的强度在一个范围内随时随刻发生着改变,一个声音信号的动态范围是指它的最大声强与最小声强之差,并用dB表示。当用有效声压级表示时,一般语音信号大概有20~40dB的动态范围;交响乐、戏剧等声音的动态范围可高达60~80dB。当按峰值声压级表示时,有些交响乐的动态范围可达100dB或更高。
二、视频技术基础视频技术是利用光电和电光转换原理,将光学图像转换为电信号进行记录或远距离传输,然后还原为光图像的一门技术。
1.视频信号与图像扫描
视频技术中实现光学图像到视频图像信号转换的过程通常是在摄像机中完成的。当被摄景物通过摄像机镜头成像在摄像器件的光电导层时,光电靶上不同点随照度不同激励出数目不等的光电子,从而引起不同的附加光电导产生不同的电位起伏,形成与光像相对应的电图像。该电图像必须经过扫描才能形成可以被处理和传输的视频信号。