灰鸽子远程控制软件概念模型，背后有哪些强大的技术在支撑？（一）明天发文章（二）

admin · 发表于 2017-12-16 21:52:07

灰鸽子远程控制软件概念模型，背后有哪些强大的技术在支撑？（一）明天发文章（二）
当我们使用像Skype、QQ这样的工具和朋友流畅地进行语音视频聊天时，我们可曾想过其背后有哪些强大的技术在支撑？本文将对网络语音通话所使用到的技术做一些简单的介绍
一.概念模型

网络语音通话通常是双向的，就模型层面来说，这个双向是对称的。为了简单起见，我们讨论一个方向的通道就可以了。一方说话，另一方则听到声音。看似简单而迅捷，但是其背后的流程却是相当复杂的。我们将其经过的各个主要环节简化成下图所示的概念模型：

灰鸽子远程控制软件

1.语音采集

   语音采集指的是从麦克风采集音频数据，即声音样本转换成数字信号。其涉及到几个重要的参数：采样频率、采样位数、声道数。
   简单的来说：采样频率，就是在1秒内进行采集动作的次数；采样位数，就是每次采集动作得到的数据长度。
   而一个音频帧的大小就等于：（采样频率×采样位数×声道数×时间）/8。
   通常一个采样帧的时长为10ms，即每10ms的数据构成一个音频帧。假设：采样率16k、采样位数16bit、声道数1，那么一个10ms的音频帧的大小为：（16000*16*1*0.01）/8 = 320 字节。计算式中的0.01为秒，即10ms。
2.编码

   假设我们将采集到的音频帧不经过编码，而直接发送，那么我们可以计算其所需要的带宽要求，仍以上例：320*100 =32KBytes/s，如果换算为bits/s，则为256kb/s。这是个很大的带宽占用。而通过网络流量监控工具，我们可以发现采用类似QQ等IM软件进行语音通话时，流量为3-5KB/s，这比原始流量小了一个数量级。而这主要得益于音频编码技术。
   所以，在实际的语音通话应用中，编码这个环节是不可缺少的。目前有很多常用的语音编码技术，像G.729、iLBC、AAC、SPEEX等等。
3.网络传送

   当一个音频帧完成编码后，即可通过网络发送给通话的对方。对于语音对话这样Realtime应用，低延迟和平稳是非常重要的，这就要求我们的网络传送非常顺畅。
4.解码

   当对方接收到编码帧后，会对其进行解码，以恢复成为可供声卡直接播放的数据。
5.语音播放

   完成解码后，即可将得到的音频帧提交给声卡进行播放。

啊啊啊啊啊啊000 · 发表于 2018-1-7 15:41:05

支持灰鸽子！

mybgn · 发表于 2018-3-9 07:11:09

我绝对支持您，今日强帖

		自动登录	找回密码
密码			立即注册

灰鸽子远程控制软件概念模型，背后有哪些强大的技术在支撑？（一）明天发文章（二）

相关帖子