admin管理员组

文章数量:1568358

2024年1月19日发(作者:)

Media Encoder 9 系列 编码 器最佳 压缩 设置

WindowsMediaEncoder9系列编码器最佳压缩设置2011-02-1413:45最终编辑№风在不同的压缩设置之间存在一种平衡。编码器中包括了许多预定义的目标、视频与音频设置(配置文件);这些设置已经考虑到了平衡问题。通过使用预定义的配置文件,您可以轻松地建立一个编码会话。但是,如果您要对设置进行自定义,那么请参考下面的内容来了解一下这些设置的相关信息,其中包括一些需要考虑的平衡问题。

我所要考虑的问题是如何具体设置以适应特殊的要求。这特殊的要求是指要符合网络流媒体传输,具体来说就是体积要小,质量要好,速度要快,并且要不卡。(我是不是在说废话?!)于此,我总结了以下几个参数:

缓冲区

缓冲区越大,能够适应的图像质量越高,但同时用户在视频开始前必须等待的时间也越长,原因是播放机需要等到它的缓冲区充满后才会开始播放。通常情况下,缓冲延迟的时间(以秒计)与编码器中设置的缓冲区大小相匹配。但是,如果您计划通过WindowsMedia服务器进行流式播放,那么可以在编码器中设置较大的缓冲区大小。WindowsMediaServices中有一个称为"快速启动"的功能,能够使播放机比实际时间更快地填满缓冲区(假设有足够的带宽)。这意味着初始的缓冲延迟可能会短得多。例如,当用户尝试通过DSL或电缆调制解调器播放56Kbps的编码内容时,启动延迟时间可能只有一两秒,而编码过程中的缓冲区大小设置则可能远远不止这些。有关快速启动的详细信息,请参阅WindowsMediaServices帮助。

如果建立了一个使用基于峰值比特率的VBR编码方式对音频进行编码的会话,那么音频的峰值缓冲区大小应当小于视频的缓冲区大小(如果视频使用的是CBR编码方式)或者视频的峰值缓冲区大小(如果视频使用的是基于峰值比特率的编码方式)

比特率

比特率越高,得到的图像质量就越好。如果比特率设置太低,那么编解码器将丢弃一些帧以便生成更高质量的图像,但收看者可能察觉不到这些。(请注意,如果编码视频中动作内容较少,那么实际的比特率可能会明显低于预期的比特率。)

wmv格式最大的弱点是其比特率一成不变,这也是rmvb格式大行其道的原因所在。

附:rmvb与wmvRMVB格式,是在流媒体的RM影片格式上升级延伸而来。VB即VBR,是VariableBitRate(可改变之比特率)的英文缩写。我们在播放以往常见的RM格式电影时,可以在播放器左下角看到225Kbps字样,这就是比特率。影片的静止画面和运动画面对压缩采样率的要求是不同的,如果始终保持固定的比特率,会对影片质量造成浪费。

而RMVB则打破了原先那种平均压缩采样的方式,在保证平均压缩比的基础上,设定了一般为平均采样率两倍的最大采样率值。将较高的比特率用于复杂的动态画面(歌舞、飞车、战争等),而在静态画面中则灵活地转为较低的采样率,合理地利用了比特率资源,使RMVB在牺牲少部分你察觉不到的影片质量情况下最大限度地压缩了影片的大小,最终拥有了近乎完美的接近于DVD品质的视听效果,可谓体积与清晰度"鱼与熊掌兼得",其发展前景不容小觑。

相较DVDrip而言,RMVB的优势不言而喻。首先在保证影片整体视听效果的前提下,RMVB的个头只有300~450MB左右(以90分钟的标准电影计算),而DVDrip却需要700MB甚至更多;其次RMVB的字幕为内嵌字幕,不像DVDrip那样要安装调试字幕外挂软件,有时还会出现乱码;更重要的是RMVB的影音播放只需一次性安装完解码器,以后无论影像还是音效都无需另行调试。而DVDrip却视频、音频解码一大堆,设置不当还会造成音画不同步、花屏失声等等毛病。

WMV(WindowsMediaVideo)是微软公司开发的一种数字视频压缩格式。WMV文件一般同时包含视频和音频部分。视频部分使用WindowsMediaVideo编码,音频部分使用WindowsMediaAudio编码。

WMV是微软推出的一种流媒体格式,它是在"同门"的ASF(AdvancedStreamFormat)格式升级延伸来得。在同等视频质量下,WMV格式的体积非常小,因此很适合在网上播放和传输。

微软的WMV还是很有影响力的。可是由于微软本身的局限性其WMV的应用发展并不顺利。第一,WM9是微软的产品它必定要依赖着Windows,Windows意味着解码部分也要有PC,起码要有PC机的主板。这就大大增加了机顶盒的造价,从而影响了视频广播点播的普及。第二,WMV技术的视频传输延迟非常大,通常要10几秒钟,正是由于这种局限性,目前WMV也仅限于在计算机上浏览WM9视频文件。

帧速率

图像质量和帧速率之间存在制约关系;图像质量提高时,帧速率将降低。如果维持帧速率较为重要,那么可以降低图像质量设置。对于咱们的业务来说,并不是帧率越高越好,在保证播出流畅、连贯的基础上要便于网络传输。在WindowsMediaEncoder9系列编码器里最高可设置为60fps,最低可设置为0.5fps,经过我多次实验、比较,认为25fps是最适合咱们的。

在这里我觉得有必要解释一下码率的概念,所谓码率,是指每秒时间内的数据流量。码率越高,对画面的描述就越精细,画质的损失就越小,所得到的画面就越接近于原始画面。但同时也需要更大的存贮空间来存放这些数据,也就是说,码率越高,碟片上可装载的节目时间就越短。大家用暴风影音或者Realone就能知道自己看的视频质量的数据,暴风影音的码率显示在其播放界面的左下角,Realone则是在右上角。

基本上网络直播都是300KBPS也就是需要大概每秒38K/S的传输带宽(比特率与位宽是8:1的比例)。

所以码率只是一个描述网络电视每秒的数据流量,如果码率很高的,则需要更高的网络带宽支持,如果不够的话,则可能造成画面延迟或丢失。

码率高当然对宽带要求也就越高,一般来说要看800以上的用户就要安2M宽带才可以不卡。如果用户装的是1M,用400左右就可以了的,也不卡。这也就要求我们考虑和准备多种状况的发生。

图像质量(平滑度)

可以调整图像质量,使图像更加平滑或更加清晰。提高清晰度可能会影响帧速率,具体情况取决于视频内容。例如,假设视频中包含很多动作,那么提高清晰度会导致帧速率降低。此外,提高清晰度将带来更高的比特率要求,同时可能需要缓冲区大小增加。

关键帧

如果使用的关键帧间隔较长,那么在必要时(例如场景变化时)会插入附加的关键帧。对于动作较少的内容,通常设置为20秒是比较合适的。对于比特率较高的内容,应当缩短关键帧间隔。

编解码器

请为会话选用合适的编解码器。例如,当音频源为语音或主要为语音内容时,请使用WindowsMediaAudio9Voice编解码器。对于屏幕捕获会话,请使用WindowsMediaVideo9Screen编解码器。

两次通过编码

所谓两次通过编码,是指在第一次通过时分析内容,然后在第二次通过时根据第一次通过时收集的数据进行编码。两次通过编码可以生成质量更好的内容,这是因为编码器有充足时间根据画面的组成找出最佳的比特率、帧速率、缓冲区大小和图像质量的组合。但是,由于编码器要两次处理全部内容,所以这种编码方式所需的时间更长。

我的建议是不用这项功能,因为两次编码与一次编码相比质量只好一点点,却要花费很长的缓冲时间,这与人民群众的要求是不相符的。

调整视频大小

将输出帧大小设置为与输入帧大小相同。依据我使用的实际情况来看,建议不要使用编码器调整源视频的大小。

采样率

简单来讲,采样率和比特率就像是坐标轴上的横纵坐标。横坐标的采样率表示了每秒钟的采样次数。纵坐标的比特率表示了用数字量来量化模拟量的时候的精度。

采样率类似于动态影像的帧数,比如电影的采样率是24赫兹,PAL制式的采样率是25赫兹,NTSC制式的采样率是30赫兹。当我们把采样到的一个个静止画面再以采样率同样的速度回放时,看到的就是连续的画面。同样的道理,把以44.1kHZ采样率记录的CD以同样的速率播放时,就能听到连续的声音。显然,这个采样率越高,听到的声音和看到的图像就越连贯。当然,人的听觉和视觉器官能分辨的采样率是有限的,基本上高于44.1kHZ采样的声音,绝大部分人已经觉察不到其中的分别了。

而声音的位数就相当于画面的颜色数,表示每个取样的数据量,当然数据量越大,回放的声音越准确,不至于把开水壶的叫声和火车的鸣笛混淆。同样的道理,对于画面来说就是更清晰和准确,不至于把血和西红柿酱混淆。不过受人的器官的机能限制,16位的声音和24位的画面基本已经是普通人类的极限了,更高位数就只能靠仪器才能分辨出来了。比如电话就是3kHZ取样的7位声音,而CD是44.1kHZ取样的16位声音,所以CD就比电话更清楚。

当理解了以上这两个概念,比特率就很容易理解了。以电话为例,每秒3000次取样,每个取样是7比特,那么电话的比特率是21000。而CD是每秒44100次取样,两个声道,每个取样是13位PCM编码,所以CD的比特率是44100*2*13=1146600,也就是说CD每秒的数据量大约是144KB,而一张CD的容量是74分等于4440秒,就是639360KB=640MB。

在这个地方提采样率的重要性是因为直播业务除了影像资源外还包括声音传输。而声音传输有几种模式,分别是多比特率音频、多声道音频、CD音频、FM音频以及语音音频,效果从前往后递减。依据某方面的特殊要求,还可以自定义采样率。

补充:什么是kbps?就是1024bit每秒。正常CD采样率是44.1KHz,每个样本用16bit,立体声是两个声道,那么标准CD是44.1K×16×2=1411.2kbps。mp3采用高压缩保真算法,压缩比率一般是8:1,12:1。也就是一张压缩率是12:1的mp3容量相当于12张CD的容量,mp3的kbps就是CD的八分之一或十二分之一约为192kbps、128kbps。播放的时候通过解码器把192kbps转换成1411.2kbps音频流(实际上肯定达不到),然后送到耳机。

主要分三类:从设备、文件以及设备&文件。

如果选择从设备,则该设备的性能将直接影响到播出的质量,家用摄像头与专业摄像机之间的效果就差太远了!

如果选择从文件,其质量好效果是由该文件决定的。

如果选择从设备&文件,情况有很多种,最常见的是播放某文件时传出的是设备里的声音,非常适合远程教学这类的要求。

压缩

此项目中主要有四大类:目标、视频、音频和比特率

先捡主要的说。视频类:视频有高清晰度质量视频、DVD质量视频、全屏视频、高速内容视频、电影内容视频、屏幕捕获、VHS质量视频以及低带宽视频共8类。在默认情况下视频质量由高减低。不过遗憾的是全部视频质量都只有CBR一种格式。

附:什么是CBRCBR(ConstantBitrate),常数比特率指文件从头到尾都是一种位速率。相对于VBR和ABR来讲,它压缩出来的文件体积很大,而且音质相对于VBR和ABR不会有明显的提高。

与之对比的是VBR和ABR。

VBR(VariableBitrate)动态比特率也就是没有固定的比特率,压缩软件在压缩时根据音频数据即时确定使用什么比特率,这是以质量为前提兼顾文件大小的方式,推荐编码模式。

ABR(AverageBitrate)平均比特率是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。

再来说一下音频设置。多声道音频、CD音质音频、FM音质音频和语音音频,音质从前往后递减。音频传输所占的带宽比视频少得多,所以不成为制约网络传输的主要障碍,用户可以灵活设置。

有几个概念过于专业,我也是拿捏不准:

1、渐进式下载"渐进式"从字面意义上来讲是逐步前进、发展的意思[advancegradually;progressstepbystep],具体指什么呢?是指下载速率由慢到快吗?没有具体数据支持这种解释。自己动手做这方面的实验,也只能看到录下的视频的质量不一样而已。

2、WindowsMedia硬件配置文件硬件配置文件是系统里的一系列指令,在启动计算机时告诉Windows应该启动哪些设备,以及使用每个设备中的那些设置。当用户第一次安装Windows时,系统会自动创建一个名为"Profile1"的硬件配置文件,缺省设置下,在"Profile1"硬件配置文件中启用了所有安装Windows时安装在这台计算机上的设备。在这个地方WindowsMedia硬件配置文件指的是一系列指令呢,还是某种独特的视频格式?

3、文档下载(计算机播放)与文件存档之间的联系与区别?

视频大小

这个项目里主要包含两类:裁剪和调整大小

裁剪主要用于制作不同规格的宽屏或其他长宽比的视频,分别是1.67:1、1.78:1、1.85:1、2.20:1、2.40:1,用户可以对视频做相应的剪裁以适应宽屏播放。

调整大小则可以自定义视频的比特率、宽度好高度,具体应用根据用户需求而定。

属性

主要是用来定义视频相关信息的,里面包含标题、作者、版权、分级和描述5项内容,用户自定义添加,以后播放视频的时候其相关信息将能够显示在相应位置。

如果觉得以上5项内容不够,用户还可以自行添加。

依据我的实验结果,传输速率设为887kbps,帧率为24fps,视频大小为640*480,可以达到质量与传输相平衡的好的效果。

注:以上数据基本上是在理想的环境里进行测试的(电脑配置较高、在局域网而不是广域网里传输、同时收看的人很少、视频来源是固定的,等等),并且,以上数据也不符合目前的主流传输模式,例如大多数视频点播的传输速率在300kbps左右,所以,以上数据能否用于实战还有待检验。

本文标签: 视频质量比特率音频设置