Windows开发：关于微软媒体基础（Microsoft Media Foundation）|电子爱好者

admin管理员组
文章数量:1565810

序言

介绍

Microsoft Media Foundation是适用于Windows的下一代多媒体平台，使开发人员，消费者和内容提供商能够以更强的健壮性，无与伦比的质量和无缝交互来拥抱新一轮的高级内容。
Media Foundation需要Windows Vista或更高版本。它使用组件对象模型（COM），并且需要C / C ++。Microsoft不提供Media Foundation的托管API。
Media Foundation API是Windows SDK的一部分。要开发Media Foundation应用程序，请安装最新版本的Windows SDK。

可用的基础工具

MFTrace
TopoEdit

基础概念 Essential Concepts

流 Streams

流，是一个统一格式的媒体数据序列。其中最常见的是音频流和视频流，但是一个流也可以包含几乎任何种类的数据，包括文本、脚本命令、以及静止图片。在这篇文章里的术语“流”并不特指网络传输中的流。用于本地播放的媒体文件也包含“流”。
通常一个媒体文件要么包含单一的音频流，要么是一个视频流和一个音频流。然而一个媒体文件也可能包含很多个相同类型的流。例如一个视频文件可能包含多种语言的音频流。在运行过程中应用程序去选择播放哪一种语言的音频。

压缩 Compression

压缩是指通过删除冗余信息来减少数据流大小的过程。
压缩算法分为两大类：

无损压缩：使用无损算法，复原后的数据与原始数据相同。
有损压缩：使用有损算法，复原后的数据是原始数据的近似值，但不是准确值。

在大多数其他领域中，有损压缩是不可接受的。（想象一下电子表格的“近似值”！）但是有两个原因，有损压缩方案非常适合音频和视频。
第一个原因与人类感知的物理学有关。当我们听复杂的声音（例如音乐录音）时，该声音中包含的某些信息是听不到的。借助信号处理理论，可以分析和分离无法感知的频率。可以消除这些频率，而不会产生感知影响。尽管重建的音频将与原始音频不完全匹配，但它对听众来说听起来是一样的。类似的原理也适用于视频。
其次，根据预期目的，声音或图像质量的某些下降可能是可以接受的。例如，在电话中，音频通常被高度压缩。结果足以进行电话交谈-但却不能用来听音乐。
压缩也称为编码，将进行编码的设备称为编码器。反向过程是解码，该设备自然称为解码器。编码器和解码器的总称是编解码器。编解码器可以用硬件或软件来实现。

媒体容器 Media Containers

我们很少将原始音频或视频流存储为文件，或者直接通过网络发送。一方面，如果不事先知道要使用哪个编解码器，就不可能解码这样的流。因此，媒体文件通常至少包含以下某些元素：

用于描述流的数量，以及每个流的格式等的文件头。
允许对内容进行随机访问的索引。
描述内容的元数据（例如，文件的作者或标题）。
数据包头，以实现网络传输或随机访问。

本文档使用术语“container ”来描述流，标头，索引，元数据等的整个包。之所以使用术语“容器”而不是“文件”，是因为某些容器格式是为直播而设计的。应用程序可以实时生成容器，而无需将其存储到文件中。

媒体容器的早期示例是AVI文件格式。其他示例包括MP4和高级系统格式（ASF）。可以通过文件扩展名（例如.mp4）或MIME类型来标识容器。

下图显示了媒体容器的典型结构。该图不代表任何特定格式；因为每种格式的细节差异很大。

请注意，图中所示的结构是分层的，标头信息出现在容器的开头。这种结构是许多（但不是全部）容器格式的代表。还要注意，数据部分包含交错的音频和视频数据包。这种交织在媒体容器中很常见。
术语多路复用是指对音频和视频流进行打包并将包交织到容器中的过程。从打包数据重新组合流的反向过程称为多路分解。

格式 Formats

在数字媒体中，格式一词并不明确。格式可以指代编码的类型（例如H.264视频）或容器的类型（例如MP4）。这种区别通常会使普通用户感到困惑。媒体格式的名称并不总是有用。例如，MP3既指编码格式（MPEG-1音频第3层）又指文件格式。
但是，区别很重要，因为读取媒体文件实际上涉及两个阶段：

首先，必须对容器进行解析。在大多数情况下，直到完成此步骤才能知道流的数量和每个流的格式。
接下来，如果流被压缩，则必须使用适当的解码器对其进行解码。

这种情况下自然衍生了一种软件设计模式，使用单独的组件来解析容器和解码流。另外，此方法适合于插件模型，以便第三方可以提供自己的解析器和编解码器。在Windows上，组件对象模型（COM）提供了一种将API与实现分开的标准方法，这是任何插件模型所必需的，这也是Media Foundation使用COM接口的原因之一。
下图显示了用于读取媒体文件的组件：

编写媒体文件还需要两个步骤：

编码未压缩的音频/视频数据。
将压缩数据放入特定的容器格式。

下图显示了用于写入媒体文件的组件：

增强的视频渲染器 Enhanced Video Renderer（EVR）

增强的视频渲染器（EVR）是在用户的监视器上显示视频的组件。存在两种版本的EVR：

EVR媒体接收器，用于Media Foundation应用程序。
EVR筛选器，用于DirectShow应用程序。

两种版本都使用相同的内部对象来渲染视频，并且它们共享许多相同的接口。
EVR最多可以混合16个视频流。第一个输入流称为参照流。参照流通常在z-order的首位。
（窗口的z-order表明了在一堆堆叠的窗口中该窗口的位置。窗口的堆叠是沿bai着一条虚轴—Z轴，从屏幕里向外延伸的。在z-order顶端的窗口将会压在其他窗口上。在z-order底部的窗口将会被其他窗口所压。系统在一个单一的表中维护z-order 。根据窗口是不是顶级窗口，父窗口，子窗口，系统把他们添加到z-order中。顶级窗口将会堆叠在所有非顶级窗口之上，不管它是否是活动窗口或者是前台窗口。）
任何其他流称为子流，并在参照流的顶部混合。应用程序可以更改子流的z-order，但是任何子流都不能在z-order中排在首位。
图形驱动程序确定支持哪些视频格式，但通常仅限于以下几种：

参照流：逐行或交错式的没有单个像素alpha值的YUV（例如NV12或YUY2），或渐进式RGB。
子流：含逐像素alpha值的渐进式YUV，例如AYUV或AI44。

可用的子流格式可能取决于参考流的格式。
在内部，EVR使用称为混合器（mixer）的对象将来自输入流的帧合成到一个表面上进行渲染。混合器还执行去隔行和色彩校正。混合器最终输出混合后的视频帧。再通过第二个对象演示器（presenter）将视频帧渲染到屏幕。演示器安排渲染帧的时间并管理Direct3D设备。应用程序可以提供混合器或演示器的自定义实现。

本文标签：微软基础媒体 Windows Media

版权声明：本文标题：Windows开发：关于微软媒体基础（Microsoft Media Foundation）内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://www.elefans.com/dianzi/1725566866a1030054.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

电子爱好者 - 最新技术资讯及电子产品介绍！

Windows开发：关于微软媒体基础（Microsoft Media Foundation）

目录

序言

介绍

可用的基础工具

基础概念 Essential Concepts

流 Streams

压缩 Compression

媒体容器 Media Containers

格式 Formats

增强的视频渲染器 Enhanced Video Renderer（EVR）

更多相关文章

windows无法打开添加打印机_打印机共享常见问题汇总

无线打印 airprint 服务器,如何让 Windows 的共享打印机支持 AirPrint

Windows电脑搜索功能不能用怎么办

Windows笔记本电脑Oracle正常启动但Navicat显示连接超时

全球Windows机器蓝屏，作为量化人，我的检讨来了

排除Windows XP无法启动故障

Windows安装Docker Desktop，详细步骤

Windows系统安装启动Nacos

服务器系统无法安装net3.5,Windows Server 2012无法安装.NET Framework 3.5.1的解决方法

教程：Ubuntu 14.04 和 Windows 8.1 双系统安装步骤

禁止Windows更新自动安装驱动程序

Windows安装openssh失败——解决思路

windows下python常用库的安装

适用于 Windows 电脑 的 15 款最佳免费 PDF 编辑器软件下载

Windows有哪些免费好用的PDF编辑器推荐？

内网渗透-windows权限维持

Windows系统目录下文件夹汇总

我决不黑微软。。也不知你说的对不对？大家来点有思想高度的分析

Windows Server 2012 AD域管理创建

完全用Linux工作，摈弃Windows

发表评论

推荐文章

php微信wifi扫码连接不上,微信「扫码连WiFi」小程序，教你不用密码一键连Wi-Fi！...

html手机端音乐不自动播放,解决移动端浏览器 HTML 音频不能自动播放的三种方法...

win10：Anaconda+vscode配置python环境

在线Photoshop ps网页图片处理PHP源码

Oracle数据库完全卸载+重装11g

热门文章

Eclipse 快捷键

android键盘还是讯飞输入,讯飞输入法BiuBiu键盘又添神仙操作 分类自定义排序来了...

运维系列&amp;AI系列&amp;Lenovo-G双系统系列（亲测有效）：Ubuntu22.04 搜狗输入法安装指南（官方原版）

英语写作中conduct 的用法

python software foundation是什么-PythonSoftwareFoundation

Linux文件系统和磁盘分区

谷歌浏览器（ERR_TIMED_OUT报错、无法访问chat官网）

kail linux--安装中文输入法

91卫图助手下载器永久免费啦！

MyEclipse 超强使用经验

最新文章

Docker安装Harbor

黑科技——通过docker+xware在群辉DSM 6.0系统实现迅雷远程下载

VS2019 C#开发手机App环境配置和开发

这些免费看电视的直播软件，还能免费追剧的app，需要的收藏！

一份完整的app产品运营推广方案，app推广运营的方法（二

Arduino IDE傻瓜式离线安装ESP8266ESP32stm32固件支持包

完整恢复玩客云官方固件，恢复迅雷下载和备份

Google Chrome 下载链接，直接复制到QQ旋风或迅雷即可下载

iOS迅雷7月19日更新，终于可以稳定下载了！

Mac苹果电脑Matlab2018a和2020a下载及安装（linux和win也有，但是没试）

迅雷精简版依托迅雷强大的P2P资源网络和独特的下载技术

app应用内升级方案选型与优化

OpenWrt路由器通过Aria2开启迅雷离线下载[图文教程]

pytorch手动安装开发包

Docker下载与安装(win7，8，10，mac)

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

适用于 Windows 电脑的 15 款最佳免费 PDF 编辑器软件下载

android键盘还是讯飞输入,讯飞输入法BiuBiu键盘又添神仙操作分类自定义排序来了...

运维系列&AI系列&Lenovo-G双系统系列（亲测有效）：Ubuntu22.04 搜狗输入法安装指南（官方原版）

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载