在Web上的媒体共享和创作的方法转让专利

申请号 : CN200680040416.X

文献号 : CN101300567B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : X-S·华S·李

申请人 : 微软公司

摘要 :

示例性的媒体浏览、搜索和创作工具允许经web的媒体交互。示例性的方法包括获取数字视频数据,运用可升级的视频编码数字视频数据以生成可升级的编码数字视频数据,运用一个或多个视频过滤器分析所述可升级的编码的数字视频数据,生成关于可升级的编码的数字视频数据的信息,并且提供对所生成的信息的web访问。也公开了各种其他的示例性技术。

权利要求 :

1.一种用于在Web上创作和共享媒体的方法,其包括:获取数字视频数据;

运用可升级的视频编码来编码所述数字视频数据,生成可升级的编码的数字视频数据;

运用一个或多个视频过滤器分析所述可升级的编码的数字视频数据,生成关于可升级的编码的数字视频数据的信息;以及提供对所生成的信息的web访问;

其中,所述可升级的视频编码允许多种不同的设备访问数字视频数据,而无需为每个类型的设备维护或获取单独的编码流。

2.如权利要求1所述的方法,其特征在于,所述提供对所生成的信息的web访问包括通过共享控制应用共享所述信息。

3.如权利要求1所述的方法,其特征在于,所述提供对所生成的信息的web访问包括将所述信息传送到基于web的元数据库,且其中所述信息包含元数据。

4.如权利要求1所述的方法,还包括将可升级的编码的数字视频数据传送到基于web的媒体库。

5.如权利要求1所述的方法,其特征在于,所述提供对所生成的信息的web访问包括设置许可。

6.如权利要求5所述的方法,其特征在于,所述许可包含针对一个或多个基于web的社区的许可。

7.如权利要求1所述的方法,其特征在于,所述提供对所生成的信息的web访问包括设置一个或多个视频质量参数。

8.如权利要求1所述的方法,其特征在于,所生成的关于可升级的编码的数字视频数据的信息包含内容信息。

9.如权利要求1所述的方法,其特征在于,所生成的关于可升级的编码的数字视频数据的信息包括视频质量信息。

10.如权利要求1所述的方法,其特征在于,所述分析包括选自下组的至少一个过滤器的使用:镜头探测、次镜头探测、场景分组、运动探测、关键帧提取、彩色柱状图、注意力探测、质量评估、相关图、视频签名、面部探测、意图探测、语义类、语义注解、关键字及文本描述过滤器。

11.如权利要求1所述的方法,其特征在于,所述提供对所生成的信息的web访问以可扩展标记语言的形式提供对所述信息的web访问。

12.如权利要求1所述的方法,其特征在于,所述数字视频数据包括数字视频数据和数字音频数据。

13.一种用于在Web上创作和共享媒体的方法,包括:获取数字视频数据、数字图像数据和/或数字音乐数据;

如果所述获取获取的是数字视频数据,则使用可升级的视频编码对所述数字视频数据进行编码,生成可升级的编码的数字视频数据;

如果所述获取获取的是数字图像数据,则对所述数字图像数据进行编码生成编码的数字图像数据;

如果所述获取获取的是数字音乐数据,则对所述数字音乐数据进行编码生成编码的数字音乐数据;

使用一个或多个过滤器分析所述编码的数字视频数据、所述编码的数字图像数据和/或所述编码的数字音乐数据,以可扩展标记语言生成元数据,所述元数据关于所述编码的数字视频数据、所述编码的数字图像数据和/或所述编码的数字音乐数据;以及将可扩展标记语言形式的元数据传送至基于web的元数据库;

其中,所述可升级的视频编码允许多种不同的设备访问数字视频数据,而无需为每个类型的设备维护或获取单独的编码流。

14.如权利要求13所述的方法,其特征在于,所述分析包括使用选自下组的至少一个过滤器:起始、节拍探测、速度探测、重复探测、关键字和文本描述过滤器。

说明书 :

技术领域

本发明涉及因特网技术,特别是,涉及在Web(网页)上的媒体共享和创作。

背景技术

许多人认为搜索技术是导航因特网上日益增长的媒体(视频/音频/图像)集的关键。此外,随着媒体呈现出不同的形式、类型、品质、内容等,产生了对于导航和识别特定媒体的搜索能力的需求。更进一步地,为了促进内容的广泛传播,技术应当在考虑搜索和浏览能力的同时考虑能促进此种传播的创作能力。视频或许因大小/品质以及编解码器问题而提出了最大的挑战,更遑论伴有音频的视频。如在此说明的那样,多种示例性技术解决媒体(例如:视频、音频、图片等等)的创作、分享、搜索以及浏览的需求和/或其他需求。

发明内容

为了媒体共享和创作,一个示范系统与Web或其他联网环境协同运行。在一个终端对终端的实现例子中,此种系统包括用于可升级(scalable)的视频编码、多媒体内容分析、和基于模版的媒体创作的各种示范技术。可升级的编解码器解决数据传输问题,多媒体内容分析特征促进视频编辑和元数据生成(需要时),而基于模版的媒体创作降低了媒体共享和创作的工作量。在此描述的各种个例子与因特网协同运行,以证明示例性系统和各种示范技术的效率。
在此描述的示例性搜索及相关技术有助于导航因特网上日益增长的媒体(例如:视频、音频、图片等等)的集合或资源。各种示例性技术在Web上提供媒体的高效和可升级的视频编辑、浏览、和共享。

附图说明

参考以下的附图描述非限制性且非穷举的示例:
图1是一个用于媒体的获取、储存、浏览、和创作的示例性基于web的媒体共享和创作系统的框图;
图2是一个示例性内容分析程序的框图,同时示出的还有适用于此类分析的各种过滤器;
图3是一个示例性元数据及媒体共享程序的框图;
图4是用于示例性系统的示例性桌面用户界面和相关方法的图;
图5是用于示例性系统的示例性搜索和浏览用户界面以及相关方法的图;
图6是用于示例性系统的示例性模版和相关方法的图;
图7是一个示例性计算设备的框图。

具体实施方式

以下的描述包括目前设想中最佳的模式。在此描述的技术一般地涉及信息界面和信息呈现、多媒体信息系统(例如:视频、音频、等等)、用于视觉(vision)和场景理解(例如:视频分析等)的人工智能。各种示例性技术涉及视频编辑、多媒体内容分析、多媒体共享、多媒体管理、和/或基于模版的视频创作。公开了通过使用硬件,通常是使用软件来实现的各种算法。
各种示例性技术可以通过使用在诸如由一个或多个网络连接的计算机系统的计算环境中的组件实现。
最近推介并迅速普及的消费者数码照相机和视频可携式摄像机已经重新定义了媒体(照片和视频)管理、创作/编辑、和共享工具的前景。现有视频编辑工具可以粗略地分成两类。一类是高端专业编辑系统,而另一类是中低端编辑工具。
虽然第一类的编辑工具存在某些灵活性和编辑功能,但是用户经常需要复杂的编辑技巧和审美观。同时,学习这些工具对于一个用户来说需要花费很大的精力。此外,在使用这些工具时,视频编辑工作仍然是耗时且枯燥的。
至于第二类编辑工具,借助于由智能媒体内容分析技术驱动的自动视频编辑方法,此类工具可以使视频编辑工作简单得多。此外,还有一些自动的或半自动的编辑方法可用。
关于工具的示例,根据大量的“不相称(unsuitability)”得分,“相称”工具可检测出相称的视频媒体剪辑。此类工具使用户得以在情节串连图板中组织相称的剪辑,并且得以自动地串接产生最终的视频。在另一个示例中,自动音乐视频生成工具可基于涉及照相机运动和图像对比的视频不相称的计算做内容选择。自动化家庭视频编辑方案提供通过选择合意的高质量剪辑并把它们用过渡效果和配乐连接起来而动态地凸显家庭视频内容的工具。
作为自动化家庭视频编辑方案的示例,一个或多个工具允许从视频中提取次镜头(sub-shot)并允许为所提取的次镜头中的至少一部分计算重要性量度。然后一个工具可以确定与其它次镜头的重要性度量相比具有较高重要性度量的次镜头的相应相对分布。在此等示例中,基于所确定的相对分布,关于在特定分配中的其它次镜头,那些不展示出统一分布的次镜头可以被弃去,而余下的次镜头(例如,通过相应镜头过渡所连接的)可用来组成一个视频摘要。一个工具可以添加独立的音乐来源(例如,作为配乐),例如:通过将次镜头的边界与乐拍对齐并且使次镜头的运动强度与音乐氛围相配合。
一般十分庞大的媒体数据的体积会妨碍个人媒体的共享。基于创作的共享,即分享创作的(概要的)媒体可以大大地减轻数据传输的负担;然而,由于缺少合适的媒体创作工具和共享平台,这个问题仍远未彻底解决。
在此描述的各种示例性技术可以被用来创作一个示例性的基于Web的用于媒体创作的方案或系统。此等示例性系统可使用户得以有效地在上共享和创作Web个人媒体。如上文所述,示例性系统可包括下面的三种组件技术:可升级的视频编码,智能多媒体内容分析,以及基于模版的媒体创作。
如在此论述的,可升级的视频编解码器解决数据传输,多媒体内容分析促进自动视频编辑,而基于模版的媒体创作可降低媒体共享和创作的工作量。基于Web的媒体创作可为普通用户提供共享媒体经验的更广阔的空间,并为用户提供获取供进一步应用的原始媒体资料的更宽阔的渠道。
关于可升级的视频编码,可升级的编码流使得在无需为每个类型的设备维护或获取单独的编码流的情况下,可使用多种不同设备访问媒体内容。一种示例性体系结构允许系统自适应性地访问可升级的媒体编码流,实现两个目的:提高资源的有效使用,充分利用可升级的媒体编码流来支撑多个不同的应用软件。在此示例中,编码流的最小编码单位,如宏块(macroblock)(例如:在选定的水平上提供对内容的访问)可以被对等系统或对等层以小信息包(packettes)的形式收集。此类小信息包可以在常规的传输包中传送。如此,这种示例性的体系结构得适应性地访问对于在交换编码流的系统上的应用软件和传输层皆透明的可升级的编码流。这样的类体系结构支持包括以下操作在内的应用:允许多个设备各自在所需的层次上接收内容而无需交互完整的编码流,在设备之间的内容转换(contentshifting)以便于设备漫游,以及访问层次转换以适应可用存储器或其它权能的变化。
下面有不同部分(从2到7)。简言之,第2部分介绍了示例性的基于Web的编辑系统的体系结构。第3部分介绍了在客户处应用的预处理操作,接着在第4部分介绍了能够在社区服务器上执行的操作。在第5部分中,介绍了在web上实现创作的各种技术的演示例子及创作模版。第6部分介绍了各种示例性技术,而第7部分涉及适合用于实现各种示例性组件以及用于组成示例性系统的示例性计算环境。
第2部分:示例性系统
图1展示了一个包括各种层的基于web的媒体共享和创作系统100:获取和/或分析层110;库层120;库web层130;以及浏览、搜索和创作层140。还包括一个在库层120和库web层130之间提供信息传输的共享控件123。这些层可包括一个或多个相关联的模块。例如,如图所示,获取和/或分析层110包括用于原始媒体数据获取的获取模块112和用于媒体内容分析的分析模块114。浏览、搜索和创作层140包括浏览和搜索模块142、创作模块144、和诸如播放/预览模块146、输出/保存模块147、和共享模块148之类的一个或多个命令模块。各种模块可作为层间或层内的接口运行。
库层120包括用于诸如使用可升级的视频编码法编码的视频媒体之类的媒体的个人媒体库122和元数据库124,元数据库124可储存与媒体内容相关联的元数据,比如来自媒体内容过滤器的元数据。库web层130包括用于诸如任选地服从于可升级的视频编码的视频媒体的社区媒体库132、以及社区元数据库134。共享控件123允许在一个或多个库之间传递或传输信息,例如在桌面客户库和社区服务器库之间。
一个或多个用户可使用与桌面客户相关联的模块(例如获取模块112)将媒体数据输入桌面客户,其中媒体数据包括由可升级的视频编解码器编码的视频数据。包括分析算法的内容分析模块(例如分析模块114)随之可应用于媒体数据。模块可在桌面客户上构建个人媒体库(例如个人媒体库122)和元库(例如元数据库124)或者访问一个或多个现有的桌面客户库以存储媒体数据。
与桌面客户相关联的共享控件(例如共享控件123)随后可使一个或多个用户共享所有的或部分的元数据、以及在服务器上的所有的或部分的预定质量(例如在低清晰度、低帧速度、和/或高压缩率方面低质量)的媒体数据。例如,共享控件123可将此类信息上传至库web层130(例如包括一个或多个服务器)。共享模块可使一个或多个用户通过一个统一的管理界面控制在桌面客户和web(例如社区web)上的共享许可。
在图1的示例中,社区web服务器维护社区媒体库132和元数据库134。通常,这样的元数据库涵盖更多的媒体数据,并且可链接于一个个用户的电脑中的媒体数据库,例如依照适当的许可控件。
在图1的基于web的媒体共享和创作系统100中,从服务器角度,一个或多个基于web的应用提供网络浏览、搜索和创作(例如浏览和搜索模块142,创作模块144)的能力。在一个实现中,创作的结果可在web上用低清晰度和/或低帧速度播放(预览),而如果用户可从数据拥有者那里得到数据流的许可,那么就可以创建较高质量的媒体(例如根据用户的共享控件)。所创建的内容可以包含各种类型的数据(例如,无需局限于实媒体数据;可以是小型的描述文件),可在一个或多个社区服务器上共享。
第3部分:在客户上的示例性预处理
在社区服务器上创作和共享此类数据之前,各种的媒体数据预处理技术可运用在客户上。在一个定示例中,可升级编码、内容分析和元数据共享提供可在web上创作和共享之前的个人媒体数据预处理。
图2展示了示例性内容处理技术200,其包括与获取模块112相关联的编码技术和与分析模块114相关联的过滤技术。获取模块112可获取各种类型的媒体,例如:视频102、图片104、和音乐106。关于编码法,具体的示例包括可升级的视频编码(“SVC”,如同在SVC 210中所提供的)、图像编码212和音频编码214。
3.1示例性的可升级的媒体编码
SVC是基于web的媒体共享和创作系统100的基础中的一个。适合的可升级视频编码机制可提供例如在包括因特网在内的IP网络、无线网络等等上有效的可升级且健壮的流视频系统。
示例性SVC机制宏块层次上应用多重循环预测和减飘技术,这使得该机制在性能上超出MPEG-4FGS最高达到3.0dB。通过嵌入的增强比特流和通用可升级性,该示例性机制提供网络带宽和设备适应。有了带宽估计方法,此类示例性机制可快速并稳定地捕捉带宽的变化。此外,示例性SVC机制提供一种分层次的比特流结构——较重要的基层和较不重要的增强层,其可通过用小开销就能实现的误差回弹和非平衡保护技术实现高度保护的基层比特流。示例性SVC机制实现了在因特网以更流畅的重放体验和更好的视觉品质向一个或多个用户呈现视频。
3.2示例性初步内容分析
示例性分析模块114可以是基于web的媒体共享和创作系统100的基层组件。分析模块114可分析诸如视频、图像和音乐内容之类的媒体220。如图2所示,分析模块114通过运用一个或多个过滤器或算法222在媒体220上做处理产生结果224。可扩展且开放的媒体内容分析模块可采用未来的内容算法。内容分析工具可提供用较少的精力获得较多引人注目的创作结果的能力。
媒体内容分析算法经常被认为是内容过滤器。图2中的示例性内容处理技术200展示了视频过滤块202、图像过滤块204和音乐或音频过滤块206。还展示了可供视频过滤块202、图像过滤块204、音乐或音频过滤块206使用的各种示例。
关于这种过滤器或算法,镜头探测过滤器可用作镜头探测的视频过滤器,柱状图提取过滤器可被用作图像过滤器并应用于生成彩色柱状图等。内容过滤器可以是在线过滤器或离线过滤器。在线过滤器要求对整个视频或音频流或图片文件做语法分析,从流中提取相应的基本元数据。而离线过滤器无需对原始媒体数据做语法分析,直接从这些基本元数据中提取较高层级的元数据。在线过滤器的示例包括镜头探测、时间标志、和柱状图提取过滤器。离线过滤器包括场景探测、质量评估过滤器。
如以上已述,分析模块114可在媒体220上应用一个或多个过滤器/算法222来产生结果224(例如信息),该结果可能是元数据。分析模块114可产生特定格式的结果224。例如,一种示例性分析模块组件可任选地使用诸如可扩展标记标记语言(例如:XML等等)之类的标记语言存储所有已提取或已生成的元数据。在此示例中,如果提取或产生新的元数据需要,那么可用示例性组件撰写新的过滤器,例如基于过滤器模板(例如:基本C++类,等等),然后将其作为插件插入分析模块114。示例性分析模块可使高级用户继承预定的在线或离线基类,然后实现真实元数据提取功能。
关于视频过滤器202,镜头探测过滤器可包括若干个特征提取过滤器,诸如关键帧选择过滤器、量化彩色柱状图过滤器、基于序数量度的签名过滤器、相关图(correlegram)过滤器、脸部探测过滤器、注意力探测过滤器、照相机/对象移动过滤器、意图探测器、语义分类/注解过滤器、以及可能由内容创作者或浏览者添加的文本/关键字描述。
关于“意图”过滤器,用户也许常常不得不尝试与搜索目标有关的多个搜索关键字、和/或多重搜索迭代,以获得合理的相关结果,尤其当搜索诸如图像之类的多媒体内容时。一种示例性方案可运用从用户对搜索结果的反应和/或从可从计算机挖掘出的关于用户的其它数据收集信息(formation)的意图挖掘模块细化搜索。例如,意图挖掘模块可以通过执行指令检查用户如何与搜索术语互动细化搜索(refine search)。在此示例中,可呈现结果并且基于用户与结果的互动完成第二次修订的搜索。一般而言,基于意图的搜索目标在于基于挖掘用户的兴趣和行为完成并细化搜索。
另一方法使用一种可以把家庭视频分割成时间场景、镜头和分镜头的模型。通过从分镜头衍生出视觉特征,该模型可自动地对摄影者的意图进行分类。这样,以此方式,家庭视频可以按摄影者是否正在试图拍摄美丽的景色、特写、动作等等来编制索引。
关于图像过滤器204(例如:照片过滤器,等等),常常可以使用各种视频过滤器,但视频专用过滤器除外,像镜头探测、关键帧提取和运动探测过滤器。关于音乐或视频过滤器,开始/节拍、速度(tempo)探测和重复模式探测过滤器等可得到支持。
如在此所述,内容过滤器(例如,以及数据,包括通过这些过滤器提取的元数据在内)可由各种基于内容的自动编辑方法使用。此外,此类数据还可方便用户有能力在创作时寻找到合适的原始媒体片断(参见第4部分)。
3.3示例性元数据和媒体数据共享
示例性系统组件允许在桌面客户上提取的元数据被上传到服务器(例如:社区服务器)并共享给其它用户(例如:社区中的用户)。如此的安排允许至少部分地基于此类元数据进行web上搜索。此类元数据可任选地通过P2P网络链接至个人计算机上的原始媒体数据、以及可能共享在社区服务器上的质量约束版本的媒体数据。
在一种示例性系统中,用户不但可以控制与哪个用户或用户组共享的哪一部分的视频或图片集,而且可以控制特定用户或用户组从服务器或P2P网络中获取的质量(压缩率、清晰度和帧速度)。
图3展示了一个包括使用图1中的基于web的媒体共享和创作系统100的各种组件的示例性元数据和媒体共享方法。如业已描述的,分析模块114(例如:与桌面客户相关联的)可使用一个或多个过滤器220(如:过滤器/算法)从媒体210(例如:一个或多个媒体文件)中提取或生成结果230(如:元数据)。此类结果230可任选地格式化成标记语言(例如:XML等等)。
所产生的结果230可提供至库层120以便存储在一个或多个个人媒体库122、元数据库124中或者以便关联至这种层。共享控件123包括各种模块,比如——但不限于——用于设定用户和/或组许可(例如:存取、使用、使用的类型、修改等等)的用户/组125和控制质量参数——任宣地部分地基于带宽、用户能力、客户器能力、许可等——的质量模块127。在此示例中,共享控件123作为库层120和库web层130以及任选地一个或多个其它层、用户或组129之间的接口。以下讨论与诸如社区服务器之类的服务器相关联的服务特征。
第4部分:服务器(例如:社区服务器)上的服务
如业已描述的,示例性系统可联合一个或多个服务器运行。这样的服务器可以是服务一个或多个社区(例如:数据共享社区等等)的社区服务器。设置在社区Web服务器上的功能性可包括元数据(和部分的原始媒体数据)存储、索引及搜索、以及提供一个用户界面(UI)让社区用户实现web(例如:Web、因特网)上的创作和共享。
4.1:搜索、浏览和等级
在服务器一侧(例如:媒体共享社区侧),元数据可以储存在结构良好的数据库中,这样即可通过例如能够实现下列技术中的一项或多项的浏览模块(例如图1中的浏览和搜索模块142)进行快速搜索和浏览:
按关键字(例如:内容所有者的输入和/或社区中其他浏览者的评论);
按语义类(例如:室内、室外、都市风景、山水风光、海滩、大海、高山、和人物);
按意图类别(例如:美丽的景色、动态事件、静态摄影、以及特写视图);
按照相机/摄影机运动类型和对象运动质量(例如:“放大”、“高速运动”、“慢速运动”);
按主色(例如:蓝色、绿色和红色);
按感觉质量量度(例如:视频质量、运动质量、压缩率、帧速度和清晰度);
按等级(例如:由社区中浏览该数据的用户构建的);以及
当进行搜索和浏览时,也可按聚焦的或选中的媒体数据的相似或有关的媒体数据(视频剪辑/照片)提供。当进行浏览时,通常向用户提供界面以便评级和评论。
4.2:Web创作UI
一种示例性Web创作UI设计成了向导形式,其可允许用户执行方便地依计而行的不同步骤。图1的基于web的媒体共享和创作系统100包括创作模块144,该模块可提供这样的UI和相关的特征,比如模板等。
在一种示例性方法中,第一步包括选择一个创作模板。候选模板可由普通用户或商业组织设计。服务器可提供一组预定的模板,而用户也可设计、修改或上传自己的模板。这些模板显著地简化了在web上创作媒体的过程。
关于创作模板,基于模板的多媒体创作可提供媒体内容分析的分析并可有选择地应用内容明了型两层创作模板(content-aware two-layerauthoring template)(例如:内容描述模板和内容呈现模板)以提取媒体内容。这样的两层创作模板方法可允许视频创作操作和视频呈现相分离。例如,一旦诸如视频的多媒体内容被创作(即生成),所创作的内容就可以以一种或多种其它的形式(例如:根据用户的偏好)简单而灵活地呈现。开放和可展开的多媒体创作和共享构架可支撑诸如核心组件如内容分析算法、编辑方法、以及两层创作模板的动态更新之类的特征。此类方面可显著地减轻用户在视频编辑方面所花的精力,而同时又保留了灵活性和个性化。
在此示例性方法中,第二步包括找到适合的内容来插入所选模板的时隙(slot)。用户可使用在自己本地机器上的媒体数据,也可使用在web服务器上的“搜索和浏览”功能找到在服务器上的共享媒体数据,然后把它们拖入UI的特定时隙。对于共享的媒体数据,用户可能只看到有元数据的缩略图,以及可能的低质量版本,由此查看选项的实现不至于影响创作过程和结果。
这个示例性方法的第三步包括播放或预览媒体(参见例如图1的播放/预览模块146)。就在这个步骤之前,,编辑引擎(例如嵌入在web服务器上的)可被用来根据用户提供的数据和相应的用户所选模板自动地合成用户的编辑结果。在合成了时间线(timeline)(这一般是一个非常快的过程(例如,不足5秒))之后,时间线播放器(例如:播放/预览模块146)播放创作的内容(例如:内容合成文件)。在这个程序中,服务器可从服务器、或是P2P网络(例如,在任一实例中皆使用可升级的视频流)上过个别人用户的电脑请求低质量的媒体数据。
因此,用户可能希望把创作的内容导出或保存到本地的机器或磁盘等中。这样,描绘引擎(rendering engine)可请求媒体数据更高质量的版本并为用户合成更高质量的最终结果。用户也可跳过真实视频的生成并决定只保存描述文件而在晚些时候创作真实的内容。所导出的视频或描述文件也可在一个或多个社区之内或之外的服务器上共享。此外,描述文件可以以多种其它形式输出,例如网站、博客、流视频文件、DVD光碟等等。
第5部分:演示示例
以下是示例性的基于web的媒体创作架构。当然,其它的安排和演示例也可使用在此所述的各种示例组件。
图4展示了一个桌面客户400的示例性主界面(UI),此界面适合于诸如原始媒体内容导入、内容分析元数据、媒体数据上传、和共享允许控制之类的任务。虽然典型的媒体管理系统可能具这些特征中的某一些,但这样的典型媒体管理系统一般不包括桌面客户400的示例性主界面所展示的上传和共享控制功能。
桌面客户400的示例性主界面UI包括不同的任务/工具条402、404、406。文件组织特征408提供文件(例如媒体、对象等等)的导航。一旦选中了文件或数据,显示区域414就显示媒体内容。与显示区域414中的内容相关联的属性在属性显示区域416中显示,并任选地在诸如大小/清晰度/质量区域418和计时器区域420之类的其它区域。运行状况可显示在诸如区域412的合适区域。
为了演示这个特定的子系统或组件,从一台典型的数码摄像机导入一个小时的家庭视频剪辑(参见例如工具条404“导入”)。示例性系统可以在进行导入时进行在线内容分析,并在此之后应用离线过滤器(参见例如图2的分析模块114)。当然,将导入和过滤组合也是可行的,并且如果需要或合适的话,可根据环境来实现。在此示例中,元数据储存在本地库(参见例如图1的库层120),该库是本地机器(例如桌面客户)上浏览和搜索功能的基础。此外,文本描述和/或其它注释可以添加到媒体内容中。
用户随后可以作出使用示例性共享控件(参见例如图1的共享控件123)共享的决定。例如,用户可能决定在社区服务器上以低清晰度和低帧速度(例如:帧大小80*60,15fps)用整个视频的元数据共享3个剪辑(每个约为3分钟)。然后,用户可点击按钮“Uploading(上传)”(参见例如工具条404),元数据和共享剪辑由此可上传到社区服务器(参见例如图1的库web层130)。
图5展示了示例性浏览和搜索用户界面500,该界面可由web服务器提供(参见例如图1的库web层130)。在此示例中,浏览和搜索用户界面500包括:用户识别符域502、星期域504、组织层次/目录域506、搜索结果显示区域508(例如显示低质量内容如缩略图图像)、关键字搜索域510、意图搜索域511、各种附加搜索域512(例如语义、质量、主色、相机运动等等)、一个或多个高级搜索特征514、514’。
浏览和搜索用户界面500可独立运行,也可在创作过程(例如作为创作模块的一部分)中运行。考虑这样的情况:通过键入在上传前指定给剪辑的关键字,例如“Daughter Birthday(女儿生日)”(参见例如关键字搜索域510)搜索前述共享剪辑中的一个。作为相应,浏览和搜索用户界面500可连同各种剪辑信息(参见例如搜索结果显示区域508)显示剪辑的缩略图。
这样的示例性搜索工具可以运用模糊词来搜索想要的内容,例如,用户可选择“户外/美丽的风景/主色:蓝色(outdoor/beautiful scenery/dominantcolor:blue)”(参见例如域511/512)。选择了特定文件(例如,缩略图)后,浏览和搜索用户界面500可任选地显示附加详情或者可选择详情链接来提供附加的详情(参见例如搜索结果显示区域508的“Detail(详情)>>”)。
为了演示如何运用示例性系统在web上创作视频,考虑图6的情况,其中显示了示例性描绘创作模板600。示例性描绘创作模板600包括层次/目录域602、临近音频606设置的连同时间区别的时隙域604。还可包括浏览和搜索用户界面500的一个或多个特征(例如:搜索域、内容显示域,等等)。
根据一种示例性方法,会核查是否有一个或多个合适的模板存在于库中。其次,在此示例中,模板“CDT”被选择,称为“圣诞狂欢晚会(WildChristmas Party)”(参见层次/目录域602)。然后可以在UI上描绘,可以是网页。
接下来,用户可右击(或启动其它动作)代表尾章节(tail chapter)的格子并右击弹出的视窗,然后把尾章节的持续时间从1分钟改成2分钟,并把编辑风格从“默认值(Default)”改成“慢动作(Slow Motion)”。修改后的模版可以保存(或领存)在模板库中。
一个或多个用户可从库查看区中浏览/搜索和拖曳相关源视频剪辑和图片集到一个或多个时隙中。例如,来自其它社区用户的全球圣诞晚会照片被放入先导时隙,有关圣诞夜准备工作的剪辑被拖入第一章。一个或多个用户也可把某些音乐片断从音乐库拖到时间线的音乐音轨上,例如,替换默认的由原始模板指定的音乐。
导出或保存步骤可被用来导出或保存编辑的结果。例如,考虑把上述的描述文件导出成MPEG2格式的实际视频文件。用户可选择其它的格式,例如网页类型的,然后以网页的形式输出结果。一般而言,这样的过程不创作视频,而是在网页上的特定缩略图被点击时,模板播放器将在描述文件中定位相应的位置,即刻合成时间线,然后播放虚拟视频。
第6部分:各种示例性技术
如在此描述的,示例性系统激活在web上编辑和共享个人媒体。在不同示例中,示例性系统包括以下的示例性组件:可升级的视频编码,媒体内容分析和基于模板的媒体创作。这样的用于在web上创作媒体的示例性媒体创作组件向用户提供了新奇的个人媒体共享和创作经历。
虽然展示了各种用户界面,但其它用户界面也是可能的。此外,示例性系统可嵌入更多智能媒体内容分析技术并提供更多引人入胜的创作模板,这些模板可进一步提高处理媒体数据的效率。
各种模块可集成进其它web应用软件特征,比如在市售web应用中可以找到的那些。关于市售web应用,此类应用包括:因特网服务的MSN网络(微软公司,地址:华盛顿州雷蒙德市),GOOGLE搜索引擎应用(谷歌有限公司,地址:加利福尼亚州芒廷维尤),YAHOO搜索引擎(雅虎有限公司,地址:加利福尼亚州桑尼维尔)。在此揭示的示例性技术可与此类应用联合实现以扩展或取代特征和/或服务。例如,在www.msn.com上显示的主页提供了多个特征的接入(例如:搜索、web社区、电子邮件等等)。种类或子类可被添加到此主页上,这样就可使得(例如启动等等)示例性创作模板、示例性浏览或搜索模块等等可用。种类或子类可使以标记语言(例如XML等等)提供结果(例如媒体有关的元数据)的搜索模块可用。
各种示例性模板可任选地通过使用因特网链接的工具条(例如诸如关联于因特网服务的MSN网络的工具条之类的web应用软件工具条)访问。
一般而言,各种示例性方法可通过硬件的运用来实现。例如,软件形式的处理器可执行指令可储存在一个或多个计算器可读媒体上并使用处理器来执行。示例性方法可只依赖于硬件或依赖于硬件和软件和/或固件的组合。各种示例性组件依靠算法实现控制逻辑(例如,单独运行的逻辑功能、和结合诸如数据或用户输入等的输入信息)。示例性计算设备(参见下文)可任选地包括用于执行示例性方法或其一部分的控制逻辑。
第7部分:示例性计算环境
图7图解说明了一种计算设备800,该设备可用来实现各种示例性组件并可用来组成一个示例性系统。例如,图1中的系统的服务器和客户可包括计算设备800的各种特征。
在非常基本的配置中,计算设备800通常包括至少一个处理单元802和系统存储器804。根据计算设备的具体配置和类型,系统存储器804可以是易失性的(比如RAM)、非易失性的(比如ROM、闪存等等)、或这两者的某种结合。系统存储器804通常包括操作系统805、一个或多个程序模块806,并且可包括程序数据807。操作系统806包括基于组件的架构820,该构架支持组件(包括属性和事件)、对象、继承、多态性、反射,并且提供面向对象的基于组件的应用程序设计接口(API),比如由位于华盛顿州雷蒙德市的微软公司生产的.NET架构。操作系统805还包括示例性主机架构900,比如——但不限于——示例性媒体架构。这个基本的配置由虚线808划出界限。另一方面,终端可以具有较少的组件,但是会与拥有此类基本配置的计算设备交互。
计算设备800可具有附加的特征或功能。例如,计算设备800也可包括附加的数据存储设备(可移动的和/或不可移动的),例如磁盘、光碟或磁带。此类附加存储器在图7中通过可移动的存储器809和不可移动的存储器810图示。计算机存储介质可以任何用于存储诸如计算机可读指令、数据结构、程序模块、或其它数据之类的信息的方法或技术实现的包括易失的和非易失的、可移动的和不可移动的介质。系统存储器804、可移动的存储器809和不可移动存储器810都是计算存储介质的示例。计算存储介质包括但不仅限于RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字通用盘(DVD)或其它光存储、卡式磁带、磁带、磁盘存储器或其它磁存储设备、或任何其它用于存储所需信息以及可通过计算设备800访问的介质。任何此类计算机存储介质可以是计算设备800的一部分。计算设备800还可拥有输入设备812,例如键盘、鼠标、笔、语音输入设备、触模输入设备等等。还可包括例如显示器、扬声器、打印机等等的输出设备814。这些设备广为人知,在此就不详细说明了。
计算设备800还可包括通讯连接816,其允许本设备与其它计算设备818通信,比如在网络(例如考虑上述的可包括一个或多个社区的web或因特网网络)上。通讯连接816是通讯介质的一个示例。通讯介质通常包含计算机可读指令、数据结构、程序模块、或其它处于诸如载波或其它输送机制之类的经调制数据信号形式的数据,并包括任意信息传输介质。术语“经调制的数据信号”是指其特性中的一个或多个以在信号中编码信息方式被设定或改变了的信号。作为示例而非限制,通讯介质包括诸如有线网络或专线连接之类的有线介质以及诸如声波、射频、红外线之类的无线介质和其它无线介质。在此使用的术语计算机可读介质既包括存储介质也包括和通讯介质。
虽然以结构特征和/或方法动作特异性的语言描述了本发明主题,但是可以理解。在所附的要求书中限定的主题不必局限于上述的具体特征或动作。相反地,上述的具体特征或动作是作为实现权利要求的方案的示例形式公开的。