视频的字幕处理方法和导播系统转让专利

申请号 : CN201880068929.4

文献号 : CN111279687A

文献日 : 2020-06-12

一种视频的字幕处理方法和导播系统，所述方法包括：获取字幕数据；在预设应用的显示区域的第一预设字幕模板上渲染所述字幕数据生成填充信号画面，所述显示区域还包括第二预设字幕模板，所述第二预设字幕模板为所述填充信号画面对应的键信号画面；将所述填充信号画面传输至导播台，并将所述键信号画面传输至所述导播台，以使得所述导播台根据所述填充信号画面和所述键信号画面对待显示的视频流进行合成并得到新的视频流。通在计算机上采用预设应用实现填充信号画面和键信号画面，即可实现字幕数据的在线加载，无需购买专用字幕机，降低了硬件成本，且借助于预设应用的灵活性，字幕处理的自动化程度高、实时性强、自由度高、适用范围广泛。

1.一种视频的字幕处理方法，其特征在于，所述方法包括：

获取字幕数据；

在预设应用的显示区域的第一预设字幕模板上渲染所述字幕数据生成填充信号画面，所述显示区域还包括第二预设字幕模板，所述第二预设字幕模板为所述填充信号画面对应的键信号画面；

将所述填充信号画面传输至导播台，并将所述键信号画面传输至所述导播台，以使得所述导播台根据所述填充信号画面和所述键信号画面对待显示的视频流进行合成并得到新的视频流。

2.根据权利要求1所述的方法，其特征在于，所述填充信号画面中各个像素点在所述新的视频流中的透明效果为根据所述键信号画面中对应位置的像素点的亮度确定。

3.根据权利要求1所述的方法，其特征在于，所述第一预设字幕模板和/或所述第二预设模板为根据所述字幕数据、本地数据、计算机的输入数据中的一种或多种实时动态调整。

4.根据权利要求3所述的方法，其特征在于，所述第一预设字幕模板包括字幕显示位置和/或字幕显示内容。

5.根据权利要求3所述的方法，其特征在于，所述第一预设字幕模板和所述第二预设模板的实时动态调整过程，包括：确定预设的与所述字幕数据对应的字幕效果；

根据所述字幕效果，调整所述第一预设字幕模板和/或所述第二预设字幕模板中内容的显示信息，以使得在所述新的视频流中产生所述字幕效果。

6.根据权利要求5所述的方法，其特征在于，所述字幕效果包括动画效果、显示效果、隐藏效果中的一种或多种。

7.根据权利要求1所述的方法，其特征在于，所述填充信号画面的分辨率和所述键信号画面的分辨率相等。

8.根据权利要求7所述的方法，其特征在于，所述显示区域的分辨率的宽度是所述填充信号画面或所述键信号画面的分辨率的宽度的两倍。

9.根据权利要求7所述的方法，其特征在于，所述显示区域的分辨率的高度是所述填充信号画面或所述键信号画面的分辨率的高度的两倍。

10.根据权利要求1所述的方法，其特征在于，所述预设应用的显示区域上无菜单栏和/或无虚拟按钮。

11.根据权利要求1所述的方法，其特征在于，所述将所述填充信号画面传输至导播台，并将所述键信号画面传输至所述导播台，包括：基于计算机的视频输出设备，将所述填充信号画面传输至导播台，并将所述键信号画面传输至所述导播台。

12.根据权利要求11所述的方法，其特征在于，所述视频输出设备包括显卡或非编卡。

13.根据权利要求1所述的方法，其特征在于，所述字幕数据包括本地数据、所述计算机的输入数据、外部设备发送的数据中的一种或多种。

14.根据权利要求13所述的方法，其特征在于，所述外部设备发送的数据包括所述外部设备根据实时的采集数据分析确定的数据。

15.根据权利要求1所述的方法，其特征在于，所述获取字幕数据之后，还包括：调用与所述字幕数据相对应的预设指令；

广播所述预设指令。

16.根据权利要求15所述的方法，其特征在于，所述调用与所述字幕数据相对应的预设指令，包括：接收与所述字幕数据相对应的预设事件信号；

调用与所述预设事件信号相对应的预设指令。

17.根据权利要求16所述的方法，其特征在于，所述预设事件信号的生成情况包括基于计算机的输入数据生成、基于本地控制数据生成、基于外部设备发送的控制数据生成中的一种或多种。

18.根据权利要求17所述的方法，其特征在于，所述待显示的视频流为竞技比赛过程中的视频流，所述控制数据包括竞技数据。

19.根据权利要求15所述的方法，其特征在于，所述预设指令包括音频播放指令、网络接口调用指令、导播台指令中的一种或多种。

20.根据权利要求1所述的方法，其特征在于，所述预设应用包括万维网Web应用。

21.一种导播系统，其特征在于，所述导播系统包括计算机和导播台，所述计算机和所述导播台通信连接；其中，所述计算机用于获取字幕数据，并在预设应用的显示区域的第一预设字幕模板上渲染所述字幕数据生成填充信号画面，所述显示区域还包括第二预设字幕模板，所述第二预设字幕模板为所述填充信号画面对应的键信号画面；

所述计算机还用于将所述填充信号画面传输至导播台，并将所述键信号画面传输至所述导播台；所述导播台根据所述填充信号画面和所述键信号画面对待显示的视频流进行合成并得到新的视频流。

22.根据权利要求21所述的导播系统，其特征在于，所述填充信号画面中各个像素点在所述新的视频流中的透明效果为根据所述键信号画面中对应位置的像素点的亮度确定。

23.根据权利要求21所述的导播系统，其特征在于，所述第一预设字幕模板和/或所述第二预设模板为根据所述字幕数据、本地数据、计算机的输入数据中的一种或多种实时动态调整。

24.根据权利要求23所述的导播系统，其特征在于，所述第一预设字幕模板包括字幕显示位置和/或字幕显示内容。

25.根据权利要求23所述的导播系统，其特征在于，所述计算机对第一预设字幕模板和所述第二预设模板的实时动态调整过程，包括：确定预设的与所述字幕数据对应的字幕效果；

根据所述字幕效果，调整所述第一预设字幕模板和/或所述第二预设字幕模板中内容的显示信息，以使得在所述新的视频流中产生所述字幕效果。

26.根据权利要求25所述的导播系统，其特征在于，所述字幕效果包括动画效果、显示效果、隐藏效果中的一种或多种。

27.根据权利要求21所述的导播系统，其特征在于，所述填充信号画面的分辨率和所述键信号画面的分辨率相等。

28.根据权利要求27所述的导播系统，其特征在于，所述显示区域的分辨率的宽度是所述填充信号画面或所述键信号画面的分辨率的宽度的两倍。

29.根据权利要求27所述的导播系统，其特征在于，所述显示区域的分辨率的高度是所述填充信号画面或所述键信号画面的分辨率的高度的两倍。

30.根据权利要求21所述的导播系统，其特征在于，所述预设应用的显示区域上无菜单栏和/或无虚拟按钮。

31.根据权利要求21所述的导播系统，其特征在于，所述计算机包括视频输出设备，所述视频设备与所述导播台通信；

所述视频输出设备将所述填充信号画面传输至导播台，并将所述键信号画面传输至所述导播台。

32.根据权利要求31所述的导播系统，其特征在于，所述视频输出设备包括显卡或非编卡。

33.根据权利要求21所述的导播系统，其特征在于，所述字幕数据包括本地数据、所述计算机的输入数据、外部设备发送的数据中的一种或多种。

34.根据权利要求33所述的导播系统，其特征在于，所述外部设备发送的数据包括所述外部设备根据实时的采集数据分析确定的数据。

35.根据权利要求21所述的导播系统，其特征在于，所述计算机在获取字幕数据之后，还用于调用与所述字幕数据相对应的预设指令，并广播所述预设指令。

36.根据权利要求35所述的导播系统，其特征在于，所述计算机具体用于：接收与所述字幕数据相对应的预设事件信号，并调用与所述预设事件信号相对应的预设指令。

37.根据权利要求36所述的导播系统，其特征在于，所述预设事件信号的生成情况包括基于计算机的输入数据生成、基于本地控制数据生成、基于外部设备发送的控制数据生成中的一种或多种。

38.根据权利要求37所述的导播系统，其特征在于，所述待显示的视频流为竞技比赛过程中的视频流，所述控制数据包括竞技数据。

39.根据权利要求35所述的导播系统，其特征在于，所述预设指令包括音频播放指令、网络接口调用指令、导播台指令中的一种或多种。

40.根据权利要求21所述的导播系统，其特征在于，所述预设应用包括万维网Web应用。

视频的字幕处理方法和导播系统

技术领域

[0001] 本发明涉及视频字幕处理领域，尤其涉及一种视频的字幕处理方法和导播系统。

背景技术

[0002] 在电视广播领域，广泛采用的非线性视频编辑设备对字幕进行制作和编排，非线性视频编辑设备采用离线方式编排字幕内容，并在指定时刻进行播放，这种方式成本高、无
法满足实时性要求。面对实时性高的直播现场，当字幕内容只能临时提供时，通常工作人员
采用字幕机系统进行现场字幕制作，再根据导播指令进行播放，然而，现场人工制作、播放
易出错，难以满足数据项更新频繁、数据项多的场景。相关技术中，还存在一些网络直播软
件，如OBS，直接将字幕和视频在不同层次窗口叠加，然后再对叠加结果进行捕捉，但这种字幕与视频的叠加效果比较简陋，输出质量无法满足广播级要求。此外，在一些字幕处理方案
中，采用弹幕技术从服务器端获取新弹幕内容，将新弹幕内容显示在视屏上方，弹幕在播放
端视频上方呈现，这种字幕处理方式并非在视频源端进行去背合成，无法满足广播级需求。

发明内容

[0003] 本发明提供一种视频的字幕处理方法和导播系统。

[0004] 具体地，本发明是通过如下技术方案实现的：

[0005] 根据本发明的第一方面，提供一种视频的字幕处理方法，所述方法包括：

[0006] 获取字幕数据；

[0007] 在预设应用的显示区域的第一预设字幕模板上渲染所述字幕数据生成填充信号画面，所述显示区域还包括第二预设字幕模板，所述第二预设字幕模板为所述填充信号画
面对应的键信号画面；

[0008] 将所述填充信号画面传输至导播台，并将所述键信号画面传输至所述导播台，以使得所述导播台根据所述填充信号画面和所述键信号画面对待显示的视频流进行合成并
得到新的视频流。

[0009] 根据本发明的第二方面，提供一种导播系统，所述导播系统包括计算机和导播台，所述计算机和所述导播台通信连接；其中，所述计算机用于获取字幕数据，并在预设应用的
显示区域的第一预设字幕模板上渲染所述字幕数据生成填充信号画面，所述显示区域还包
括第二预设字幕模板，所述第二预设字幕模板为所述填充信号画面对应的键信号画面；

[0010] 所述计算机还用于将所述填充信号画面传输至导播台，并将所述键信号画面传输至所述导播台；所述导播台根据所述填充信号画面和所述键信号画面对待显示的视频流进
行合成并得到新的视频流。

[0011] 由以上本发明实施例提供的技术方案可见，通在计算机上采用预设应用实现填充信号画面和键信号画面，即可实现字幕数据的在线加载，无需购买专用字幕机，降低了硬件
成本，且借助于预设应用的灵活性，字幕处理的自动化程度高、实时性强、自由度高、适用范围广泛；同时，采用预设应用的同一显示区域中设计第一预设字幕模板和第二预设字幕模
板，可以将填充信号画面和键信号画面同时进行渲染，确保两个画面的同步渲染要求；另
外，在计算机渲染获得填充信号画面和键信号画面后，再由导播台采用去背合成技术将填
充信号画面和键信号画面合成到待显示的视频流中，满足现实场景的数据显示需求，使获
得的视频字幕满足广播级要求。

附图说明

[0012] 为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于
本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其
他的附图。

[0013] 图1是本发明一实施例中的导播系统的结构框图；

[0014] 图2是本发明一实施例中的视频的字幕处理方法的方法流程图；

[0015] 图3是本发明一实施例中的导播系统的一具体结构框图；

[0016] 图4是本发明一实施例中的填充信号画面和键信号画面的显示图；

[0017] 图5是本发明一实施例中的填充信号画面和键信号画面的另一显示图；

[0018] 图6是本发明一实施例中的视频的字幕处理方法的一种具体方法流程图；

[0019] 图7是本发明一实施例中的由填充信号画面和键信号画面合成至待显示的视频流所获得的新的视频流画面图；

[0020] 图8是本发明一实施例中的视频的字幕处理方法的另一种具体方法流程图。

具体实施方式

[0021] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于
本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他
实施例，都属于本发明保护的范围。

[0022] 下面结合附图，对本发明的视频的字幕处理方法和导播系统进行详细说明。在不冲突的情况下，下述的实施例及实施方式中的特征可以相互组合。

[0023] 相关技术中，导播系统包括字幕机和导播台。其中，字幕机和导播台基于视频信号传输接口建立通信连接，字幕机通常采用专用字幕软件和字幕硬件卡配合生产填充信号画
面和键信号画面，并通过视频信号传输接口填充信号画面和键信号画面发送至导播台，由
导播台基于去背合成技术将填充信号和键信号合成到待显示的视频流中。

[0024] 采用字幕硬件卡导致导播系统硬件花费投入较高，而不同厂商的字幕软件和字幕硬件卡并没有形成统一的标准并且闭源，若重新开发一个兼容不同字幕文件的字幕软件和
字幕硬件卡，开发成本会比较高。另外，字幕机的字幕文件通常是离线制作，且大部分字幕
机无法接受网络数据并实时修改字幕内容，存在实时性差的缺点。

[0025] 基于此，本发明实施例的导播系统采用计算机替代字幕机，通过计算机获取字幕数据，并基于计算机上的预设应用对字幕数据进行渲染生成填充信号画面和键信号画面，
实现字幕数据的在线加载，硬件成本低、自动化程度高、实时性强、自由度高、适用范围广
泛。

[0026] 图1是本发明一实施例中的导播系统的结构图。如图1所示，本发明实施例的导播系统可包括计算机和导播台，其中，计算机与导播台通信连接。可选的，计算机的视频输出
设备与导播台相连。

[0027] 图2是本发明一实施例中的视频的字幕处理方法的方法流程图。需要说明的是，本实施例的视频的字幕处理方法的执行主体为计算机(即导播系统的计算机)。如图2所示，本
发明实施例的视频的字幕处理方法可包括如下步骤：

[0028] 步骤S201：获取字幕数据；

[0029] 该步骤中，计算机获取的字幕数据可包括离线数据，也可包括在线数据。其中，字幕数据可以包括文字、图片和/或视频等。

[0030] 在一些实施例中，如图3所示，字幕数据可包括本地数据、计算机的输入数据、外部设备发送的数据中的一种或多种。可以理解的是，字幕数据的类型并不限于上述实施例所
列举的数据类型，还可包括其他数据类型。

[0031] 其中，本地数据为存储在计算机的磁盘中的数据，本地数据通常为离线数据。

[0032] 计算机的输入数据可为接触式的输入数据，如用户通过键盘、鼠标等输入的数据，也可为计算机读取的插接在该计算机上的U盘、移动硬盘等存储的数据；计算机的输入数据
还可为非接触式的输入数据，如计算机自带的识别模块基于感应方式(如人脸识别、声音识
别等)获取的数据、计算机通过APP获取的数据等。

[0033] 外部设备与计算机通信连接(有线、无线或其他通信方式)，外部设备发送的数据可为该外部设备实时的采集数据，也可为该外部设备根据实时的采集数据分析确定的数
据。以视频的字幕处理方法以应用在竞技比赛为例来阐述步骤S201中的字幕数据，本实施
例中，字幕数据可包括竞技比赛过程中的竞技数据和/或基于竞技数据分析确定的数据。当
然，字幕数据还可包括非竞技数据。

[0034] 其中，竞技比赛可为现实场景中的比赛，如具有真实的竞技对象、真实的竞技选手(可控制竞技对象)的比赛，或者无竞技对象，但包括真实的竞技选手的比赛(如拳击)。竞技
比赛还可为虚拟竞技比赛(如MOBA)，竞技对象为虚拟的竞技对象，竞技选手为真实的竞技
选手。

[0035] 无论是显示场景中的比赛，还是虚拟竞技比赛，竞技比赛通常包括裁判系统和/或赛事系统。

[0036] 在现实场景中的竞技比赛中，裁判系统用于确定真实的竞技选手操作真实的竞技对象进行比赛的过程中的竞技结果，或者用于确定真实竞技选手之间直接进行比赛的过程
中的竞技结果。在虚拟竞技比赛中，裁判系统用于确定真实的竞技选手操作虚拟的竞技对
象进行比赛过程中的竞技结果。

[0037] 无论是现实场景的竞技比赛，还是虚拟竞技比赛，赛事系统通常用于确定该竞技比赛过程中的竞技规则。

[0038] 在一实施例中，在导播系统的计算机中可以集成该裁判系统和赛事系统的功能，字幕数据均由该导播系统的计算机进行处理。

[0039] 在另一实施例中，裁判系统和/或赛事系统可以为独立于导播系统的计算机设置的服务器，裁判系统和/或赛事系统在获得竞技数据后，将竞技数据发送至导播系统的计算
机，从而作为字幕数据。可选的，竞技数据为裁判系统将该裁判系统实时的采集数据和/或
基于该裁判系统实时的采集数据进行分析获得的数据，如对抗对象的状态数据、用于控制
对抗对象的竞技选手的数据、竞技比赛过程中评论员的数据。可选的，竞技数据为赛事系统
确定的竞技规则。

[0040] 本实施例中，该竞技数据包括对抗对象的状态数据、用于控制对抗对象的竞技选手的数据、竞技比赛过程中评论员的数据、竞技规则数据中的一种或多种，竞技数据还可包
括其他数据，在此不一一列举。

[0041] 步骤S202：在预设应用的显示区域的第一预设字幕模板上渲染字幕数据生成填充信号画面(即RGB信号画面)，显示区域还包括第二预设字幕模板，第二预设字幕模板为填充
信号画面对应的键信号画面(即ALPHA信号画面)；

[0042] 其中，预设应用可包括万维网Web应用，如各类浏览器应用，预设应用还可以是诸如桌面word、PPT、照片编辑器等。

[0043] 作为一种可行的实现方式，预设应用为万维网Web应用，相对而言，Web应用易于开发，且能够支持文字、图片、视频等内容的展示，并可通过脚本语言实现用户交互式操作以
及动态效果。

[0044] 另一方面，Web应用实现字幕数据的在线获取更加容易，例如，在竞技比赛中，裁判系统和/或赛事系统可与计算机进行网络通信，裁判系统和/或赛事系统通过网络通讯协议
如超文本传输协议HTTP(HyperText Transfer Protocol)等直接发送数据至计算机的Web
应用中，实现字幕数据的在线加载，数据传输的实时性强。

[0045] 填充信号画面的分辨率和键信号画面的分辨率可相等，也可不相等。当填充信号画面的分辨率和键信号画面的分辨率不相等时，将填充信号画面和键信号画面合成至待显
示的视频流中后，获得的新的视频流会出现字幕冗余或字幕缺失等字幕效果。为避免字幕
冗余或字幕缺失，本实施例中，填充信号画面的分辨率和键信号画面的分辨率相等。

[0046] 可选的，显示区域的分辨率是填充信号画面的分辨率或键信号画面的分辨率的两倍。例如，在其中一些实施例中，如图4所示，显示区域的分辨率的宽度是填充信号画面或键信号画面的分辨率的宽度的两倍。在另一些实施例中，显示区域的分辨率的高度是填充信
号画面或键信号画面的分辨率的高度的两倍。

[0047] 作为一种可行的实现方式，填充信号画面的分辨率和键信号画面的分辨率在通过预设比例缩放后，可以与该计算机的显示屏幕的分辨率大小相等，如显示区域为Web网页。
可选的，显示区域预先设计，打开Web应用后，Web网页直接为显示屏幕的分辨率大小两倍。
可选的，显示区域为基于万维网Web应用将一分辨率大小与计算机的显示屏幕的分辨率大
小相等的Web网页进行拉伸获得，拉伸后的Web网页的分辨率大小为计算机的显示屏幕的分
辨率大小两倍。可选的，基于万维网Web应用将一分辨率大小与计算机的显示屏幕的分辨率
大小相等的Web网页的宽度拉伸成计算机的显示屏幕的宽度的两倍，获得拉伸后的Web网
页。可选的，基于万维网Web应用将一分辨率大小与计算机的显示屏幕的分辨率大小相等的
Web网页的高度拉伸成计算机的显示屏幕的高度的两倍，获得拉伸后的Web网页。

[0048] 可选的，预设应用的显示区域上无菜单栏和/或无虚拟按钮，以避免菜单栏和/或虚拟按钮对显示区域造成的遮挡。

[0049] 本实施例中，第一预设字幕模板可包括字幕显示位置和/或字幕显示内容等字幕显示信息。其中，字幕显示位置是指新的视频流中显示字幕的位置，参见图4，新的视频流的区域A和区域B进行字幕显示。字幕显示内容是指新的视频流中显示的字幕信息，如文字、图
案、颜色、形状等静态信息。

[0050] 第二预设模板用于指示填充画面中各个像素点在新的视频流中的透明效果。具体的，填充信号画面中各个像素点在新的视频流中的透明效果为根据键信号画面中对应位置
的像素点的亮度确定。

[0051] 本实施例中，第一预设字幕模板的区域和第二字幕预设模板的区域相对应。例如，图4中，第一预设字幕模板的区域A、区域B、区域C需要第二预设字幕模板的辅助而具有特殊
效果，则第一预设字幕模板的区域A与第二预设字幕模板的区域A’的位置和大小相同，第一
预设字幕模板的区域B与第二预设字幕模板的B’的位置和大小相同，第一预设字幕模板的
区域C和第二预设字幕模板的C’的位置和大小相同。相应的，新的视频流的区域和第一预设
字幕模板的区域也相对应，新的视频流的区域和第一预设字幕模板区域相对应的方式与第
一预设字幕模板的区域和第二预设字幕模板的区域相对应方式相类似，此处不再赘述。

[0052] 具体可根据需要设计键信号画面中各像素点的亮度，从而使得新的视频流的不同区域的字幕具有不同的透明效果。可选的，键信号画面中各像素点的亮度是根据第一预设
模板字幕模板的字幕显示位置(即字幕数据的显示位置)、和/或字幕显示内容、和/或预设
的与字幕数据对应的字幕效果等确定。如图4所示，第一预设字幕模板包括区域A、区域B和
区域C，最终需要在新的视频流中对应区域A的部分和新的视频流中对应区域B的部分进行
透明显示，新的视频流中对应区域C的部分非透明显示，且新的视频流中对应区域A的部分
的透明度高于新的视频流中对应区域B的部分的透明度，则可根据上述需求对键信号画面
中区域A’、区域B’和区域C’的各像素点的亮度进行设计。具体的，键信号画面中各像素点的亮度越大，填充信号画面在新的视频流中对应该像素点的位置的透明度越大。

[0053] 可选的，键信号画面中同一字幕数据的显示位置的各个像素点的亮度相同。作为一可行的实现方式，参见图4，第一预设字幕模板包括区域A、区域B和区域C三个字幕数据的
显示位置，将键信号画面的区域A’的各个像素点的亮度设置为第一亮度，键信号画面的区
域B’的各个像素点的亮度设置为第二亮度，键信号画面中区域C’的各个像素点的亮度设置
为第三亮度。最终，填充信号画面在新的视频流中对应区域A的部分各像素点的透明度相
同，填充信号画面在新的视频流中对应区域B的部分各像素点的透明度相同，填充信号画面
在新的视频流中对应区域C的部分各像素点的透明度也相同。

[0054] 在一些例子中，第一亮度、第二亮度和第三亮度各不相同，如第一亮度为0，第二亮度为50，第三亮度为255，则填充信号画面在新的视频流中对应区域A的部分的各个像素点
的透明度最大，为完全透明的；填充信号画面在新的视频流中对应区域C的部分的各个像素
点的透明度最小，为不透明；填充信号画面在新的视频流中对应区域B的部分的各个像素点
的透明度介于完全透明和不透明之间。

[0055] 在另一些例子中，第一亮度、第二亮度和第三亮度部分或完全相同。可选的，键信号画面中同一字幕数据的显示位置的各个像素点的亮度至少部分不相同，从而使得填充信
号画面在新的视频流的对应位置能够呈现不同的透明效果。作为一可行的实现方式，参见
图5，填充信号画面中的区域D对应键信号画面中的区域D’，需要填充信号画面在新的视频
流对应区域D的部分的透明度渐变的效果，如透明度从左至右(图5中箭头方向)逐渐减小，
则可将键信号画面中的区域D’的各个像素点的亮度大小设置成从左至右逐渐减小的趋势，
即可实现填充信号画面在新的视频流中对应区域D的部分的透明度呈逐渐增大的渐变效
果。

[0056] 通常情况下，可以将填充信号画面的部分像素点的位置设置成字幕数据的显示位置，并通过设置键信号画面中与字幕数据的显示位置对应的位置的各像素点的亮度大小，
使得新的视频流中与字幕数据的显示位置对应的区域画面被字幕数据所覆盖。

[0057] 而在一些实施例中，可将整个填充信号画面设置成字幕数据的显示位置，并通过设置键信号画面的整个区域的各像素点的亮度大小，将待显示的视频流画面全部覆盖，使
得新的视频流画面变成朦胧状态。

[0058] 本实施例中，第一预设字幕模板和/或第二预设模板可根据字幕数据、本地数据、计算机的输入数据中的一种或多种实动态调整，从而使得新的视频流中产生不同的字幕效
果。

[0059] 作为一种可行的实现方式，参见图6，第一预设字幕模板和第二预设模板的实时动态调整过程可包括如下步骤：

[0060] 步骤S601：确定预设的与字幕数据对应的字幕效果；

[0061] 如上述实施例所述，字幕显示内容为静态信息，然而，与字幕显示内容不同的是，该步骤中的字幕效果可包括静态信息，还可包括动态信息(如字幕形状的变化过程)。

[0062] 本实施例中，字幕效果可包括动画效果、显示效果、隐藏效果中的一种或多种。其中，动画效果可包括渐变、飞入、飞出、百叶窗、弹跳、放大、缩小等。

[0063] 显示效果可包括渐变、飞入、飞出、百叶窗、弹跳、新的视频流中指定位置的字幕数据的透明度沿着特定方向逐渐增大或透明度沿着特定方向逐渐减小、不同字幕数据显示的持续时间、字幕数据的位置变化、字幕数据的形状等。

[0064] 需要说明的是，显示效果可以包含动画效果和其他用于指示字幕变化的数据信息。例如，在一具体实现方式中，字幕数据1需要以飞入的方式合成在新的视频流的左上角，并在1s时间内以预设速度从左至右移动至新的视频流的右上角，并且，在0.5s时，将字幕数
据1的数据格式由“宋体”切换成“楷体”，本实现方式中，动画效果包括飞入，而显示效果则包括飞入、字幕数据1从新的视频流的左上角移动至新的视频流的右上角以及字幕数据1的
数据格式由“宋体”切换成“楷体”，可见，本实现方式中的显示效果相比动画效果的内容更加丰富。

[0065] 字幕数据的隐藏效果可包括马赛克覆盖、图片覆盖等隐藏效果。可选的，不同的字幕数据对应的字幕效果可根据需要选择，例如，字幕数据1对应飞入的动画效果，字幕数据2
对应百叶窗的动画效果。可选的，不同的字幕数据的显示位置对应的字幕效果可固定不变，
如图7所示的区域A的字幕效果为飞入，区域B的字幕效果为弹跳。可选的，不同的字幕数据
的显示位置对应的字幕效果随时间和/或字幕显示内容变化，例如，区域A在第一时刻的字
幕效果为飞入，第二时刻的字幕效果为飞出，第三时刻的字幕效果为百叶窗等等。

[0066] 步骤S602：根据字幕效果，调整第一预设字幕模板和/或第二预设字幕模板中内容的显示信息，以使得在新的视频流中产生字幕效果。

[0067] 该步骤中，调整的显示信息可以包括字幕数据的显示位置的变化、字幕数据的形状的变化和/或字幕数据进行显示的持续时间等等。

[0068] 在一具体实现方式中，需要进行竞技比赛倒计时的显示，如，在新的视频流的中心区域依次显示“5”、“4”、“3”、“2”、“1”和“0”，每个数字显示持续的时长为1s，每个数字在新的视频流的中心区域由预设大小(根据中心区域的大小确定该预设大小)逐渐缩小直至消
失，并且，每个数字在新的视频流中的透明度各不相同，则可在第一预设字幕模板的中心区
域依次加载数字“5”、“4”、“3”、“2”、“1”和“0”，并调整第一预设模板显示数字“5”、“4”、“3”、“2”、“1”和“0”的持续时长分别为1s，同时，调整第一预设模板的中心区域显示数字“5”、“4”、“3”、“2”、“1”和“0”的动画效果为“由预设大小逐渐缩小直至消失”。与此同时，调整第二预设模板的中心区域的各个像素的亮度大小为与各个数字进行显示时所需的透明度对
应的亮度大小。

[0069] 作为一种可行的实现方式，如图7所示，需要在新的视频流画面的区域E显示飞入的字幕数据，可将第一预设字幕模板中区域E显示字幕数据的动画效果设置成飞入，从而使
得新的视频流中区域E通过飞入方式显示字幕数据。

[0070] 作为另一种可行的实现方式，又如图7所示，需实在新的视频流画面的区域F显示沿着如图7所示箭头方向透明度逐渐增大的字幕数据，可将第二预设字幕模板中对应区域F
位置的各像素点的亮度大小设置成沿着如图7所示箭头方向逐渐增大，从而使得新的视频
流中区域F显示的字幕数据的透明度沿着如图7所示箭头方向逐渐增大。

[0071] 步骤S203：将填充信号画面传输至导播台，并将键信号画面传输至导播台，以使得导播台根据填充信号画面和键信号画面对待显示的视频流进行合成并得到新的视频流。

[0072] 本实施例的导播台包括拍摄装置，该拍摄装置用于获取待显示的视频流。例如，对于竞技比赛，拍摄装置用于拍摄竞技比赛视频。可选的，待显示的视频流包括对抗对象的对
抗视频流、竞技选手的视频流、评论员的视频流、竞技比赛过程中观众的视频流中的一种或
多种，还可包括其他视频流。

[0073] 本实施例中，计算机的视频输出设备与导播台相连接，例如，通过信号线连接计算机的视频输出设备和导播台。在执行步骤S203时，具体的，基于计算机的视频输出设备，将
填充信号画面传输至导播台，并将键信号画面传输至导播台。相对字幕机而言，利用了普通
计算系统的通用设备，开发成本低。

[0074] 其中，视频输出设备可包括显卡或非编卡。在一些实施例中，计算机将步骤S202中的填充信号画面和键信号画面通过该计算机的显卡投屏至导播台，实现填充信号画面和键
信号画面实时传输的目的。在另一些实施例中，计算机将步骤S202中的填充信号画面和键
信号画面通过该计算机的非编卡传输至导播台，实现填充信号画面和键信号画面实时传输
的目的。

[0075] 进一步的，在一些实施例中，参见图8，计算机在获取字幕数据之后，还包括如下步骤：

[0076] 步骤S801：调用与字幕数据相对应的预设指令；

[0077] 步骤S802：广播预设指令。

[0078] 需要说明的是，本发明实施例中，广播预设指令是指计算机将预设指令直接告知导播台、第三方网站等，导播台、第三方网站等在获得预设指令后，根据预设指令执行相应
的操作。

[0079] 在一些实施例中，预设指令可包括音频播放指令、网络接口调用指令、导播台指令中的一种或多种。当然，预设指令并不限于上述列举几种，还可包括其他，如灯光显示指令。
需要说明的是，网络接口调用指令主要针对第三方网站，网络接口调用指令可触发导播台
将新的视频流推流至云端，使得第三方网站可从云端获取该新的视频流并播放，或者，网络
接口调用指令指示第三方网站接入导播系统的计算机并直接接收计算机产生的广播消息，
确保第三方网站直播新的视频流过程中的实时赛事数据的发布。本实施例中，导播台获得
新的视频流后，可将新的视频流通过现场屏幕(如竞技比赛现场)显示，也可通过视频推流
服务器将新的视频流推流至云端，再由第三方网站对云端获取的新的视频流进行播放。

[0080] 以竞技比赛为例进行说明，在竞技对象(如机器人)掉血时，需在新的视频流中播放第一特定音效，计算机可调用与竞技对象掉血数据对应的第一音效播放指令并进行广
播，该广播消息可直接传输到现场的音频播放设备或第三方网站，现场的音频播放设备或
第三方网站在接收到该广播消息后，会直接播放与该第一特定音效。在竞技对象死掉时，需
在新的视频流中播放第二特定音效，计算机可调用与竞技对象死亡生命状态相对应的第二
音效播放指令并进行广播，该广播消息可直接传输到现场的音频播放设备(即比赛现场的
音频播放设备)或第三方网站，现场的音频播放设备或第三方网站在接收到该广播消息后，
会直接播放与该第而特定音效。在一个竞技对象出现死亡生命状态时，需导播台切换待显
示的视频流的显示场景，如回播当前出现死亡生命状态的竞技对象在当前场竞技比赛中的
部分视频画面，或者对竞技对象出现死亡生命状态的画面进行放大等，计算机可调用用于
指示导播台切换待显示的视频流的显示场景的导播台指令并广播至导播台，以指示导播台
切换待显示的视频流的显示场景。

[0081] 在竞技对象战胜对方竞技对象，需控制比赛现场的灯光全亮时，计算机可调用灯光显示指令并进行广播，该广播消息直接传输至现场的灯光控制模块，而现场的灯光控制
模块在接收到该广播消息后，会控制现场灯光全亮。

[0082] 计算机可通过广播预设指令的方式触发第三方网站直接执行与预设指令对应的事件，如音频播放指令对应的音效播放，使得第三方网站能够及时播放音效，确保第三方网
站直播新的视频流过程中的实时赛事数据的发布。

[0083] 在执行步骤S801时，具体的，计算机接收与字幕数据相对应的预设事件信号，并调用与预设事件信号相对应的预设指令。

[0084] 其中，预设事件信号的生成情况可包括基于计算机的输入数据生成、基于本地控制数据生成、基于外部设备发送的控制数据生成中的一种或多种。可选的，预设事件信号为
音频播放指示信号、网络接口调用指示信号或导播台指示信号等。

[0085] 可选的，待显示的视频流为竞技比赛过程中的视频流，控制数据包括竞技数据。其中，本地控制数据为该计算机的本地预先存储的竞技数据，外部设备发送的控制数据为外
部设备发送的竞技比赛过程中的竞技数据，竞技数据可包括竞技对象的数量数据、血量数
据、位置数据、竞技分数数据、生命状态数据等中的一种或多种。

[0086] 作为一种可行的实现方式，预设事件信号为基于计算机的本地输入数据生成的导播台指示信号，如计算机的键盘Ctrl按键+Enter按键同时按下时，计算机生成用于指示导
播台进行待显示的视频流的场景切换的导播台指示信号。当然，导播台指示信号还可以基
于本地控制数据生成和/或基于外部设备发送的控制数据生成。

[0087] 作为另一种可行的实现方式，预设事件信号为基于计算机的本地控制数据生成的网络接口调用指令信号，如本地预先存储有竞技对象掉血数据对应的音效数据，计算机在
确定竞技对象掉血后，生成用于指示第三方网站播放竞技对象掉血数据对应的音效数据的
网络接口调用指示指令。当然，网络接口调用指令信号还可以基于计算机的输入数据生成
和/或基于外部设备发送的控制数据生成。

[0088] 作为又一种可行的实现方式，预设事件信号为基于外部设备发送的控制数据生成的音频播放指示信号，如计算机在接收到竞技对象出现死亡生命状态时，生成用于指示播
放特定音频数据的音频播放指示信号。当然，音频播放指示信号还可以基于本地控制数据
生成和/或基于计算机的输入数据生成。

[0089] 本发明实施例的视频的字幕处理方法，通过在计算机上采用预设应用实现填充信号画面和键信号画面，即可实现字幕数据的在线加载，无需购买专用字幕机，降低了成本，
且借助于预设应用的灵活性，字幕处理的自动化程度高、实时性强、自由度高、适用范围广
泛，尤其适用于字幕数据更新频繁、字幕数据多的场景；同时，采用预设应用的同一显示区
域中设计第一预设字幕模板和第二预设字幕模板，可以将填充信号画面和键信号画面同时
进行渲染，确保两个画面的同步渲染要求；另外，在计算机渲染获得填充信号画面和键信号
画面后，再由导播台采用去背合成技术将填充信号画面和键信号画面合成到待显示的视频
流中，满足现实场景的数据显示需求，使获得的视频字幕满足广播级要求。

[0090] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质
中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁
碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access
Memory，RAM)等。

[0091] 以上所揭露的仅为本发明部分实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

视频的字幕处理方法和导播系统转让专利

申请号 : CN201880068929.4

文献号 : CN111279687A

文献日 : 2020-06-12

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 陈庭欣 , 陈贤雨

申请人 : 深圳市大疆创新科技有限公司

摘要 :

权利要求 :

说明书 :