短视频的合成方法、装置、设备及存储介质转让专利

申请号 : CN201810520553.8

文献号 : CN108769801B

文献日 : 2019-03-29

本发明实施例公开了一种短视频的合成方法、装置、设备及存储介质。该方法包括：获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳；将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧；其中，所述兴趣帧识别模型用于在输入的视频帧中识别出满足兴趣度条件的视频帧；根据时间戳将所述多张待合成视频帧进行拼接，形成与所述待处理视频对应的短视频。本发明实施例提供的短视频的合成方法，将待处理视频的视频帧集合输入至兴趣帧识别模型中，自动获取到多张满足兴趣度条件的视频帧，无需花费大量人力对待处理视频中满足兴趣度条件的视频帧进行识别，可以提高短视频合成的效率，降低人工成本。

1.一种短视频的合成方法，其特征在于，包括：获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳；

将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧；其中，所述兴趣帧识别模型用于在输入的视频帧中识别出满足兴趣度条件的视频帧；

根据时间戳将所述多张待合成视频帧进行拼接，形成与所述待处理视频对应的短视频；

还包括：

将所述短视频推送至设定视频发布平台；

获取网络测评参数超过预设阈值的短视频，确定为目标短视频；其中，所述网络测评参数包括视频评分或视频点击量；

对所述目标短视频按照视频类别进行分类；

将属于同一视频类别的目标短视频进行拼接，获得至少一个长视频。

2.根据权利要求1所述的方法，其特征在于，在将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧之前，还包括：获取标注有兴趣度标签的多张视频帧样本；

使用所述多张视频帧样本图像，对设定深度学习模型进行训练，得到所述兴趣帧识别模型。

3.根据权利要求1所述的方法，其特征在于，在将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧之前，还包括：获取与至少一个视频类别对应的，标注有兴趣度标签的多张视频帧样本；

使用所述多张视频帧样本，对至少一个设定深度学习模型进行训练，得到与所述视频类别对应的至少一个所述兴趣帧识别模型；

将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧，包括：将所述视频帧集合中的视频帧分别输入至与所述待处理视频的视频类别匹配的兴趣帧识别模型中，得到多张待合成视频帧。

4.根据权利要求2或3所述的方法，其特征在于，所述兴趣度标签包括：感兴趣标签以及非感兴趣标签。

5.根据权利要求3所述的方法，其特征在于，获取与至少一个视频类别对应的，标注有兴趣度标签的多张视频帧样本，包括：获取标注有兴趣度标签的多张视频帧样本；

将所述多张视频帧样本输入至预先训练的视频类别确定模型中，得到与所述至少一个视频类别对应的视频帧样本。

6.根据权利要求1所述的方法，其特征在于，在获得至少一个长视频之后，还包括：将所述至少一个长视频推送至所述设定视频发布平台。

7.一种短视频的合成装置，其特征在于，包括：视频帧集合获取模块，用于获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳；

待合成视频帧获取模块，用于将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧；其中，所述兴趣帧识别模型用于在输入的视频帧中识别出满足兴趣度条件的视频帧；

短视频形成模块，用于根据时间戳将所述多张待合成视频帧进行拼接，形成与所述待处理视频对应的短视频；

还包括：

短视频推送模块，用于将短视频推送至设定视频发布平台；

目标短视频确定模块，用于获取网络测评参数超过预设阈值的短视频，确定为目标短视频；其中，网络测评参数包括视频评分或视频点击量；

分类模块，用于对目标短视频按照视频类别进行分类；

长视频获取模块，用于将属于同一视频类别的目标短视频进行拼接，获得至少一个长视频。

8.一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-6中任一所述的方法。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-6中任一所述的方法。

短视频的合成方法、装置、设备及存储介质

技术领域

[0001] 本发明实施例涉及互联网技术领域，尤其涉及一种短视频的合成方法、装置、服务器及存储介质。

背景技术

[0002] 随着网络技术的快速发展，移动直播技术已经成为时下的社会热点之一。用户可以通过终端设备中的直播软件做直播，通过直播的方式介绍一款产品、分享当前所处的旅游景点或者一种料理的制作过程等。

[0003] 直播视频中有很多精彩的片段可以用来制作小视频，这些小视频是用户喜闻乐见的，直播视频中精彩片段制成的短视频近年来成为移动互联网用户热衷的数字内容之一。现有技术中，在合成短视频时，通过人工观看视频并将精彩内容片段进行人工截取的方式来获取，而直播视频的时长较长，通过人工筛选的方式不仅容易错过一些精彩的片段，且成本高，费时费力，效率极低。

发明内容

[0004] 本发明实施例提供一种短视频的合成方法、装置、服务器及存储介质，可以提高短视频合成的效率，降低人工成本。

[0005] 第一方面，本发明实施例提供了一种短视频的合成方法，该方法包括：

[0006] 获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳；

[0007] 将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧；其中，所述兴趣帧识别模型用于在输入的视频帧中识别出满足兴趣度条件的视频帧；

[0008] 根据时间戳将所述多张待合成视频帧进行拼接，形成与所述待处理视频对应的短视频。

[0009] 进一步地，在将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧之前，还包括：

[0010] 获取标注有兴趣度标签的多张视频帧样本；

[0011] 使用所述多张视频帧样本，对设定深度学习模型进行训练，得到所述兴趣帧识别模型。

[0012] 进一步地，在将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧之前，还包括：

[0013] 获取与至少一个视频类别对应的，标注有兴趣度标签的多张视频帧样本；

[0014] 使用所述多张视频帧样本，对至少一个设定深度学习模型进行训练，得到与所述视频类别对应的至少一个所述兴趣帧识别模型；

[0015] 将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧，包括：

[0016] 将所述视频帧集合中的视频帧分别输入至与所述待处理视频的视频类别匹配的兴趣帧识别模型中，得到多张待合成视频帧。

[0017] 进一步地，所述兴趣度标签包括：感兴趣标签以及非感兴趣标签。

[0018] 进一步地，获取与至少一个视频类别对应的，标注有兴趣度标签的多张视频帧样本，包括：

[0019] 获取标注有兴趣度标签的多张视频帧样本；

[0020] 将所述多张视频帧样本输入至预先训练的视频类别确定模型中，得到与所述至少一个视频类别对应的视频帧样本。

[0021] 进一步的，在获得短视频之后，还包括：

[0022] 将所述短视频推送至设定视频发布平台；

[0023] 获取网络测评参数超过预设阈值的短视频，确定为目标短视频；其中，所述网络测评参数包括视频评分或视频点击量；

[0024] 对所述目标短视频按照视频类别进行分类；

[0025] 将属于同一视频类别的目标短视频进行拼接，获得至少一个长视频。

[0026] 进一步地，在获得至少一个长视频之后，还包括：

[0027] 将所述至少一个长视频推送至所述设定视频发布平台。

[0028] 第二方面，本发明实施例还提供了一种短视频的合成装置，该装置包括：

[0029] 视频帧集合获取模块，用于获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳；

[0030] 待合成视频帧获取模块，用于将所述视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧；其中，所述兴趣帧识别模型用于在输入的视频帧中识别出满足兴趣度条件的视频帧；

[0031] 短视频形成模块，用于根据时间戳将所述多张待合成视频帧进行拼接，形成与所述待处理视频对应的短视频。

[0032] 第三方面，本发明实施例还提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如本发明实施例所述的短视频的合成方法。

[0033] 第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明实施例所述的短视频的合成方法。

[0034] 本发明实施例，首先获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳，然后将视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧，其中，兴趣帧识别模型用于在输入的视频帧中识别出满足兴趣度条件的视频帧，最后根据时间戳将多张待合成视频帧进行拼接，形成与待处理视频对应的短视频。现有技术中，通过人工筛选精彩片段合成短视频的方式不仅容易错过一些精彩的片段，且成本高，费时费力，效率极低。本发明实施例提供的短视频的合成方法，将待处理视频的视频帧集合输入至兴趣帧识别模型中，自动获取到多张满足兴趣度条件的视频帧，无需花费大量人力对待处理视频中满足兴趣度条件的视频帧进行识别，可以提高短视频合成的效率，降低人工成本。

附图说明

[0035] 图1是本发明实施例一中的一种短视频的合成方法的流程图；

[0036] 图2是本发明实施例二中的一种短视频的合成方法的流程图；

[0037] 图3是本发明实施例三中的一种短视频的合成方法的流程图；

[0038] 图4是本发明实施例四中的一种短视频的合成方法的流程图；

[0039] 图5是本发明实施例五中的一种短视频的合成装置的结构示意图；

[0040] 图6是本发明实施例六中的一种计算机设备的结构示意图。

具体实施方式

[0041] 下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

[0042] 实施例一

[0043] 图1为本发明实施例一提供的一种短视频的合成方法的流程图，本实施例可适用于合成短视频的情况，该方法可以由短视频的合成装置来执行，该装置可由硬件和/或软件组成，并一般可集成在电脑、服务器以及所有包含短视频合成功能的终端中。如图1所示，该方法具体包括如下步骤。

[0044] 步骤110，获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳。

[0045] 其中，待处理视频可以是直播平台发布的由各主播录制的视频或者由专业人员对录制的视频进行编辑后发布于视频平台的视频(如影视剧视频、综艺节目视频等)。视频帧集合可以是由构成待处理视频的所有视频帧组成的集合，或者由待处理视频中设定时间段的视频帧组成的集合。例如，假设待处理视频的时长为40分钟，设定时间段可以是第10分钟-第30分钟之间的时间段。优先的，本实施例中视频帧集合是由构成待处理视频的所有视频帧组成的集合。时间戳可以是视频帧在待处理视频中所处的时间点。

[0046] 本实施例中，获取与待处理视频对应的视频帧集合的方式可以是，将待处理视频输入视频处理软件中，利用视频处理软件对待处理视频中包含的视频帧进行提取，获得待处理视频对应的视频帧集合。

[0047] 步骤120，将视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧。

[0048] 其中，兴趣帧识别模型用于在输入的视频帧中识别出满足兴趣度条件的视频帧。兴趣度条件可以包括感兴趣和非感兴趣。兴趣帧识别模型可以是基于设定深度学习模型，通过大量标注有兴趣度标签的样本进行不断训练而获得的模型。

[0049] 具体的，兴趣帧识别模型的工作原理可以是，当输入视频帧时，兴趣帧模型对输入的视频帧进行图像识别，对识别到的图像信息进行分析，判断输入视频帧包含的图像信息是否满足兴趣度条件，若满足，则将该视频帧输出，若不满足，则将该视频帧丢弃。本实施例中，将视频帧集合中的视频帧分别输入至兴趣帧识别模型后，兴趣帧识别模型分别对视频帧集合中的视频帧进行图像识别及图像分析，将符合满足兴趣度条件的视频帧输出，不满足兴趣度条件的视频帧丢弃。

[0050] 步骤130，根据时间戳将多张待合成视频帧进行拼接，形成与待处理视频对应的短视频。

[0051] 其中，短视频可以是由数量小于1万的视频帧组成的视频。本实施例中，当获得多张待合成视频帧后，按照每一视频帧携带时间戳的先后顺序将多张待合成视频帧进行拼接，形成与待处理视频对应的满足兴趣度条件的短视频。示例性的，将某一待处理视频对应的视频帧集合输入至兴趣帧识别模型中，获得300张满足兴趣度条件的视频帧，将这300张视频帧按照时间戳的先后顺序进行拼接，获得该待处理视频对应的短视频。

[0052] 本实施例的技术方案，首先获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳，然后将视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧，其中，兴趣帧识别模型用于在输入的视频帧中识别出满足兴趣度条件的视频帧，最后根据时间戳将多张待合成视频帧进行拼接，形成与待处理视频对应的短视频。现有技术中，通过人工筛选精彩片段合成短视频的方式不仅容易错过一些精彩的片段，且成本高，费时费力，效率极低。本发明实施例提供的短视频的合成方法，将待处理视频的视频帧集合输入至兴趣帧识别模型中，自动获取到多张满足兴趣度条件的视频帧，无需花费大量人力对待处理视频中满足兴趣度条件的视频帧进行识别，可以提高短视频合成的效率，降低人工成本。

[0053] 实施例二

[0054] 图2为本发明实施例二提供的一种短视频的合成方法的流程图，以上述实施为基础，如图2所示，该方法包括如下步骤。

[0055] 步骤210，获取标注有兴趣度标签的多张视频帧样本。

[0056] 其中，兴趣度标签包括感兴趣标签以及非感兴趣标签。视频帧可以从直播平台中的各直播视频中提取，视频帧样本可以由大量的直播视频中的视频帧组成。本实施例中，获取标注有兴趣度标签的多张视频帧样本的过程可以是，从直播平台中搜索各视频类别下的多个直播视频，然后从多个直播视频中分别提取多张视频帧，对提取到的多张视频帧标注兴趣度标签，从而获得视频帧样本。其中，视频类别可以包括美食类、竞技游戏类、唱歌类、旅游类、美妆类等。可选的，对多张视频帧标注兴趣度标签的方式可以是人工进行标注或自动标注。人工标注的方式可以是人工对视频帧的图像进行分析，确定视频帧标注的兴趣度标签是感兴趣便签还是非感兴趣标签；自动标注的方式可以是，在直播过程中，实时获取用户反馈参数(如礼物数量、弹幕数量)，若在某一时间段内用户反馈参数超过设定阈值，则将该时间段内的视频帧标注为感兴趣标签。其中，时间段可以是3-5秒之间的任意值，设定阈值可以是100-200之间的任意值，。示例性的，时间段为3秒，设定阈值为150，直播视频过程中，在12分30秒-12份33秒之间，用户赠送礼物的数量为300，则将12分30秒-12分33秒之间的视频帧自动标注为感兴趣标签。本应用场景下，在对视频帧标注兴趣度标签时，具有人的主观意念。例如：对于美食类的直播视频，将视频中色泽鲜艳的食物画面标注为感兴趣标签，色泽一般的食物画面标注为非感兴趣标签；对于竞技游戏类的直播视频，视频中杀人的画面标注为感兴趣标签，其他标注为非感兴趣标签；对于唱歌类直播视频，跳舞画面标注为感兴趣标签，其他画面标注为非感兴趣标签。示例性的，从直播平台的各视频类别下共搜索1000个直播视频，从这1000个直播视频中分别提取5张视频帧，获得5000张视频帧，然后对
5000张视频帧分别标注兴趣度标签，获得5000张视频帧样本。

[0057] 步骤220，使用多张视频帧样本，对设定深度学习模型进行训练，得到兴趣帧识别模型。

[0058] 其中，设定深度学习模型是基于人工神经网络算法建立的训练模型。人工神经网络的基本结构由非线性变化单元构成，神经网络参数可以包括中间层数、各层之间的处理单元数以及学习系数。对深度学习模型训练的过程可以是调整各神经网络参数的过程，经过不断的训练，获得最优的神经网络参数，具有最优神经网络参数的设定深度学习模型即为最终要获得的模型。具体的，在获得多张视频帧样本后，使用多张视频帧样本对设定深度学习模型进行训练，不断调整设定深度学习中的神经网络参数，使得设定深度学习模型具有在输入的视频帧中准确识别出满足兴趣度条件的视频帧的能力，从而获得兴趣帧识别模型。

[0059] 步骤230，获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳。

[0060] 步骤240，将视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧。

[0061] 步骤250，根据时间戳将多张待合成视频帧进行拼接，形成与待处理视频对应的短视频。

[0062] 本实施例的技术方案，使用多张标注有兴趣度标签的视频帧样本，对设定深度学习模型进行训练，得到兴趣帧识别模型。提高兴趣帧识别模型识别的准确性。

[0063] 实施例三

[0064] 图3为本发明实施例三提供的一种短视频的合成方法的流程图，以上述实施为基础，可选的，将视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧，可通过下述方式实施：将视频帧集合中的视频帧分别输入至与待处理视频的视频类别匹配的兴趣帧识别模型中，得到至少一张待合成视频帧。如图3所示，该方法包括如下步骤。

[0065] 步骤310，获取与至少一个视频类别对应的，标注有兴趣度标签的多张视频帧样本。

[0066] 其中，视频类别可以由直播视频中包含的视频内容主题确定，可以包括美食类、竞技游戏类、唱歌类、旅游类、美妆类等。本实施例中获取与至少一个视频类别对应的，标注有兴趣度标签的多张视频帧样本的方式可以是，在直播平台中的各视频类别下分别搜索一定数量的直播视频，从搜到的直播视频中分别提取视频帧，然后对提取到的视频帧分别标注兴趣度标签，从而获得与视频类别对应的多张视频帧样本。示例性的，分别从美食类、竞技游戏类、唱歌类、旅游类、美妆类中提取2000张视频帧，然后对每个视频类别下的2000张视频帧标注兴趣度标签，获得每个视频类别对应的2000张视频帧样本。

[0067] 可选的，获取与至少一个视频类别对应的，标注有兴趣度标签的多张视频帧样本，可通过下述方式实施：获取标注有兴趣度标签的多张视频帧样本，将多张视频帧样本输入至预先训练的视频类别确定模型中，得到与至少一个视频类别对应的视频帧样本。

[0068] 其中，视频类别确定模型可以用于识别输入的视频帧所属的视频类别。本实施例中，在获得标注有兴趣度标签的多张视频帧样本后，将多张视频帧样本图像输入至预先训练的视频类别确定模型中，以对多张视频帧样本进行分类，获得与视频类别对应的视频帧样本。示例性的，假设有1万张标注有兴趣度标签的视频帧样本，将这1万张视频帧样本输入视频类别确定模型中，对这1万张视频帧样本进行分类，获得的结果是美食类下的视频帧样本1000张，竞技游戏类下的视频帧样本1500张，唱歌类下的视频帧样本2000张，旅游类下的视频帧样本3000张，美妆类下的视频帧样本2500张。通过预先训练的视频类别确定模型对标注有兴趣度标签的多张视频帧样本进行分类，减少人工的干预，可以提高分类的效率。

[0069] 步骤320，使用多张视频帧样本，对至少一个设定深度学习模型进行训练，得到与视频类别对应的至少一个兴趣帧识别模型。

[0070] 具体的，在分别获得至少一个视频类别对应的视频帧样本后，分别使用至少一个视频类别对应的视频帧样本，对至少一个设定深度学习模型进行训练，使得至少一个设定深度学习模型都具有识别满足兴趣度条件的与视频类别对应的视频帧的能力，从而得到与视频类别对应的至少一个兴趣帧识别模型。本实施中，每一个视频类别对应一个兴趣帧识别模型，可以对视频类别中的视频帧进行兴趣度识别。

[0071] 步骤330，获取与待处理视频对应的视频帧集合。

[0072] 步骤340，将视频帧集合中的视频帧分别输入至与待处理视频的视频类别匹配的兴趣帧识别模型中，得到多张待合成视频帧。

[0073] 具体的，获取待处理视频所属的视频类别，然后将视频帧集合输入与待处理视频的视频类别匹配的兴趣帧识别模型中，得到多张待合成视频帧。示例性的，假设待处理视频属于美食类，则将待处理视频的视频帧集合输入与美食类匹配的兴趣帧识别模型中。

[0074] 步骤350，根据时间戳将多张待合成视频帧进行拼接，形成与待处理视频对应的短视频。

[0075] 本实施例的技术方案，获取与至少一个视频类别对应的，标注有兴趣度标签的多张视频帧样本，使用多张视频帧样本，对至少一个设定深度学习模型进行训练，得到与视频类别对应的至少一个兴趣帧识别模型。每个视频类别具有与其匹配的兴趣帧识别模型，可以提高模型识别的准确性。

[0076] 实施例四

[0077] 图4为本发明实施例四提供的一种短视频的合成方法的流程图。以上述实施例为基础，如图4所示，该方法包括如下步骤。

[0078] 步骤410，获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳。

[0079] 步骤420，将视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧。

[0080] 步骤430，根据时间戳将多张待合成视频帧进行拼接，形成与待处理视频对应的短视频。

[0081] 步骤440，将短视频推送至设定视频发布平台。

[0082] 其中，设定视频发布平台可以是直播平台(如虎牙直播平台等)。将短视频推送至设定视频发布平台的方式可以是，启动设定视频发布平台的参与入口(如账号登录等)，通过该参与入口登录至设定视频发布平台，然后将短视频上传至设定视频发布平台。

[0083] 步骤450，获取网络测评参数超过预设阈值的短视频，确定为目标短视频。其中，网络测评参数包括视频评分或视频点击量。

[0084] 若网络测评参数为视频评分，则预设阈值可以设置为8-9分之间的任意值，优选的，设置为9分。若网络测评参数为视频点击量，则预设阈值可以设置为1000万-2000万之间的任意值，优选的，设置为2000万。

[0085] 本实施例中，短视频被推送至设定视频发布平台后，用户在浏览设定视频发布平台的页面时，可能会点击观看该短视频，或者在观看后对该短视频进行评分，设定视频发布平台所在的服务器统计各用户对短视频的点击次数，形成该短视频的点击量，或者记录各用户对短视频的评分，计算平均值，获得该短视频的视频评分。当短视频的网络测评参数超过预设阈值时，将短视频确定为目标短视频。

[0086] 步骤460，对目标短视频按照视频类别进行分类。

[0087] 在本应用场景下，由于在设定视频发布平台中展示的短视频的数量很多，获得的目标短视频的数量可以为多个。

[0088] 具体的，根据目标短视频中的播放内容确定目标短视频所属的视频类别，然后根据视频类别对目标短视频进行分类。示例性的，假设获得10个目标短视频，其中，美食类的目标短视频3个，竞技游戏类的目标短视频4个，美妆类的目标短视频3个。

[0089] 步骤470，将属于同一视频类别的目标短视频进行拼接，获得至少一个长视频。

[0090] 其中，对目标短视频拼接的方式可以是，按照任意的顺序进行拼接或者按照短视频时长由少到多的顺序进行拼接等。示例性的，假设获得10个目标短视频，其中，美食类的目标短视频3个，竞技游戏类的目标短视频4个，美妆类的目标短视频3个。将美食类、竞技游戏类和美妆类分别包含的短视频进行拼接，获得3个长视频。

[0091] 可选的，在获得至少一个长视频之后，还包括如下步骤：将至少一个长视频推送至设定视频发布平台。

[0092] 其中，将长视频推送至设定视频发布平台的方式可以是，启动设定视频发布平台的参与入口(如账号登录等)，通过该参与入口登录至设定视频发布平台，然后将长视频上传至设定视频发布平台。

[0093] 本实施例的技术方案，短视频推送至设定视频发布平台后，将相同视频类别的网络测评参数超过预设阈值的短视频进行拼接，获得至少一个长视频，并将长视频推送至设定视频发布平台。对符合兴趣度条件的短视频拼接后再发布，可以提高短视频的曝光度，一定程度上，可以提高视频发布平台的浏览量。

[0094] 实施例五

[0095] 图5为本发明实施例五提供的一种短视频的合成装置的结构示意图。如图5所示，该装置包括：视频帧集合获取模块510，待合成视频帧获取模块520和短视频形成模块530。

[0096] 视频帧集合获取模块510，用于获取与待处理视频对应的视频帧集合，每一视频帧携带时间戳；

[0097] 待合成视频帧获取模块520，用于将视频帧集合中的视频帧分别输入至兴趣帧识别模型中，得到多张待合成视频帧；其中，兴趣帧识别模型用于在输入的视频帧中识别出满足兴趣度条件的视频帧；

[0098] 短视频形成模块530，用于根据时间戳将多张待合成视频帧进行拼接，形成与待处理视频对应的短视频。

[0099] 可选的，还包括：

[0100] 第一视频帧样本获取模块，用于获取标注有兴趣度标签的多张视频帧样本；

[0101] 第一兴趣帧识别模型获取模块，用于使用多张视频帧样本图像，对设定深度学习模型进行训练，得到兴趣帧识别模型。

[0102] 可选的，还包括：

[0103] 第二视频帧样本获取模块，用于获取与至少一个视频类别对应的，标注有兴趣度标签的多张视频帧样本；

[0104] 第二兴趣帧识别模型获取模块，用于使用多张视频帧样本，对至少一个设定深度学习模型进行训练，得到与视频类别对应的至少一个兴趣帧识别模型；

[0105] 待合成视频帧获取模块520，还用于：

[0106] 将视频帧集合中的视频帧分别输入至与待处理视频的视频类别匹配的兴趣帧识别模型中，得到多张待合成视频帧。

[0107] 可选的，兴趣度标签包括：感兴趣标签以及非感兴趣标签。

[0108] 可选的，第二视频帧样本获取模块，还用于：

[0109] 获取标注有兴趣度标签的多张视频帧样本；

[0110] 将多张视频帧样本输入至预先训练的视频类别确定模型中，得到与至少一个视频类别对应的视频帧样本。

[0111] 可选的，还包括：

[0112] 短视频推送模块，用于将短视频推送至设定视频发布平台；

[0113] 目标短视频确定模块，用于获取网络测评参数超过预设阈值的短视频，确定为目标短视频；其中，网络测评参数包括视频评分或视频点击量；

[0114] 分类模块，用于对目标短视频按照视频类别进行分类；

[0115] 长视频获取模块，用于将属于同一视频类别的目标短视频进行拼接，获得至少一个长视频。

[0116] 可选的，还包括：

[0117] 长视频推送模块，用于将至少一个长视频推送至设定视频发布平台。

[0118] 上述装置可执行本发明前述所有实施例所提供的方法，具备执行上述方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节，可参见本发明前述所有实施例所提供的方法。

[0119] 实施例六

[0120] 图6为本发明实施例六提供的一种计算机设备的结构示意图，如图6所示，本实施例提供的一种计算机设备，包括：处理器61和存储器62。该计算机设备中的处理器可以是一个或多个，图6中以一个处理器61为例，所述计算机设备中的处理器61和存储器62可以通过总线或其他方式连接，图6中以通过总线连接为例。

[0121] 本实施例中计算机设备的处理器61中集成了上述实施例提供的短视频的合成装置。此外，该计算机设备中的存储器62作为一种计算机可读存储介质，可用于存储一个或多个程序，所述程序可以是软件程序、计算机可执行程序以及模块，如本发明实施例中短视频的合成方法对应的程序指令/模块。处理器61通过运行存储在存储器62中的软件程序、指令以及模块，从而执行设备的各种功能应用以及数据处理，即实现上述方法实施例中短视频的合成方法。

[0122] 存储器62可包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序；存储数据区可存储根据设备的使用所创建的数据等。此外，存储器62可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中，存储器62可进一步包括相对于处理器61远程设置的存储器，这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

[0123] 处理器61通过运行存储在存储器62中的程序，从而执行各种功能应用以及数据处理，实现例本发明实施例提供的短视频的合成方法。

[0124] 实施例七

[0125] 本发明实施例的计算机存储介质，其上存储有计算机程序，该程序被数据备份装置执行时实现如本发明实施例提供的短视频的合成方法。

[0126] 计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

[0127] 计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

[0128] 计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、RF等等，或者上述的任意合适的组合。

[0129] 可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++，还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

[0130] 注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

短视频的合成方法、装置、设备及存储介质转让专利

申请号 : CN201810520553.8

文献号 : CN108769801B

文献日 : 2019-03-29

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 徐子豪 , 吴晓东

申请人 : 广州虎牙信息科技有限公司

摘要 :

权利要求 :

说明书 :