一种字幕滚动控制方法、系统及装置转让专利

申请号 : CN201910876252.3

文献号 : CN110737381B

文献日 : 2020-11-10

本发明公开了一种字幕滚动控制方法、系统及装置，该方法包括：根据麦克风信号生成音频信号，将音频信号与预设读音对比，获得测评信息；将测评信息与朗读文本进行匹配，根据匹配信息控制字幕滚动到相应文本并高亮显示。该系统包括：测评模块和控制模块。该装置包括存储器以及用于执行上述字幕滚动控制方法的处理器。通过使用本发明，可实现根据使用者的朗读情况控制字幕朗读文本的滚动，提高用户的朗读体验。本发明作为一种字幕滚动控制方法、系统及装置，可广泛应用于字幕控制领域。

1.一种字幕滚动控制方法，其特征在于：包括以下步骤：根据麦克风信号生成音频信号，将音频信号与预设读音对比，获得测评信息；

将测评信息与朗读文本进行匹配，根据匹配信息控制字幕滚动到相应文本并高亮显示；

其中，所述将测评信息与朗读文本进行匹配，根据匹配信息控制字幕滚动到相应文本并高亮显示这一步骤，其具体还包括：将测评信息与朗读文本逐一校对，得到状态为已读的字，获取该字在朗读文本的行数以及该字在该行中的顺序号；

根据行数获取该行数对应的字数，根据字数选取对应的匹配阈值，生成匹配信息；

根据匹配信息，字幕滚动到相应文本并高亮显示。

2.根据权利要求1所述的一种字幕滚动控制方法，其特征在于：所述测评信息包括字和字的状态，所述字的状态包括未读、已读和重读。

3.根据权利要求1所述的一种字幕滚动控制方法，其特征在于：所述根据字数选取对应的匹配阈值具体包括：当X处于第一区域且不存在跳读行为时，则匹配阈值为第一阈值；

当X处于第二区域且不存在跳读行为时，则匹配阈值为第二阈值，存在跳读行为则匹配阈值为第三阈值；

当X处于第三区域且不存在跳读行为时，则匹配阈值为第四阈值，存在跳读行为则匹配阈值为第五阈值；

所述X为字数。

4.根据权利要求3所述的一种字幕滚动控制方法，其特征在于：所述匹配信息包括匹配成功的行数和状态为已读的字在该行对应的顺序号。

5.根据权利要求4所述的一种字幕滚动控制方法，其特征在于：所述字幕滚动到相应文本并高亮显示包括根据匹配到的字的顺序号，控制字幕滚动到匹配行显示或滚动到匹配行的下一行显示。

6.根据权利要求3所述的一种字幕滚动控制方法，其特征在于：当当前屏幕高亮的行数与匹配后显示的行数之差大于预设第六阈值则判定为跳读行为。

7.一种字幕滚动控制系统，其特征在于：

测评模块，用于根据麦克风信号生成音频信号，将音频信号与预设读音对比，获得测评信息；

控制模块，用于将测评信息与朗读文本进行匹配，根据匹配信息控制字幕滚动到相应文本并高亮显示；

其中，所述控制模块还包括：

校对子模块，用于将测评信息与朗读文本逐一校对，得到状态为已读的字，获取该字在朗读文本的行数以及该字在该行中的顺序号；

匹配子模块，用于根据行数获取该行数对应的字数，根据字数选取对应的匹配阈值，生成匹配信息；

显示子模块，用于根据匹配信息，字幕滚动到相应文本并高亮显示。

8.一种字幕滚动控制装置，其特征在于：还包括：至少一个处理器；

至少一个存储器，用于存储至少一个程序；

当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如权利要求1-6任一项所述一种字幕滚动控制方法。

一种字幕滚动控制方法、系统及装置

技术领域

[0001] 本发明字幕控制领域，尤其涉及一种字幕滚动控制方法、系统及装置。

背景技术

[0002] 用户使用朗读亭进行朗读，朗读文本会同时在上屏和下屏中显示，下屏是触控屏，有自由上下翻动朗读文本、调节声音大小，选择上屏朗读文本滚动速度等功能，上屏是显示屏，用于显示朗读文本，一般而言，用户在开始朗读的时候，上屏的朗读文本在系统预设的速度下滚动，由于每个朗读者的朗读速度不一，常常出现朗读文本显现的速度跟不上朗读者的朗读速度，或相反的情况，导致用户需要在触控屏进行速度的调节，多次的反复操作降低了用户的朗读体验。

发明内容

[0003] 为了解决上述技术问题，本发明的目的是提供一种字幕滚动控制方法、系统及装置，可实现根据使用者的朗读情况控制字幕朗读文本的滚动。

[0004] 本发明所采用的第一技术方案是：一种字幕滚动控制方法，包括以下步骤：

[0005] 根据麦克风信号生成音频信号，将音频信号与预设读音对比，获得测评信息；

[0006] 将测评信息与朗读文本进行匹配，根据匹配信息控制字幕滚动到相应文本并高亮显示。

[0007] 进一步，所述测评信息包括字和字的状态，所述字的状态包括未读、已读和重读。

[0008] 进一步，所述将测评信息与朗读文本进行匹配，根据匹配信息控制字幕滚动到相应文本并高亮显示这一步骤具体还包括：

[0009] 将测评信息与朗读文本逐一校对，获取该字在朗读文本的行数以及该字在该行中的顺序号；

[0010] 根据行数获取该行数对应的字数，根据字数的不同选取不同的匹配方法，生成匹配信息；

[0011] 根据匹配信息，字幕滚动到相应文本并高亮显示。

[0012] 进一步，所述根据行数获取该行数对应的字数，根据字数的不同选取不同的匹配方法，生成匹配信息这一步骤具体还包括：

[0013] 当X处于第一区域且不存在跳读行为时，则匹配阈值为第一阈值；

[0014] 当X处于第二区域且不存在跳读行为时，则匹配阈值为第二阈值，存在跳读行为则匹配阈值为第三阈值；

[0015] 当X处于第三区域且不存在跳读行为时，则匹配阈值为第四阈值，存在跳读行为则匹配阈值为第五阈值；

[0016] 所述X为字数。

[0017] 进一步，所述匹配信息包括匹配成功的行和状态为已读的字在该行对应的顺序号。

[0018] 进一步，所述字幕滚动到相应文本并高亮显示包括根据匹配到的字的顺序号，控制字幕滚动到匹配行显示或滚动到匹配行的下一行显示。

[0019] 进一步，当当前屏幕高亮的行数与匹配后应该显示的行数之差大于预设阈值则判定为跳读行为。

[0020] 本发明所采用的第二技术方案是：一种字幕滚动控制系统，包括：

[0021] 测评模块，用于根据麦克风信号生成音频信号，将音频信号与预设读音对比，获得测评信息；

[0022] 控制模块，用于将测评信息与朗读文本进行匹配，根据匹配信息控制字幕滚动到相应文本并高亮显示。

[0023] 进一步，所述控制模块还包括：

[0024] 校对子模块，用于将测评信息与朗读文本逐一校对，得到状态为已读的字，获取该字在朗读文本的行数以及该字在该行中的顺序号；

[0025] 匹配子模块，用于根据行数获取该行数对应的字数，根据字数选取对应的匹配阈值，生成匹配信息；

[0026] 显示子模块，用于根据匹配信息，字幕滚动到相应文本并高亮显示。

[0027] 本发明所采用的第三技术方案是：一种字幕滚动控制装置，包括：

[0028] 至少一个处理器；

[0029] 至少一个存储器，用于存储至少一个程序；

[0030] 当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现如上所述一种字幕滚动控制方法。

[0031] 本发明方法、系统及装置的有益效果是：本发明接收麦克风的音频信号，与标准库中的读音进行比对，确认朗读文本的相应位置，屏幕跳转到朗读文本的相应位置并高亮显示，根据使用者的朗读情况控制字幕朗读文本的滚动，从而提高用户的朗读体验。

附图说明

[0032] 图1是本发明一种字幕滚动控制方法的步骤流程图；

[0033] 图2是本发明一种字幕滚动控制系统的结构框图；

具体实施方式

[0034] 下面结合附图和具体实施例对本发明做进一步的详细说明。对于以下实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

[0035] 如图1所示，本发明提供了一种字幕滚动控制方法，该方法包括以下步骤：

[0036] S101、根据麦克风信号生成音频信号，将音频信号与预设读音对比，获得测评信息。

[0037] 具体地，麦克风接收朗读语音，音频模拟信号进行采样编码转化为音频数字信号，音频数字信号发送到测评模块，测评模块将音频数字信号中每个字的读音与标准库的读音进行对比，返回测评结果。

[0038] S102、将测评信息与朗读文本进行匹配，根据匹配信息控制字幕滚动到相应文本并高亮显示。

[0039] 具体地，在匹配模块中与朗读文本逐字匹配，判断字幕该显示的朗读文本行和根据顺序号来判断是否应该提前显示下一行，所述朗读文本划分为两种类型：单字类型和数组类型，单字类型：每个字中包含了该字所在的行数以及该字在该行中的顺序号，数组类型：每个数组里包括了该行所在屏幕中的行数，是否需要换行标志，行里面包含的单字数量和每行按照正常速度读所需的时间，匹配信息还包括了匹配是否成功的匹配结果。

[0040] 进一步作为本方法的优选实施例，所述测评信息包括字和字的状态，所述字的状态包括未读、已读和重读。

[0041] 进一步作为本方法的优选实施例，所述将测评结果传输至匹配模块与朗读文本进行匹配，根据匹配信息字幕滚动到相应文本并高亮显示这一步骤，其具体还包括：

[0042] 将测评信息与朗读文本逐一校对，得到状态为已读的字，获取该字在朗读文本的行数以及该字在该行中的顺序号；

[0043] 根据行数获取该行数对应的字数，根据字数选取对应的匹配阈值，生成匹配信息；

[0044] 根据匹配信息，字幕滚动到相应文本并高亮显示。

[0045] 具体地，测评模块返回的结果(字和字的状态)与朗读文本的单字逐一对比，当匹配到字的状态为已读或者重读时，获取该字所在行数以及该字在该行中的顺序号，根据该行数N去获取该行在数组类型中的字数数量。

[0046] 进一步作为优选实施例，所述根据字数选取对应的匹配阈值具体包括：

[0047] 当X处于第一区域且不存在跳读行为时，则匹配阈值为第一阈值；

[0048] 当X处于第二区域且不存在跳读行为时，则匹配阈值为第二阈值，存在跳读行为则匹配阈值为第三阈值；

[0049] 当X处于第三区域且不存在跳读行为时，则匹配阈值为第四阈值，存在跳读行为则匹配阈值为第五阈值；

[0050] 所述X为字数。

[0051] 具体地，所述第一区域为X≤5，所述第一阈值为2，所述第二区域为5

[0052] 即：

[0053] 当X≤5且不存在跳读行为时，匹配2个字以上则匹配成功；

[0054] 当5

[0055] 当8

[0056] 具体地，当该行的字数数量5＜X≤8时，匹配的字的顺序号为7～8个时，系统默认该行快读完了，自动跳转到下一行并高亮显示，当该行的字数数量8＜X＜16时，匹配字的顺序号X-3个字时，系统默认该行快读完了，自动跳转到下一行并高亮显示，当该行的字数数量X≥16时，匹配字的顺序号为第X-5～X个字时，系统默认该行快读完了，自动跳转到下一行并高亮显示。

[0057] 进一步作为本方法的优选实施例，所述匹配信息包括匹配成功的行和状态为已读的字在该行对应的顺序号。

[0058] 具体地，顺序号用于判断是否需要控制字幕滚动到下一行显示，系统判断该行快读完了，自动跳转到下一行并高亮显示。

[0059] 进一步作为本方法的优选实施例，所述字幕滚动到相应文本并高亮显示包括根据匹配到的字的顺序号，控制字幕滚动到匹配行显示或滚动到匹配行的下一行显示。

[0060] 进一步作为本方法的优选实施例，当当前字幕高亮的行数与匹配后显示的行数之差大于预设第六阈值则判定为跳读行为。

[0061] 具体地，所述跳读行为判断可方便针对部分用户，所述第六阈值预设为5，而且通过判断跳读行为需要匹配更多的字数，从而避免某几行相似字过多而导致判断错误。

[0062] 如图2所示，一种字幕滚动控制系统，包括：

[0063] 测评模块，用于根据麦克风信号生成音频信号，将音频信号与预设读音对比，获得测评信息；

[0064] 控制模块，用于将测评信息与朗读文本进行匹配，根据匹配信息控制字幕滚动到相应文本并高亮显示。

[0065] 进一步作为优选实施例，所述控制模块还包括：

[0066] 校对子模块，用于将测评信息与朗读文本逐一校对，得到状态为已读的字，获取该字在朗读文本的行数以及该字在该行中的顺序号；

[0067] 匹配子模块，用于根据行数获取该行数对应的字数，根据字数选取对应的匹配阈值，生成匹配信息；

[0068] 显示子模块，用于根据匹配信息，字幕滚动到相应文本并高亮显示。

[0069] 本发明的具体实施例如下：

[0070] 麦克风接收朗读语音，音频模拟信号进行采样编码转化为音频数字信号，音频数字信号发送到测评模块，测评模块将音频数字信号中每个字的读音与标准库的读音进行对比，将测评模块返回的结果(字和字的状态)与朗读文本的单字逐一对比，匹配到字的状态为已读或者重读时，获取该字所在行数以及该字在该行中的顺序号，根据该行数N去获取该行在数组类型中的字数数量，根据字符数量的不同选择不同的匹配方法，根据匹配信息字幕跳转到朗读文本相应行并高亮显示。

[0071] 上述方法实施例中的内容均适用于本装置实施例中，本装置实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。

[0072] 以上是对本发明的较佳实施进行了具体说明，但本发明创造并不限于所述实施例，熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

一种字幕滚动控制方法、系统及装置转让专利

申请号 : CN201910876252.3

文献号 : CN110737381B

文献日 : 2020-11-10

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 胡天祥 , 莫兆忠 , 李晓峰

申请人 : 广州优谷信息技术有限公司

摘要 :

权利要求 :

说明书 :