一种网络多语言社交翻译方法、系统、设备及介质转让专利

申请号 : CN201910389958.7

文献号 : CN110111770A

文献日 : 2019-08-09

本发明公开了一种网络多语言社交翻译方法、系统、设备及介质，包括：实时获取用户在网络社交中的语音数据，并对所述用户使用的语种进行识别；根据识别的语种将所述语音数据转换成文字，同时根据所述用户的社交对象所使用的语种，将转换后的文字翻译成目标文字；将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象。本发明解决不同语种人群社交时的沟通障碍问题，应用场景多样化，可满足一对多的沟通需求，有效提高社交效率，同时可协助用户及其社交对象相互学习语言。

1.一种网络多语言社交翻译方法，其特征在于，包括：

实时获取用户在网络社交中的语音数据，并对所述用户使用的语种进行识别；

根据识别的语种将所述语音数据转换成文字，同时根据所述用户的社交对象所使用的语种，将转换后的文字翻译成目标文字；

将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象。

2.如权利要求1所述的方法，其特征在于，所述语音数据包括对话式分段语音数据、视频通话语音数据、语音电话的语音数据。

3.如权利要求2所述的方法，其特征在于，当所述语音数据为对话式分段语音数据时，将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象后，所述方法还包括：根据所述用户的社交对象所使用的语种，向所述用户及所述用户的社交对象提供所述目标文字的语音朗读功能。

4.如权利要求2所述的方法，其特征在于，将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象后，所述方法还包括：实时获取所述用户的手动操作信息，若所述手动操作为对所述转换后的文字进行调整，则根据所述用户的调整实时对相应的目标文字进行纠正，并根据所述调整和纠正，实时对返回给所述用户及所述用户的社交对象的转换后的文字和目标文字进行更新。

5.一种网络多语言社交翻译系统，其特征在于，包括：

语音数据获取模块，用于实时获取用户在网络社交中的语音数据；

语种识别模块，用于根据所述语音数据，对所述用户使用的语种进行识别；

文字转换模块，用于根据所述语种识别模块识别的语种将所述语音数据转换成文字；

目标文字翻译模块，用于根据所述用户的社交对象所使用的语种，将利用所述文字转换模块转换后的文字翻译成目标文字；

文字返回模块，用于将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象。

6.如权利要求5所述的系统，其特征在于，所述语音数据包括对话式分段语音数据、视频通话语音数据、语音电话的语音数据。

7.如权利要求6所述的系统，其特征在于，当所述语音数据为对话式分段语音数据时，所述系统还包括语音返回模块，具体用于：在执行所述文字返回模块后，根据所述用户的社交对象所使用的语种，向所述用户及所述用户的社交对象提供所述目标文字的语音朗读功能。

8.如权利要求6所述的系统，其特征在于，所述系统还包括文字纠正模块，具体用于：在执行所述文字返回模块后，实时获取所述用户的手动操作信息，若所述手动操作为对所述转换后的文字进行调整，则根据所述用户的调整实时对相应的目标文字进行纠正，并根据所述调整和纠正，实时对返回给所述用户及所述用户的社交对象的转换后的文字和目标文字进行更新。

9.一种电子设备，其特征在于，所述电子设备包括：壳体、处理器、存储器、电路板和电源电路，其中，电路板安置在壳体围成的空间内部，处理器和存储器设置在电路板上；电源电路，用于为上述电子设备的各个电路或器件供电；存储器用于存储可执行程序代码；处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序，用于执行权利要求1-4项任一所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现权利要求1-4项任一所述的方法。

一种网络多语言社交翻译方法、系统、设备及介质

技术领域

[0001] 本发明涉及网络社交技术领域，具体涉及一种网络多语言社交翻译方法、系统、设备及介质。

背景技术

[0002] 目前市面上有很多翻译软件，实现的功能基本为单纯的文字翻译或语音翻译，且均为一次翻译，用户操作过程也比较被动，同时存在一定的翻译时差，不能达到动态同步翻译的效果，且不能满足语音、文字、视屏等多种社交场景的翻译需求。

发明内容

[0003] 针对上述现有技术中的缺陷，本发明提供一种网络多语言社交翻译方法、系统、设备及介质，首先根据用户使用的语种将用户语音数据转换成文字，之后根据用户社交对象使用的语种将转换的文字翻译成目标文字，并提供语音朗读和实时对文字进行纠正的功能，有效提高不同语种人群的社交效率，无障碍理解对方的表达并沟通。

[0004] 具体发明内容为：

[0005] 一种网络多语言社交翻译方法，包括：

[0006] 实时获取用户在网络社交中的语音数据，并对所述用户使用的语种进行识别；所述语种包括汉语、英语、日语、韩语、法语、拉丁语、葡萄牙语等；

[0007] 根据识别的语种将所述语音数据转换成文字，同时根据所述用户的社交对象所使用的语种，将转换后的文字翻译成目标文字；

[0008] 将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象。

[0009] 进一步地，所述语音数据包括对话式分段语音数据、视频通话语音数据、语音电话的语音数据。

[0010] 所述对话式分段语音数据类似于微信逐条发送的语音数据，一般情况下，每条对话式分段语音数据的时长均小于60秒。

[0011] 进一步地，当所述语音数据为对话式分段语音数据时，将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象后，还包括：

[0012] 根据所述用户的社交对象所使用的语种，向所述用户及所述用户的社交对象提供所述目标文字的语音朗读功能。

[0013] 进一步地，将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象后，还包括：

[0014] 实时获取所述用户的手动操作信息，若所述手动操作为对所述转换后的文字进行调整，则根据所述用户的调整实时对相应的目标文字进行纠正，并根据所述调整和纠正，实时对返回给所述用户及所述用户的社交对象的转换后的文字和目标文字进行更新。

[0015] 一种网络多语言社交翻译系统，包括：

[0016] 语音数据获取模块，用于实时获取用户在网络社交中的语音数据；

[0017] 语种识别模块，用于根据所述语音数据，对所述用户使用的语种进行识别；所述语种包括汉语、英语、日语、韩语、法语、拉丁语、葡萄牙语等；

[0018] 文字转换模块，用于根据所述语种识别模块识别的语种将所述语音数据转换成文字；

[0019] 目标文字翻译模块，用于根据所述用户的社交对象所使用的语种，将利用所述文字转换模块转换后的文字翻译成目标文字；

[0020] 文字返回模块，用于将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象。

[0021] 进一步地，所述语音数据包括对话式分段语音数据、视频通话语音数据、语音电话的语音数据。

[0022] 所述对话式分段语音数据类似于微信逐条发送的语音数据，一般情况下，每条对话式分段语音数据的时长均小于60秒。

[0023] 进一步地，当所述语音数据为对话式分段语音数据时，还包括语音返回模块，具体用于：

[0024] 在执行所述文字返回模块后，根据所述用户的社交对象所使用的语种，向所述用户及所述用户的社交对象提供所述目标文字的语音朗读功能。

[0025] 进一步地，还包括文字纠正模块，具体用于：

[0026] 在执行所述文字返回模块后，实时获取所述用户的手动操作信息，若所述手动操作为对所述转换后的文字进行调整，则根据所述用户的调整实时对相应的目标文字进行纠正，并根据所述调整和纠正，实时对返回给所述用户及所述用户的社交对象的转换后的文字和目标文字进行更新。

[0027] 本发明所述方法、系统可单独实现或以插件等形式集成在现有社交工具中实现，例如集成在微信、微博，或视频通话、语音通话软件中，为用户提供高效、便捷的对话实时翻译环境。

[0028] 一种电子设备，包括：壳体、处理器、存储器、电路板和电源电路，其中，电路板安置在壳体围成的空间内部，处理器和存储器设置在电路板上；电源电路，用于为上述电子设备的各个电路或器件供电；存储器用于存储可执行程序代码；处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序，用于执行前述网络多语言社交翻译方法。

[0029] 一种计算机可读存储介质，存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现前述网络多语言社交翻译方法。

[0030] 本发明的有益效果体现在：

[0031] 本发明能够将用户在网络社交过程中的语音数据转换成文字，并根据社交对象使用的语种进行文字翻译，并将转换的文字和翻译后的文字返回给用户及其社交对象阅览，应用场景多样化，可满足一对多的沟通需求。本发明可根据用户对转换的文字的修改，对翻译后的文字进行实时纠错和更新，避免因方言或语音识别误差造成的语义曲解问题，实时将准确、完整的表述传递给社交对象，避免歧义造成的沟通问题，提升用户体验。本发明所述方法、系统可嵌入或集成在现有社交软件中，使用便捷，解决不同语种人群社交时的沟通障碍问题，有效提高社交效率，同时可协助用户及其社交对象相互学习语言。

附图说明

[0032] 为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中，类似的元件或部分一般由类似的附图标记标识。附图中，各元件或部分并不一定按照实际的比例绘制。

[0033] 图1为本发明实施例一种网络多语言社交翻译方法流程图；

[0034] 图2为本发明实施例一种带有语音朗读功能的场景交互示意图；

[0035] 图3为本发明实施例一种视屏通话场景下的场景交互示意图；

[0036] 图4为本发明实施例一种语音电话场景下的场景交互示意图；

[0037] 图5为本发明实施例一种网络多语言社交翻译系统结构图；

[0038] 图6为本发明实施例另一种网络多语言社交翻译系统结构图；

[0039] 图7为本发明实施例第三种网络多语言社交翻译系统结构图；

[0040] 图8为本发明实施例一种电子设备结构示意图。

具体实施方式

[0041] 下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案，因此只作为示例，而不能以此来限制本发明的保护范围。

[0042] 需要注意的是，除非另有说明，本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

[0043] 如图1所示，为本发明一种网络多语言社交翻译方法实施例，包括：

[0044] S11：实时获取用户在网络社交中的语音数据，并对所述用户使用的语种进行识别；所述语种包括汉语、英语、日语、韩语、法语、拉丁语、葡萄牙语等；

[0045] S12：根据识别的语种将所述语音数据转换成文字，同时根据所述用户的社交对象所使用的语种，将转换后的文字翻译成目标文字；

[0046] S13：将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象；一般情况下，在用户侧的显示方式为转换后的文字在上，目标文字在下，在用户社交对象侧的显示反之，为目标文字在上，转换后的文字在下；这样显示的目的是使用户及其社交对象能够首先看到自己所使用语种的文字，方便阅读，提高使用体验。

[0047] 优选地，所述语音数据包括对话式分段语音数据、视频通话语音数据、语音电话的语音数据。

[0048] 所述对话式分段语音数据类似于微信逐条发送的语音数据，一般情况下，每条对话式分段语音数据的时长均小于60秒。

[0049] 优选地，当所述语音数据为对话式分段语音数据时，将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象后，还包括：

[0050] 根据所述用户的社交对象所使用的语种，向所述用户及所述用户的社交对象提供所述目标文字的语音朗读功能；所述语音朗读功能可通过图标按钮实现，当用户或其社交对象有听取需求时，触发相应按钮即可，场景交互示意图如图2所示。

[0051] 优选地，将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象后，还包括：

[0052] 实时获取所述用户的手动操作信息，若所述手动操作为对所述转换后的文字进行调整，则根据所述用户的调整实时对相应的目标文字进行纠正，并根据所述调整和纠正，实时对返回给所述用户及所述用户的社交对象的转换后的文字和目标文字进行更新；相应地，给出一种视屏通话场景下的场景交互示意图，如图3所示；同时给出一种语音电话场景下的场景交互示意图，如图4所示。

[0053] 如图5所示，为本发明一种网络多语言社交翻译系统实施例，包括：

[0054] 语音数据获取模块51，用于实时获取用户在网络社交中的语音数据；

[0055] 语种识别模块52，用于根据所述语音数据，对所述用户使用的语种进行识别；所述语种包括汉语、英语、日语、韩语、法语、拉丁语、葡萄牙语等；

[0056] 文字转换模块53，用于根据所述语种识别模块52识别的语种将所述语音数据转换成文字；

[0057] 目标文字翻译模块54，用于根据所述用户的社交对象所使用的语种，将利用所述文字转换模块53转换后的文字翻译成目标文字；

[0058] 文字返回模块55，用于将所述转换后的文字和目标文字返回给所述用户及所述用户的社交对象。

[0059] 优选地，所述语音数据包括对话式分段语音数据、视频通话语音数据、语音电话的语音数据。

[0060] 所述对话式分段语音数据类似于微信逐条发送的语音数据，一般情况下，每条对话式分段语音数据的时长均小于60秒。

[0061] 优选地，如图6所示，当所述语音数据为对话式分段语音数据时，还包括语音返回模块56，具体用于：

[0062] 在执行所述文字返回模块55后，根据所述用户的社交对象所使用的语种，向所述用户及所述用户的社交对象提供所述目标文字的语音朗读功能。

[0063] 优选地，如图7所示，还包括文字纠正模块57，具体用于：

[0064] 在执行所述文字返回模块55后，实时获取所述用户的手动操作信息，若所述手动操作为对所述转换后的文字进行调整，则根据所述用户的调整实时对相应的目标文字进行纠正，并根据所述调整和纠正，实时对返回给所述用户及所述用户的社交对象的转换后的文字和目标文字进行更新。

[0065] 本发明所述方法、系统可单独实现或以插件等形式集成在现有社交工具中实现，例如集成在微信、微博，或视频通话、语音通话软件中，为用户提供高效、便捷的对话实时翻译环境。

[0066] 本发明实施例还提供一种电子设备，如图8所示，可以实现本发明图1所示实施例的流程，如图8所示，上述电子设备可以包括：壳体81、处理器82、存储器83、电路板84和电源电路85，其中，电路板84安置在壳体81围成的空间内部，处理器82和存储器83设置在电路板84上；电源电路85，用于为上述电子设备的各个电路或器件供电；存储器83用于存储可执行程序代码；处理器82通过读取存储器83中存储的可执行程序代码来运行与可执行程序代码对应的程序，用于执行前述网络多语言社交翻译方法。

[0067] 处理器82对上述步骤的具体执行过程以及处理器82通过运行可执行程序代码来进一步执行的步骤，可以参见本发明图1所示实施例的描述，在此不再赘述。

[0068] 该电子设备以多种形式存在，包括但不限于：

[0069] (1)移动通信设备：这类设备的特点是具备移动通信功能，并且以提供话音、数据通信为主要目标。这类终端包括：智能手机(例如iPhone)、多媒体手机、功能性手机，以及低端手机等。

[0070] (2)超移动个人计算机设备：这类设备属于个人计算机的范畴，有计算和处理功能，一般也具备移动上网特性。这类终端包括：PDA、MID和UMPC设备等，例如iPad。

[0071] (3)便携式娱乐设备：这类设备可以显示和播放多媒体内容。该类设备包括：音频、视频播放器(例如iPod)，掌上游戏机，电子书，以及智能玩具和便携式车载导航设备。

[0072] (4)服务器：提供计算服务的设备，服务器的构成包括处理器、硬盘、内存、系统总线等，服务器和通用的计算机架构类似，但是由于需要提供高可靠的服务，因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。

[0073] (5)其他具有数据交互功能的电子设备。

[0074] 本发明的实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有一个或者多个程序，所述一个或者多个程序可被一个或者多个处理器执行，以实现前述网络多语言社交翻译方法。

[0075] 本发明能够将用户在网络社交过程中的语音数据转换成文字，并根据社交对象使用的语种进行文字翻译，并将转换的文字和翻译后的文字返回给用户及其社交对象阅览，应用场景多样化，可满足一对多的沟通需求。本发明可根据用户对转换的文字的修改，对翻译后的文字进行实时纠错和更新，避免因方言或语音识别误差造成的语义曲解问题，实时将准确、完整的表述传递给社交对象，避免歧义造成的沟通问题，提升用户体验。本发明所述方法、系统可嵌入或集成在现有社交软件中，使用便捷，解决不同语种人群社交时的沟通障碍问题，有效提高社交效率，同时可协助用户及其社交对象相互学习语言。

[0076] 最后应说明的是：以上各实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述各实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的范围，其均应涵盖在本发明的权利要求和说明书的范围当中。

一种网络多语言社交翻译方法、系统、设备及介质转让专利

申请号 : CN201910389958.7

文献号 : CN110111770A

文献日 : 2019-08-09

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 都风忠

申请人 : 濮阳市顶峰网络科技有限公司

摘要 :

权利要求 :

说明书 :