一种个性化定制媒体的方法、服务端和系统转让专利

申请号 : CN200810019005.3

文献号 : CN101483824B

文献日 : 2011-10-26

本发明实施例公开了一种个性化定制媒体的方法，该方法包括：接收到来自发送端的文本信息，所述文本信息包括媒体转换指示信息；服务端根据所述文本信息中的媒体转换指示信息，将图片转换为第一种媒体文件；服务端将音频文件和所述第一种媒体文件转换为第二种媒体文件。本发明还公开了一种个性化定制媒体的服务端，以及一种个性化定制媒体的系统。通过本发明技术方案，用户能随心所欲使用自己想要的图片或声音，最大程度地满足用户的个性化需求，以及越来越高的趣味性和娱乐性要求，提高了用户体验。

1.一种个性化定制媒体的方法，其特征在于，包括以下步骤：

接收到来自发送端的文本信息，所述文本信息包括媒体转换指示信息；服务端根据所述文本信息中的媒体转换指示信息，将图片转换为第一种媒体文件；服务端将音频文件和所述第一种媒体文件转换为第二种媒体文件；

所述文本信息还包括所述发送端标识信息和语句信息，如果所述服务端没有接收到来自于发送端的音频文件，则所述服务端根据所述发送端标识信息匹配与所述发送端相对应的语音特征库，将所述文本信息中的语句信息转换为符合与所述发送端相对应的语音特征库的音频文件；

所述服务端根据所述发送端标识信息匹配与其相对应的语音特征库，包括，所述服务端首先根据所述发送端标识信息，匹配与所述发送端相对应的语音特征库；若与所述发送端相对应的语音特征库不存在，则所述服务端匹配系统预设的语音特征库。

2.如权利要求1所述的个性化定制媒体的方法，其特征在于：当所述媒体转换指示信息指示转换为视频时，所述第一种媒体文件是视频；或者，当所述媒体转换指示信息指示转换为漫画卡通时，所述第一种媒体文件是漫画卡通。

3.如权利要求1所述的个性化定制媒体的方法，其特征在于：所述文本信息还包括发送端标识信息，所述服务端根据所述文本信息中的媒体转换指示信息，将图片转换为第一种媒体文件的步骤之前，还包括以下步骤——如果服务端接收到来自于发送端的图片，则转换为第一种媒体文件的图片是所述接收到的来自于发送端的图片；

如果服务端没有接收到来自于发送端的图片，则服务端根据所述发送端标识信息查找所述发送端之前是否发送过来图片，若是，则转换为第一种媒体文件的图片是所述发送端之前发送过来的图片；若否，则转换为第一种媒体文件的图片是服务端预设的图片。

4.如权利要求1所述的个性化定制媒体的方法，其特征在于：所述文本信息还包括接收端信息，所述服务端将音频文件和所述第一种媒体文件转换为第二种媒体文件的步骤之后，还包括将所述第二种媒体文件发送给接收终端。

一种个性化定制媒体的方法、服务端和系统

技术领域

[0001] 本发明涉及网络通信技术领域，特别涉及一种个性化定制媒体的方法、服务端和系统。

背景技术

[0002] 随着网络的日益发展，基于网络的多媒体传输已经越来越普及，而且人们对多媒体通信内容的要求日益提高，人们不再满足于单一、被动的传统媒体娱乐方式，而需要的更加个性化、互动化的多媒体通信方式。特别是随着移动网络通信技术的进一步发展和移动多媒体业务的普及，移动多媒体已经越来越显示其未来广泛和越趋成熟的用户认知以及接受度。

[0003] 目前，终端发送文本信息到指定的特服号(特服号是由运营商分配给增值服务商和合作伙伴使用的服务号码)，服务端处理后，接收方终端收到一个文本信息所对应的彩信或者视频，这是目前开始流行的一种终端娱乐方式。但所收到的彩信，视频无论是画面还是声音，都是以服务端已有的素材为基础生成的，缺乏用户的个性化定制内容。

[0004] 比如，已有的第一种实现方式：

[0005] 发送端按照约定(例如网页上提示或移动短信广告)，编辑固定短消息内容，例如“18”到某个特服号，“18”这个文本通过短信服务端转给处理服务端.处理服务端为“18”找到所匹配的预先做好的一个动画图片或视频，然后它被发送给接收端手机。

[0006] 已有的第二种实现方式：

[0007] 发送端编辑短消息“我爱你”到某个特服号，“我爱你”这个文本通过短信服务端转给处理服务端.处理服务端通过文本到语音转换软件(TTS，Text To Speech)，把“我爱你”转换为发“我爱你”读音的音频文件.然后“我爱你”将被转化为一个动画图片或视频，方法如下：

[0008] (一)直接使用一张固定的动画图片或视频；

[0009] (二)将“我爱你”作为一个短语，匹配某一张动画图片或视频；

[0010] (三)把“我爱你”拆分为3个字，3个字分别匹配3个图片或视频，然后把3个媒体按时序合并为一个媒体，如，可以是形成一个动画图片或一个连续视频。

[0011] 然后，再将动画图片或视频与音频文件结合，最终在服务端生成包含讲话(如“我爱你”)的动画或包含讲话(如“我爱你”)的视频，然后下发给接收端手机。

[0012] 在实现本发明创造过程中，发明人发现上述第一种的个性化体验度要高于第二种。但在以上背景技术中，用户仍然不能够随心所欲的使用自己想要的图片或声音，已有的实现方式难以满足用户的个性化需求，以及越来越高的趣味性和娱乐性要求，不能满足用户体验。

发明内容

[0013] 本发明要解决的问题是提供一种个性化定制媒体的方法、服务端和系统，使得用户可以个性化的选择使用自己想要的图片或声音，提高用户体验。

[0014] 为达到上述目的，本发明所揭示的技术方案提供了一种个性化定制媒体的方法，包括以下步骤：

[0015] 接收到来自发送端的文本信息，所述文本信息包括媒体转换指示信息；

[0016] 服务端根据所述文本信息中的媒体转换指示信息，将图片转换为第一种媒体文件；

[0017] 服务端将音频文件和所述第一种媒体文件转换为第二种媒体文件。

[0018] 本发明所揭示的技术方案还提供了一种个性化定制媒体的服务端，包括：

[0019] 接收单元，用于接收包含有媒体转换指示信息的文本信息；

[0020] 处理单元，用于根据所述接收单元接收的媒体转换指示信息，将图片转换为第一种媒体文件，并将音频文件和所述第一种媒体文件转换为第二种媒体文件；

[0021] 发送单元，用于发送所述处理单元生成的所述第二种媒体文件。

[0022] 本发明所揭示的技术方案还提供一种个性化定制媒体的系统，包括：

[0023] 发送端，用于将包含有媒体转换指示信息的文本信息发送给服务端；

[0024] 服务端，用于根据所述发送端发送的文本信息中的媒体转换标识，将图片转换为第一种媒体文件，并将音频文件和所述第一种媒体文件转换为第二种媒体文件发送给接收端；

[0025] 接收端，用于接收来自于所述服务端的所述第二种媒体文件，并显示或者播放所述第二种媒体文件。

[0026] 本发明的主要技术优点是：通过实施本发明技术方案，用户能够随心所欲地使用自己想要的图片或声音，最大程度地满足用户的个性化需求，以及越来越高的趣味性和娱乐性要求，提高用户体验。

附图说明

[0027] 图1是一种个性化定制媒体的服务端的示意图。

具体实施方式

[0028] 下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。

[0029] 实施例一：

[0030] 本发明实施例所揭示的技术方案，使得用户能够随心所欲使用自己想要的图片或声音，最大程度地满足用户的个性化需求，以及越来越高的趣味性和娱乐性要求，提高用户体验。

[0031] 用户通过发送端发送文本信息，个性化的声音文件，以及图片到服务端。其中，文本信息是必需要发送的，而个性化的声音文件，或者图片，用户可以选择发送，也可以选择不发送。服务端接收和处理从用户终端发送过来的这些信息，生成多媒体，然后将所述的多媒体发送到接收端。

[0032] 本实施例所说的发送端和接收端，可以是有线终端，如个人电脑；也可以是无线终端，如手机。发送方式可以是通过手机终端本身自带的应用软件来发送，也可以通过无线应用协议(WAP，Wireless ApplicationProtocol)进入WAP输入界面后再编辑信息发送；如果是有线终端的话，如连接到英特网的个人电脑，也可以通过英特网浏览器如IE访问网站，进入编辑页面编辑并发送信息。

[0033] 本实施例所说的终端发送的文本信息的来源，可以包括：用户通过键盘输入的文本信息，或者终端话筒输入的语音通过语音识别软件转化后得到的文本信息。

[0034] 本实施例所称的用户端发送的文本信息，可以包括：

[0035] 1、接收端信息

[0036] 具体地，比如可以是对方的手机号码；可选地，可以不包括接收端信息；可选的，接收端信息可以是发送端本身。

[0037] 2、语句信息

[0038] 所述语句信息，比如“我爱你”等文字信息，在本实施例中，语句信息和声音文件这两者，有且只能有一个，举例说明如：语句信息和声音文件假设用A和B代表，有了A就不能有B，有了B就不能有A，且A和B中必有一个出现。

[0039] 3、媒体转换指示信息，比如，可以是判断生成视频还是漫画的指示信息。

[0040] 如前文所述，本实施例中所说的用户通过终端发送的图片，用户可以选择上传，也可以选择不上传。

[0041] 服务端接收到来自发送端的文本信息后，对所述文本信息进行识别，所述文本信息中包括：接收端信息(如果发送端发送该信息的话)；媒体转换指示信息，如判断生成视频还是漫画卡通的指示信息；语句信息(如果发送端发送该信息的话)。服务端根据所述文本信息中的媒体转换指示信息，将图片转换为第一种媒体文件，比如，当所述媒体转换指示信息指示需要转换为视频时，则所述第一种媒体文件是视频；或者，当所述媒体转换指示信息指示需要转换为漫画卡通时，则所述第一种媒体文件是漫画卡通；也就是说，当所述媒体转换指示信息指示需要转换成不同的媒体时，则将所述图片和第一种媒体转换为相对应的不同媒体。

[0042] 在所述服务端根据所述文本信息中的媒体转换指示信息，将图片转换为第一种媒体文件之前，如果服务端判断接收到来自于发送端的图片，则所述图片是所述接收到的来自于发送端的图片；如果服务端没有接收到来自于发送端的图片，则服务端可根据发送端发送来的发送端信息查找所述发送端之前是否发送过来图片，若查找到所述发送端之前发送过来的图片，则所述图片是所述发送端之前发送过来的图片；若否，则所述图片是服务端预设的图片。

[0043] 可选地，如果发送端没有发送来发送端信息的情况下，则系统自动默认为：直接在系统预设的图片资源中挑选出符合要求的图片。

[0044] 如果用户在终端上传了音频文件，则将该音频文件的语音特征提取出来，进一步的，根据用户端信息可以将所述语音特征保存到与该用户端对应的语音特征库中，也可以自动覆盖所述语音特征库中对应部分。如果用户端没有上传音频文件，在本实施例中，则该用户必然发送了语句信息，则所述服务端根据接受到的发送端信息来匹配语音特征库，将语句信息转换为符合所述语音特征库的音频文件。这个过程具体可以包括：根据发送端传来的发送端信息，来判断所述发送端是否有对应的语音特征库，有的话则根据该发送端用户对应的语音特征库来完成上述转换；若所述发送端相对应的语音特征库不存在，则所述服务端根据系统预设的语音特征库来完成上述转换。

[0045] 也就是说语句信息转成音频文件的时候，首先参照的是该用户以前保留的语音特征库(如果有的话)，所以声音听起来和用户很相似。

[0046] 上述转换举例如：如果用户的语句信息是“我爱你”，那么文本“我爱你”会变成一个音频文件.它发出“我爱你”的读音；同时因为生成该音频文件的时候，参照了该用户的语音特征库，所以声音听起来和用户本人发音很相似，比较逼真。

[0047] 进一步地，服务端将音频文件与上述的第一种媒体文件，比如视频或漫画卡通合并，转换成第二种媒体文件，如生成带所述音频的视频文件，或者是生成一个有声的漫画卡通。

[0048] 本实施例中，所述第一种媒体文件经转换后形成第二种媒体文件，所述第一种媒体文件可以是一种中间阶段形式的媒体文件，所述第二种媒体文件可以是最终在本实施例中形成的文件，简单的说可以是过程文件和最终文件的关系，这种情况下，第一种媒体和第二种媒体可以是格式相同的媒体文件，比如，在本实施例中：当第一种媒体是视频，而后该第一种媒体(视频)和音频相结合，形成第二种媒体文件，这时第二种媒体文件也是相同视频格式的媒体文件。

[0049] 当然所述第一种媒体文件经转换后形成第二种媒体文件，这第一种媒体文件和第二种媒体文件，也可以是不同格式的媒体文件。

[0050] 所述语句信息可以作为字幕以各种表现形式嵌入生成的视频或有声漫画卡通中，实时播放，比如一种表现形式是滚动字幕出现在视频的下方。

[0051] 进一步地，这个最终生成的视频或有声漫画卡通可以被发送到接收端，在接收端显示或播放。比如，可以用手机来接收、显示或播放，也可以用个人电脑连接英特网来接收、显示或播放。

[0052] 接收端可以是不同于用户发送端的手机或者个人电脑；也可以就是发送端本身，如可以在接收端信息中输入发送端号码，输入用户自己的手机号码即可实现。

[0053] 本实施例所称的媒体，包括但不限于：MPEG、AVI、RMVB、WMV、SWF、VIV、ASF、RM、RA、RP、RT、MOV、QT、3GPP、MP4、3D，JPEG、PNG、GIF、BMP、AMR、MMF、3GPP、MP4、RM、AVI、WAV、APE、MP3/MP2/MP1/MPGA、WMA/ASF、MIDI/MID、VQF、AIF/AIFF、AU、VOC、AAC、VOX等。

[0054] 通过实施本实施例所揭示的技术方案，用户能够个性化的选择自己想要的图片或声音，最大程度地满足用户的个性化需求。

[0055] 实施例二：

[0056] 本实施例揭示了一种个性化定制媒体的方法，可以基于实施例一，方法包括：用户在发送端通过一客户端软件将语句信息“你猜猜我是谁？”和接收方手机号码
“13891027634”以及判断需要生成视频的指示信息“0”发送到服务端，可选的，同时上传一张自己的头像照到服务端。

[0057] 所述客户端应用程序包括但不限于Kjava、Symbian、SmartPhone、Mophun、Brew或PDA，以及基于这些程序的基础上开发的其它程序。

[0058] 服务端收到上述信息后，依据判断生成视频的标志信息“0”(这里用1位来表示，当然也可以用00，01，10，11等表示多种可生成的媒体类型)，如果用户上传自己的头像照的话，就把用户的头像照转换成视频，再将语句信息“你猜猜我是谁？”转换生成对应文字读音的音频，且音频的语音特征符合该用户的语音特征库，若没有该用户的语音特征库的话，则使用系统语音特征库。语句信息可以作为字幕以某种表现形式嵌入生成的视频中，例如一种表现形式可以是滚动字幕出现在视频的最下面。

[0059] 进一步地，可以将生成的视频发送给接收端，比如对方用户的手机，手机号码如13891027634。

[0060] 通过实施本实施例所揭示的技术方案，用户能够随心所欲的选择自己想要的图片或声音，最大程度地满足用户的个性化需求。

[0061] 实施例三：

[0062] 本实施例揭示了一种个性化定制媒体的方法，可以基于实施例一，方法包括：用户通过PC在互联网的某网站上，上传自己的音频文件和头像图片文件，并且将接收方手机号码”13891027634”，以及判断需要生成漫画卡通的指示信息“1”也发送给服务端。

[0063] 服务端收到上述信息后.依据判断生成漫画的标志信息“1”，把头像图片转成具有漫画卡通效果的图片，同时分析用户上传的音频文件，提取语音特征并保存以便以后使用。

[0064] 然后，漫画卡通效果的图片与音频文件结合为一个有声的漫画卡通，可以被进一步发送到接收方手机13891027634上。

[0065] 通过实施本实施例所揭示的技术方案，用户能够随心所欲的选择自己想要的图片或声音，最大程度地满足用户的个性化需求。

[0066] 实施例四：

[0067] 参考图1所示，本实施例提供了一种个性化定制媒体的服务端，包括：

[0068] 接收单元，用于接收包含有媒体转换指示信息的文本信息；

[0069] 处理单元，用于根据所述接收单元接收的媒体转换指示信息，将图片转换为第一种媒体文件，并将音频文件和所述第一种媒体文件转换为第二种媒体文件；

[0070] 发送单元，用于发送所述处理单元的所述第二种媒体文件。

[0071] 通过实施本实施例所揭示的技术方案，用户能够随心所欲的选择自己想要的图片或声音，最大程度地满足用户的个性化需求。

[0072] 以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

[0073] 实施例五：

[0074] 本实施例提供了一种个性化定制媒体的系统，包括：

[0075] 发送端，用于将包含有媒体转换指示信息的文本信息发送给服务端；

[0076] 服务端，用于根据所述发送端发送的文本信息中的媒体转换标识，将图片转换为第一种媒体文件，并将音频文件和所述第一种媒体文件转换为第二种媒体文件发送给接收端；

[0077] 接收端，用于接收来自于所述服务端的所述第二种媒体文件，并显示或者播放所述第二种媒体文件。

[0078] 通过实施本实施例所揭示的技术方案，用户能够随心所欲地选择自己想要的图片或声音，最大程度地满足用户的个性化需求。

[0079] 通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对背景技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备执行本发明各个实施例所述的方法。

[0080] 当然，以上所述仅是本发明的几个具体应用范例。应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

一种个性化定制媒体的方法、服务端和系统转让专利

申请号 : CN200810019005.3

文献号 : CN101483824B

文献日 : 2011-10-26

基本信息: 请登录后查看

PDF: 请登录后查看

法律信息: 请登录后查看

相似专利: 请登录后查看

发明人 : 李嘉辉

申请人 : 李嘉辉

摘要 :

权利要求 :

说明书 :