房源标题的生成方法和装置、存储介质、电子设备转让专利

申请号 : CN201911194030.X

文献号 : CN110929505B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 尚尔昕王江月

申请人 : 北京房江湖科技有限公司

摘要 :

本公开实施例公开了一种房源标题的生成方法和装置、存储介质、电子设备,其中,方法包括:基于房源对应的多种房源属性及对应的房源属性值,确定所述房源的房源属性向量;其中,每种所述房源属性对应一个房源属性值;基于用户对应的多种用户属性及对应的用户属性值,确定所述用户的用户属性向量;其中,每种所述用户属性对应一个用户属性值;基于所述房源属性向量和所述用户属性向量,确定所述房源面向所述用户的房源标题,本实施例通过结合用户属性向量,实现针对用户偏好的房源标题,并且可针对不同用户偏好生成不同房源标题,实现个性化的生成房屋标题。

权利要求 :

1.一种房源标题的生成方法,其特征在于,包括:基于房源对应的多种房源属性及对应的房源属性值,确定所述房源的房源属性向量;

其中,每种所述房源属性对应一个房源属性值;

基于用户对应的多种用户属性及对应的用户属性值,确定所述用户的用户属性向量;

其中,每种所述用户属性对应一个用户属性值;

对所述房源属性向量和所述用户属性向量进行维度拼接,得到输入向量;

将所述输入向量输入变分自编码器,得到中间向量;

将所述中间向量和所述用户属性向量输入解码器,将得到的文本内容作为所述房源面向所述用户的房源标题。

2.根据权利要求1所述的方法,其特征在于,所述将所述中间向量和所述用户属性向量输入解码器,包括:

对所述中间向量和所述用户属性向量进行维度拼接,将维度拼接后的向量输入所述解码器。

3.根据权利要求1所述的方法,其特征在于,在对所述房源属性向量和所述用户属性向量进行维度拼接,得到输入向量之前,还包括:利用房源数据集对所述变分自编码器和所述解码器进行联合训练;其中,所述房源数据集中包括多个房源数据,每个所述房源数据包括训练房源、训练用户和所述训练房源对应所述训练用户的标注标题。

4.根据权利要求1‑3任一项所述的方法,其特征在于,所述基于房源对应的多种房源属性及对应的房源属性值,确定所述房源的房源属性向量,包括:分别对所述房源对应的多种房源属性中的每种房源属性及其对应的房源属性值进行编码,得到多对房源向量对;其中,每对所述房源向量对包括一个房源属性向量和一个房源属性值向量;

对所述多对房源向量对进行处理,得到所述房源的房源属性向量。

5.根据权利要求4所述的方法,其特征在于,每对所述房源向量对中包括的房源属性向量对应的房源属性与所述房源属性值向量对应的房源属性存在对应关系;

所述对所述多对房源向量对进行处理,得到所述房源的房源属性向量,包括:分别将所述多对房源向量对中每对房源向量对中的房源属性向量和房源属性值向量进行维度拼接,得到多个房源拼接向量;

对所述多个房源拼接向量进行累加,得到所述房源的房源属性向量。

6.根据权利要求1‑3任一项所述的方法,其特征在于,所述基于用户对应的多种用户属性及对应的用户属性值,确定所述用户的用户属性向量,包括:分别对所述用户对应的多种用户属性中的每种用户属性及其对应的用户属性值进行编码,得到多对用户向量对;其中,每对所述用户向量对包括一个用户属性向量和一个用户属性值向量;

对所述多对用户向量对进行处理,得到所述用户的用户属性向量。

7.根据权利要求6所述的方法,其特征在于,每对所述用户向量对中包括的用户属性向量对应的用户属性与所述用户属性值向量对应的用户属性存在对应关系;

所述对所述多对用户向量对进行处理,得到所述用户的用户属性向量,包括:分别将所述多对用户向量对中每对用户向量对中的用户属性向量和用户属性值向量进行维度拼接,得到多个用户拼接向量;

对所述多个用户拼接向量进行累加,得到所述用户的用户属性向量。

8.一种房源标题的生成装置,其特征在于,包括:房源向量确定模块,用于基于房源对应的多种房源属性及对应的房源属性值,确定所述房源的房源属性向量;其中,每种所述房源属性对应一个房源属性值;

用户向量确定模块,用于基于用户对应的多种用户属性及对应的用户属性值,确定所述用户的用户属性向量;其中,每种所述用户属性对应一个用户属性值;

标题生成模块,包括:

向量处理单元,用于对所述房源属性向量和所述用户属性向量进行维度拼接,得到输入向量;

编解码单元,用于将所述输入向量输入变分自编码器,得到中间向量;将所述中间向量和所述用户属性向量输入解码器,将得到的文本内容作为所述房源面向所述用户的房源标题。

9.根据权利要求8所述的装置,其特征在于,所述编解码单元在将所述中间向量和所述用户属性向量输入解码器时,用于对所述中间向量和所述用户属性向量进行维度拼接,将维度拼接后的向量输入所述解码器。

10.根据权利要求8所述的装置,其特征在于,所述装置还包括:训练模块,用于利用房源数据集对所述变分自编码器和所述解码器进行联合训练;其中,所述房源数据集中包括多个房源数据,每个所述房源数据包括训练房源、训练用户和所述训练房源对应所述训练用户的标注标题。

11.根据权利要求8‑10任一项所述的装置,其特征在于,所述房源向量确定模块,包括:第一编码单元,用于分别对所述房源对应的多种房源属性中的每种房源属性及其对应的房源属性值进行编码,得到多对房源向量对;其中,每对所述房源向量对包括一个房源属性向量和一个房源属性值向量;

房源向量处理单元,用于对所述多对房源向量对进行处理,得到所述房源的房源属性向量。

12.根据权利要求11所述的装置,其特征在于,每对所述房源向量对中包括的房源属性向量对应的房源属性与所述房源属性值向量对应的房源属性存在对应关系;

所述房源向量处理单元,具体用于分别将所述多对房源向量对中每对房源向量对中的房源属性向量和房源属性值向量进行维度拼接,得到多个房源拼接向量;对所述多个房源拼接向量进行累加,得到所述房源的房源属性向量。

13.根据权利要求8‑10任一项所述的装置,其特征在于,所述用户向量确定模块,包括:第二编码单元,用于分别对所述用户对应的多种用户属性中的每种用户属性及其对应的用户属性值进行编码,得到多对用户向量对;其中,每对所述用户向量对包括一个用户属性向量和一个用户属性值向量;

用户向量处理单元,用于对所述多对用户向量对进行处理,得到所述用户的用户属性向量。

14.根据权利要求13所述的装置,其特征在于,每对所述用户向量对中包括的用户属性向量对应的用户属性与所述用户属性值向量对应的用户属性存在对应关系;

所述用户向量处理单元,具体用于分别将所述多对用户向量对中每对用户向量对中的用户属性向量和用户属性值向量进行维度拼接,得到多个用户拼接向量;对所述多个用户拼接向量进行累加,得到所述用户的用户属性向量。

15.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1‑7任一所述的房源标题的生成方法。

16.一种电子设备,其特征在于,所述电子设备包括:处理器;

用于存储所述处理器可执行指令的存储器;

所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1‑7任一所述的房源标题的生成方法。

说明书 :

房源标题的生成方法和装置、存储介质、电子设备

技术领域

[0001] 本公开涉及房源推荐技术领域,尤其是一种房源标题的生成方法和装置、存储介质、电子设备。

背景技术

[0002] 房源标题的生成可以看做是一项文本生成任务,现有的文本生成任务主要有以下几种:模板式和抽取式。
[0003] 模板式生成是业界较为普遍使用的方式,主要是人工设计标题槽位,比如{小区名}{居室数}居。其中{}里的内容是将房屋的属性做一些简单映射,比如房屋的居室数是
“3”,那么可以将之映射为“三”填入,生成的标题为“安宁里南区三居”。
[0004] 抽取式生成主要是从一段文本中提取一部分,常用于标题压缩。比如“日式,精装修,小户型,卧室朝南,安静,不临街”,抽取后变成“精装,南向,不临街”。
[0005] 现有技术中模板式需要人工进行编辑,效率低;而抽取式只实现了对标题的压缩,对于不同用户不具有针对性。

发明内容

[0006] 为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种房源标题的生成方法和装置、存储介质、电子设备。
[0007] 根据本公开实施例的一个方面,提供了一种房源标题的生成方法,包括:
[0008] 基于房源对应的多种房源属性及对应的房源属性值,确定所述房源的房源属性向量;其中,每种所述房源属性对应一个房源属性值;
[0009] 基于用户对应的多种用户属性及对应的用户属性值,确定所述用户的用户属性向量;其中,每种所述用户属性对应一个用户属性值;
[0010] 基于所述房源属性向量和所述用户属性向量,确定所述房源面向所述用户的房源标题。
[0011] 可选地,所述基于所述房源属性向量和所述用户属性向量,确定所述房源面向所述用户的房源标题,包括:
[0012] 基于所述房源属性向量和所述用户属性向量,得到输入向量;
[0013] 基于所述输入向量和所述用户属性向量,利用变分自编码器和解码器,确定所述房源面向所述用户的房源标题。
[0014] 可选地,所述基于所述房源属性向量和所述用户属性向量,得到输入向量,包括:
[0015] 对所述房源属性向量和所述用户属性向量进行维度拼接,得到输入向量。
[0016] 可选地,所述基于所述输入向量和所述用户属性向量,利用变分自编码器和解码器,确定所述房源面向所述用户的房源标题,包括:
[0017] 将所述输入向量输入所述变分自编码器,得到中间向量;
[0018] 将所述中间向量和所述用户属性向量输入所述解码器,将得到文本内容作为所述房源面向所述用户的房源标题。
[0019] 可选地,所述将所述中间向量和所述用户属性向量输入所述解码器,包括:
[0020] 对所述中间向量和所述用户属性向量进行维度拼接,将维度拼接后的向量输入所述解码器。
[0021] 可选地,在基于所述输入向量和所述用户属性向量,利用输入变分自编码器和解码器,确定所述房源面向所述用户的房源标题之前,还包括:
[0022] 利用房源数据集对所述变分自编码器和所述解码器进行联合训练;其中,所述房源数据集中包括多个房源数据,每个所述房源数据包括训练房源、训练用户和所述训练房
源对应所述训练用户的标注标题。
[0023] 可选地,所述基于房源对应的多种房源属性及对应的房源属性值,确定所述房源的房源属性向量,包括:
[0024] 分别对所述房源对应的多种房源属性中的每种房源属性及其对应的房源属性值进行编码,得到多对房源向量对;其中,每对所述房源向量对包括一个房源属性向量和一个
房源属性值向量;
[0025] 对所述多对房源向量对进行处理,得到所述房源的房源属性向量。
[0026] 可选地,每对所述房源向量对中包括的房源属性向量对应的房源属性与所述房源属性值向量对应的房源属性中存在对应关系;
[0027] 所述对所述多对房源向量对进行处理,得到所述房源的房源属性向量,包括:
[0028] 分别将所述多对房源向量对中每对房源向量对中的房源属性向量和房源属性值向量进行维度拼接,得到多个房源拼接向量;
[0029] 对所述多个房源拼接向量进行累加,得到所述房源的房源属性向量。
[0030] 可选地,所述基于用户对应的多种用户属性及对应的用户属性值,确定所述用户的用户属性向量,包括:
[0031] 分别对所述用户对应的多种用户属性中的每种用户属性及其对应的用户属性值进行编码,得到多对用户向量对;其中,每对所述用户向量对包括一个用户属性向量和一个
用户属性值向量;
[0032] 对所述多对用户向量对进行处理,得到所述用户的用户属性向量。
[0033] 可选地,每对所述用户向量对中包括的用户属性向量对应的用户属性与所述用户属性值向量对应的用户属性中存在对应关系;
[0034] 所述对所述多对用户向量对进行处理,得到所述用户的用户属性向量,包括:
[0035] 分别将所述多对用户向量对中每对用户向量对中的用户属性向量和用户属性值向量进行维度拼接,得到多个用户拼接向量;
[0036] 对所述多个用户拼接向量进行累加,得到所述用户的用户属性向量。
[0037] 根据本公开实施例的另一方面,提供了一种房源标题的生成装置,包括:
[0038] 房源向量确定模块,用于基于房源对应的多种房源属性及对应的房源属性值,确定所述房源的房源属性向量;其中,每种所述房源属性对应一个房源属性值;
[0039] 用户向量确定模块,用于基于用户对应的多种用户属性及对应的用户属性值,确定所述用户的用户属性向量;其中,每种所述用户属性对应一个用户属性值;
[0040] 标题生成模块,用于基于所述房源属性向量和所述用户属性向量,确定所述房源面向所述用户的房源标题。
[0041] 可选地,所述标题生成模块,包括:
[0042] 向量处理单元,用于基于所述房源属性向量和所述用户属性向量,得到输入向量;
[0043] 编解码单元,用于基于所述输入向量和所述用户属性向量,利用变分自编码器和解码器,确定所述房源面向所述用户的房源标题。
[0044] 可选地,所述向量处理单元,具体用于对所述房源属性向量和所述用户属性向量进行维度拼接,得到输入向量。
[0045] 可选地,所述编解码单元,具体用于将所述输入向量输入所述变分自编码器,得到中间向量;将所述中间向量和所述用户属性向量输入所述解码器,将得到文本内容作为所
述房源面向所述用户的房源标题。
[0046] 可选地,所述编解码单元在将所述中间向量和所述用户属性向量输入所述解码器时,用于对所述中间向量和所述用户属性向量进行维度拼接,将维度拼接后的向量输入所
述解码器。
[0047] 可选地,所述装置还包括:
[0048] 训练模块,用于利用房源数据集对所述变分自编码器和所述解码器进行联合训练;其中,所述房源数据集中包括多个房源数据,每个所述房源数据包括训练房源、训练用
户和所述训练房源对应所述训练用户的标注标题。
[0049] 可选地,所述房源向量确定模块,包括:
[0050] 第一编码单元,用于分别对所述房源对应的多种房源属性中的每种房源属性及其对应的房源属性值进行编码,得到多对房源向量对;其中,每对所述房源向量对包括一个房
源属性向量和一个房源属性值向量;
[0051] 房源向量处理单元,用于对所述多对房源向量对进行处理,得到所述房源的房源属性向量。
[0052] 可选地,每对所述房源向量对中包括的房源属性向量对应的房源属性与所述房源属性值向量对应的房源属性中存在对应关系;
[0053] 所述房源向量处理单元,具体用于分别将所述多对房源向量对中每对房源向量对中的房源属性向量和房源属性值向量进行维度拼接,得到多个房源拼接向量;对所述多个
房源拼接向量进行累加,得到所述房源的房源属性向量。
[0054] 可选地,所述用户向量确定模块,包括:
[0055] 第二编码单元,用于分别对所述用户对应的多种用户属性中的每种用户属性及其对应的用户属性值进行编码,得到多对用户向量对;其中,每对所述用户向量对包括一个用
户属性向量和一个用户属性值向量;
[0056] 用户向量处理单元,用于对所述多对用户向量对进行处理,得到所述用户的用户属性向量。
[0057] 可选地,每对所述用户向量对中包括的用户属性向量对应的用户属性与所述用户属性值向量对应的用户属性中存在对应关系;
[0058] 所述用户向量处理单元,具体用于分别将所述多对用户向量对中每对用户向量对中的用户属性向量和用户属性值向量进行维度拼接,得到多个用户拼接向量;对所述多个
用户拼接向量进行累加,得到所述用户的用户属性向量。
[0059] 根据本公开实施例的又一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述任一实施例所述的房源标题的生成方
法。
[0060] 根据本公开实施例的还一方面,提供了一种电子设备,所述电子设备包括:
[0061] 处理器;
[0062] 用于存储所述处理器可执行指令的存储器;
[0063] 所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述任一实施例所述的房源标题的生成方法。
[0064] 基于本公开上述实施例提供的一种房源标题的生成方法和装置、存储介质、电子设备,基于房源对应的多种房源属性及对应的房源属性值,确定所述房源的房源属性向量;
其中,每种所述房源属性对应一个房源属性值;基于用户对应的多种用户属性及对应的用
户属性值,确定所述用户的用户属性向量;其中,每种所述用户属性对应一个用户属性值;
基于所述房源属性向量和所述用户属性向量,确定所述房源面向所述用户的房源标题,本
实施例通过结合用户属性向量,实现针对用户偏好的房源标题,并且可针对不同用户偏好
生成不同房源标题,实现个性化的生成房屋标题。
[0065] 下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。

附图说明

[0066] 通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明
书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,
相同的参考标号通常代表相同部件或步骤。
[0067] 图1是本公开一示例性实施例提供的房源标题的生成方法的流程示意图。
[0068] 图2是本公开图1所示的实施例中步骤106的一个流程示意图。
[0069] 图3是本公开另一示例性实施例提供的房源标题的生成方法的流程结构示意图。
[0070] 图4是本公开又一示例性实施例提供的房源标题的生成方法的训练结构示意图。
[0071] 图5是本公开图1所示的实施例中步骤102的一个流程示意图。
[0072] 图6是本公开图1所示的实施例中步骤104的一个流程示意图。
[0073] 图7是本公开一示例性实施例提供的房源标题的生成装置的结构示意图。
[0074] 图8是本公开一示例性实施例提供的电子设备的结构图。

具体实施方式

[0075] 下面,将参考附图详细地描述根据本公开的示例实施例。显然,所描述的实施例仅仅是本公开的一部分实施例,而不是本公开的全部实施例,应理解,本公开不受这里描述的
示例实施例的限制。
[0076] 应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
[0077] 本领域技术人员可以理解,本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺
序。
[0078] 还应理解,在本公开实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
[0079] 还应理解,对于本公开实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
[0080] 另外,本公开中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
另外,本公开中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0081] 还应理解,本公开对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
[0082] 同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
[0083] 以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
[0084] 对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0085] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0086] 本公开实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电
子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:
个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器
的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统、大型计算机系统和
包括上述任何系统的分布式云计算技术环境,等等。
[0087] 终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目
标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计
算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通
信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储
设备的本地或远程计算系统存储介质上。
[0088] 申请概述
[0089] 在实现本公开的过程中,发明人发现,现有技术中,对于文本生成较为普遍使用的方式是模板式生成,该技术方案至少存在以下问题:模板需要人工编辑,并且形式固定。
[0090] 示例性方法
[0091] 图1是本公开一示例性实施例提供的房源标题的生成方法的流程示意图。本实施例可应用在电子设备上,如图1所示,包括如下步骤:
[0092] 步骤102,基于房源对应的多种房源属性及对应的房源属性值,确定房源的房源属性向量。
[0093] 其中,每种房源属性对应一个房源属性值。
[0094] 可选地,每个房源对应多种属性,如:居室数量、面积、房龄等,每种属性分别对应不同的属性值,如:居室数量:3,面积:90;房龄:9等。本实施例中通过与用户相关的多种属
性综合确定房源的房源属性向量,增加了对房源属性的描述,提高了房源标题描述的准确
性。
[0095] 步骤104,基于用户对应的多种用户属性及对应的用户属性值,确定用户的用户属性向量。
[0096] 其中,每种用户属性对应一个用户属性值。
[0097] 可选地,每个用户对应多种属性,如:是否偏好地铁,偏好居室数量等,每种属性分别对应不同的属性值,如:是否偏好地铁:是(可用0、1表示),偏好居室数量:2等;本实施例
通过结合用户属性向量实现对用户有针对性的提供房源标题,提高了用户与房源之间的粘
性。可选地,可通过对用户线上和/或线下的行为获得用户属性及属性值。
[0098] 本实施例中的步骤102和步骤104之间的执行顺序不限,可以先执行步骤102再执行步骤104,也可以现在执行步骤104再执行步骤102,或者同时执行步骤102和步骤104。
[0099] 步骤106,基于房源属性向量和用户属性向量,确定房源面向用户的房源标题。
[0100] 本实施例中,除了利用房源属性向量,还结合了用户属性向量,由于结合了用户属性向量,使确定的面向该用户的房源标题更具针对性,实现个性化标题生成。
[0101] 本公开上述实施例提供的一种房源标题的生成方法,基于房源对应的多种房源属性及对应的房源属性值,确定所述房源的房源属性向量;其中,每种所述房源属性对应一个
房源属性值;基于用户对应的多种用户属性及对应的用户属性值,确定所述用户的用户属
性向量;其中,每种所述用户属性对应一个用户属性值;基于所述房源属性向量和所述用户
属性向量,确定所述房源面向所述用户的房源标题,本实施例通过结合用户属性向量,实现
针对用户偏好的房源标题,并且可针对不同用户偏好生成不同房源标题,实现个性化的生
成房屋标题。
[0102] 如图2所示,在上述图1所示实施例的基础上,步骤106可包括如下步骤:
[0103] 步骤1061,基于房源属性向量和用户属性向量,得到输入向量。
[0104] 可选地,对房源属性向量和用户属性向量进行维度拼接,得到输入向量。
[0105] 本实施例中房源属性向量和用户属性向量分别具有设定维度,例如,房源属性向量维度为10维,用户属性向量为20维,经过维度拼接,得到维度为30维的输出向量。
[0106] 步骤1062,基于输入向量和用户属性向量,利用变分自编码器和解码器,确定房源面向用户的房源标题。
[0107] 本实施例中,利用房源属性向量和用户属性向量确定输入向量,使输入向量中不仅体现了房源的特性,还体现了用户偏好;可选地,在将输入向量和用户属性向量输入到变
分自编码器(VAE模型)和解码器(decoder)时,将输入向量输入变分自编码器得到中间向
量,再将中间向量结合用户属性向量输入到解码器中,在本实施例中,多次结合用户属性向
量,突出了用户偏好在标题生成过程中的重要性。
[0108] 图3是本公开另一示例性实施例提供的房源标题的生成方法的流程结构示意图。如图3所示,获得的房源属性包括3种分别为地铁、居室数和面积,3种属性对应的属性值分
别为:1(表示有地铁),3和105,获得的用户属性包括2种:地铁偏好和居室偏好,2种属性对
应的属性值分别为:1(表示偏好地铁)和3;经过对房源属性和房源属性值进行处理,得到房
源属性向量;对用户属性和属性值进行处理,得到用户属性向量c;将房源属性向量和用户
属性向量c拼接(如:维度拼接等)后输入到变分自编码器(本实施例中应用的是P‑Net网
络),得到潜在变量z(对应上述实施例中的中间变量),对潜在变量z和用户属性向量c进行
拼接后,输入解码器,解码器得到“近地铁,大三居”的文本内容,作为该房源面向该用户的
房源标题。
[0109] 在一些可选的实施例中,步骤1062包括:
[0110] 将输入向量输入变分自编码器,得到中间向量;
[0111] 将中间向量和用户属性向量输入解码器,将得到文本内容作为房源面向用户的房源标题。
[0112] 其中,对中间向量和用户属性向量进行维度拼接,将维度拼接后的向量输入解码器,通过解码器对维度拼接后的向量进行解码,得到一段文字内容,该文字内容即可作为房
源标题。
[0113] 在一些可选的实施例中,在执行步骤1062之前,还可以包括:
[0114] 利用房源数据集对变分自编码器和解码器进行联合训练。
[0115] 其中,房源数据集中包括多个房源数据,每个房源数据包括训练房源、训练用户和训练房源对应训练用户的标注标题。
[0116] 为了提高生成的文本内容的多样性,本实施例中的编码器采用VAE模型(在训练阶段包括P‑Net和R‑Net,在应用时采用P‑Net),图4是本公开又一示例性实施例提供的房源标
题的生成方法的训练结构示意图。如图4所示,本实施例中的房源数据为一一对应的训练房
源和训练用户,利用一个房源数据得到输入向量(对训练房源和训练用户对应的属性和属
性值进行编码得到训练房源向量和训练用户向量c,将训练房源向量和训练用户向量c拼接
后得到输入向量),将输入向量先映射到一个潜在空间,在这个潜在空间里找到一个潜在变
量z,通过这个z影响解码(decoder)过程,得到不同的输出。在训练过程中,假设z满足各向
2 2
同性的高斯分布,所以R‑Net满足qφ(z|x,c)~N(μ,σI),P‑Net满足pθ(z|c)~N(μ′,σ′I)。
其中θ和φ是通过神经网络学习得到的参数,即,P‑Net网络和R‑Net网络中的网络参数,μ和
2
σ表示高斯分布的均值和方差,I表示单位对角矩阵,x表示解码器的输出向量。
[0117] 并且,本实施例中的训练过程中,针对单独的VAE模型由KL散度来描述输入到P‑Net网络和R‑Net网络中两个向量的相似程度,此时,KL散度越小,两个输入向量越相似,如
果单独训练,很容易出现KL散度消逝的问题,本实施例为了保证文案生成流程的基础上实
现多样性(针对不同用户输出的标题不同),对编码器和解码器通过端到端的训练,即,对
VAE模型和解码器(如,RNN网络)联合训练,由于解码器的输入引入了训练用户向量c,实现
强调用户的偏好;以图4中的例子说明,该训练用户对地铁和三居感兴趣,而房子命中属性,
所以生成地铁和居室相关的文案“近地铁,大三居”。在训练过程中,联合训练的损失函数如
公式(1)所示:
[0118]
[0119] 其中,右侧第一项表示编码器的损失(即,KL散度,由于是KL散度越小编码器性能越好,因此带负号),右侧第二项表达解码器的损失,其中,x表示解码器的输出向量,c为训
练用户向量,z为潜在变量(即,编码器输出的向量)。
[0120] 如图5所示,在上述图1所示实施例的基础上,步骤102可包括如下步骤:
[0121] 步骤1021,分别对房源对应的多种房源属性中的每种房源属性及其对应的房源属性值进行编码,得到多对房源向量对。
[0122] 其中,每对房源向量对包括一个房源属性向量和一个房源属性值向量。
[0123] 本实施例将房源属性和房源属性值分别进行编码,例如,通过key和value两个部分共同进行表述房源向量,其中,key表示属性,value表示属性值。对于房源来说,是否有地
铁、居室数目、面积、房龄等都属于房源属性。在模型语义表达上,可选地,每一个key和
value都有各自独立的嵌入词典(embeddingDict)获得其向量表示,最后将key和value的向
量拼接(concat)起来作为房源拼接向量,本实施例中没有使用序列模型是考虑到房屋的属
性是没有先后顺序的而且是相互独立的,所以不需要RNN模型来提取特征。并通过房源向量
对将每种房源属性与其对应的房源属性值进行对应,以提高每种属性与其对应的属性值之
间的关联。
[0124] 步骤1022,对多对房源向量对进行处理,得到房源的房源属性向量。
[0125] 其中,每对房源向量对中包括的房源属性向量对应的房源属性与房源属性值向量对应的房源属性中存在对应关系;可选地,步骤1022包括:分别将多对房源向量对中每对房
源向量对中的房源属性向量和房源属性值向量进行维度拼接,得到多个房源拼接向量;
[0126] 对多个房源拼接向量进行累加,得到房源的房源属性向量。
[0127] 本实施例中,为了通过房源属性向量对房源对应的所有属性和属性值进行体现,首先将每对房源向量对中的房源属性向量和房源属性值向量进行维度拼接,使每种房源属
性与其对应的房源属性值直接关联,实现了对个体房源的个性属性表达;通过将多个房源
拼接向量进行累加,使得到的房源属性向量能够涵盖该房源的所有房源属性和房源属性
值,能够更全面的体现房源的特征,使获得的房源标题与该房源的相关性更强。
[0128] 如图6所示,在上述图1所示实施例的基础上,步骤104可包括如下步骤:
[0129] 步骤1041,分别对用户对应的多种用户属性中的每种用户属性及其对应的用户属性值进行编码,得到多对用户向量对。
[0130] 其中,每对用户向量对包括一个用户属性向量和一个用户属性值向量。
[0131] 本实施例将用户属性和用户属性值分别进行编码,对于用户来说,可选地,通过统计该用户线上及线下的行为,整理得到其画像,如是否偏好地铁房、偏好的房屋居室,并对
得到的用户画像进行编码。例如,通过key和value两个部分共同进行表述用户向量,其中,
key表示属性,value表示属性值。在模型语义表达上,可选地,每一个key和value都有各自
独立的嵌入词典(embeddingDict)获得其向量表示,最后将key和value的向量拼接
(concat)起来作为用户拼接向量,本实施例中没有使用序列模型是考虑到用户的属性是没
有先后顺序的而且是相互独立的,所以不需要RNN模型来提取特征。并通过用户向量对将每
种用户属性与其对应的用户属性值进行对应,以提高每种属性与其对应的属性值之间的关
联。
[0132] 步骤1042,对多对用户向量对进行处理,得到用户的用户属性向量。
[0133] 其中,每对用户向量对中包括的用户属性向量对应的用户属性与用户属性值向量对应的用户属性中存在对应关系;可选地,步骤1042包括:分别将多对用户向量对中每对用
户向量对中的用户属性向量和用户属性值向量进行维度拼接,得到多个用户拼接向量;
[0134] 对多个用户拼接向量进行累加,得到用户的用户属性向量。
[0135] 本实施例中,通过用户属性向量体现了用户的多种偏好,将用户属性向量加入到编码器和解码器中进行处理,提高了生成的房源标题与用户之间的关联性;并且,为了通过
用户属性向量对用户对应的所有属性和属性值进行体现,首先将每对用户向量对中的用户
属性向量和用户属性值向量进行维度拼接,使每种用户属性与其对应的用户属性值直接关
联,实现了对个体用户的个性属性表达;通过将多个用户拼接向量进行累加,使得到的用户
属性向量能够涵盖该用户的所有用户属性和用户属性值,能够更全面的体现用户的特征,
使获得的用户标题与该用户的相关性更强。
[0136] 本公开实施例提供的任一种房源标题的生成方法可以由任意适当的具有数据处理能力的设备执行,包括但不限于:终端设备和服务器等。或者,本公开实施例提供的任一
种房源标题的生成方法可以由处理器执行,如处理器通过调用存储器存储的相应指令来执
行本公开实施例提及的任一种房源标题的生成方法。下文不再赘述。
[0137] 示例性装置
[0138] 图7是本公开一示例性实施例提供的房源标题的生成装置的结构示意图。如图7所示,该实施例装置包括:
[0139] 房源向量确定模块71,用于基于房源对应的多种房源属性及对应的房源属性值,确定房源的房源属性向量。
[0140] 其中,每种房源属性对应一个房源属性值。
[0141] 用户向量确定模块72,用于基于用户对应的多种用户属性及对应的用户属性值,确定用户的用户属性向量。
[0142] 其中,每种用户属性对应一个用户属性值。
[0143] 标题生成模块73,用于基于房源属性向量和用户属性向量,确定房源面向用户的房源标题。
[0144] 本公开上述实施例提供的一种房源标题的生成装置,基于房源对应的多种房源属性及对应的房源属性值,确定所述房源的房源属性向量;其中,每种所述房源属性对应一个
房源属性值;基于用户对应的多种用户属性及对应的用户属性值,确定所述用户的用户属
性向量;其中,每种所述用户属性对应一个用户属性值;基于所述房源属性向量和所述用户
属性向量,确定所述房源面向所述用户的房源标题,本实施例通过结合用户属性向量,实现
针对用户偏好的房源标题,并且可针对不同用户偏好生成不同房源标题,实现个性化的生
成房屋标题。
[0145] 在一些可选的实施例中,标题生成模块73,包括:
[0146] 向量处理单元,用于基于房源属性向量和用户属性向量,得到输入向量;
[0147] 编解码单元,用于基于输入向量和用户属性向量,利用变分自编码器和解码器,确定房源面向用户的房源标题。
[0148] 本实施例中,利用房源属性向量和用户属性向量确定输入向量,使输入向量中不仅体现了房源的特性,还体现了用户偏好;可选地,在将输入向量和用户属性向量输入到变
分自编码器(VAE模型)和解码器(decoder)时,将输入向量输入变分自编码器得到中间向
量,再将中间向量结合用户属性向量输入到解码器中,在本实施例中,多次结合用户属性向
量,突出了用户偏好在标题生成过程中的重要性。
[0149] 可选地,向量处理单元,具体用于对房源属性向量和用户属性向量进行维度拼接,得到输入向量。
[0150] 可选地,编解码单元,具体用于将输入向量输入变分自编码器,得到中间向量;将中间向量和用户属性向量输入解码器,将得到文本内容作为房源面向用户的房源标题。
[0151] 可选地,编解码单元在将中间向量和用户属性向量输入解码器时,用于对中间向量和用户属性向量进行维度拼接,将维度拼接后的向量输入解码器。
[0152] 可选地,本实施例提供的装置还包括:
[0153] 训练模块,用于利用房源数据集对变分自编码器和解码器进行联合训练。
[0154] 其中,房源数据集中包括多个房源数据,每个房源数据包括训练房源、训练用户和训练房源对应训练用户的标注标题。
[0155] 在一些可选的实施例中,房源向量确定模块71,包括:
[0156] 第一编码单元,用于分别对房源对应的多种房源属性中的每种房源属性及其对应的房源属性值进行编码,得到多对房源向量对;其中,每对房源向量对包括一个房源属性向
量和一个房源属性值向量;
[0157] 房源向量处理单元,用于对多对房源向量对进行处理,得到房源的房源属性向量。
[0158] 可选地,每对房源向量对中包括的房源属性向量对应的房源属性与房源属性值向量对应的房源属性中存在对应关系;
[0159] 房源向量处理单元,具体用于分别将多对房源向量对中每对房源向量对中的房源属性向量和房源属性值向量进行维度拼接,得到多个房源拼接向量;对多个房源拼接向量
进行累加,得到房源的房源属性向量。
[0160] 在一些可选的实施例中,用户向量确定模块72,包括:
[0161] 第二编码单元,用于分别对用户对应的多种用户属性中的每种用户属性及其对应的用户属性值进行编码,得到多对用户向量对;其中,每对用户向量对包括一个用户属性向
量和一个用户属性值向量;
[0162] 用户向量处理单元,用于对多对用户向量对进行处理,得到用户的用户属性向量。
[0163] 可选地,每对用户向量对中包括的用户属性向量对应的用户属性与用户属性值向量对应的用户属性中存在对应关系;
[0164] 用户向量处理单元,具体用于分别将多对用户向量对中每对用户向量对中的用户属性向量和用户属性值向量进行维度拼接,得到多个用户拼接向量;对多个用户拼接向量
进行累加,得到用户的用户属性向量。
[0165] 示例性电子设备
[0166] 下面,参考图8来描述根据本公开实施例的电子设备。该电子设备可以是第一设备100和第二设备200中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一
设备和第二设备进行通信,以从它们接收所采集到的输入信号。
[0167] 图8图示了根据本公开实施例的电子设备的框图。
[0168] 如图8所示,电子设备80包括一个或多个处理器81和存储器82。
[0169] 处理器81可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备80中的其他组件以执行期望的功能。
[0170] 存储器82可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储
器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存
储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存
储一个或多个计算机程序指令,处理器81可以运行所述程序指令,以实现上文所述的本公
开的各个实施例的房源标题的生成方法以及/或者其他期望的功能。在所述计算机可读存
储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。
[0171] 在一个示例中,电子设备80还可以包括:输入装置83和输出装置84,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
[0172] 例如,在该电子设备是第一设备100或第二设备200时,该输入装置83可以是上述的麦克风或麦克风阵列,用于捕捉声源的输入信号。在该电子设备是单机设备时,该输入装
置83可以是通信网络连接器,用于从第一设备100和第二设备200接收所采集的输入信号。
[0173] 此外,该输入设备83还可以包括例如键盘、鼠标等等。
[0174] 该输出装置84可以向外部输出各种信息,包括确定出的距离信息、方向信息等。该输出设备84可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设
备等等。
[0175] 当然,为了简化,图8中仅示出了该电子设备80中与本公开有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备80还
可以包括任何其他适当的组件。
[0176] 示例性计算机程序产品和计算机可读存储介质
[0177] 除了上述方法和设备以外,本公开的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述
“示例性方法”部分中描述的根据本公开各种实施例的房源标题的生成方法中的步骤。
[0178] 所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如
Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程
序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软
件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备
或服务器上执行。
[0179] 此外,本公开的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方
法”部分中描述的根据本公开各种实施例的房源标题的生成方法中的步骤。
[0180] 所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电
磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的
例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储
器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘
只读存储器(CD‑ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0181] 以上结合具体实施例描述了本公开的基本原理,但是,需要指出的是,在本公开中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本公开的
各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作
用,而非限制,上述细节并不限制本公开为必须采用上述具体的细节来实现。
[0182] 本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例
而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部
分说明即可。
[0183] 本公开中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到
的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具
有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇
“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使
用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
[0184] 可能以许多方式来实现本公开的方法和装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序
仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特
别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序
包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据
本公开的方法的程序的记录介质。
[0185] 还需要指出的是,在本公开的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。
[0186] 提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义
的一般原理可以应用于其他方面而不脱离本公开的范围。因此,本公开不意图被限制到在
此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
[0187] 为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本公开的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技
术人员将认识到其某些变型、修改、改变、添加和子组合。