基于计算机视觉的户型特征指标自动提取方法及系统转让专利

申请号 : CN202010984201.5

文献号 : CN112232131B

文献日 :

基本信息:

PDF:

法律信息:

相似专利:

发明人 : 陈果刘鹏山冷天杨建兵

申请人 : 云南省设计院集团有限公司

摘要 :

本发明涉及一种基于计算机视觉的户型特征指标自动提取方法及系统,属于住宅设计技术领域。该系统包括采集单元,用于采集住宅户型图片和/或设计文件;图库构建单元,用于将采集来的住宅户型图片、设计文件及其搜索关键字整理归档,构建符合搜索要求的图片库和数据库,作为图库;筛选单元,用于根据待搜索关键字将图库进行分类筛选,得到筛选结果;检索单元,用于将筛选结果反馈给用户,以供用户浏览或下载。通过本发明,设计人员能够在成千上万种户型图中,快速搜索到符合自己要求的户型,成本低,效率高,易于推广应用。

权利要求 :

1.基于计算机视觉的户型特征指标自动提取方法,其特征在于,包括如下步骤:步骤(1),对户型图进行OCR处理,得到其所包含文本和文本位置的列表;

步骤(2),以正则表达式对文本列表进行处理:通过字符匹配得到建筑面积的特征指标,通过字符匹配得到套内面积的特征指标,通过字符匹配得到厅数量、室数量、厨数量、卫数量特征指标,无厨房描述时,默认厨数量为1;

步骤(3),提取所有数值,舍弃小数和小于3位数的值,并将大于5位数的值以“0”字符后第一个非“0”字符为条件进行定位,以此字符左侧为界切片分拆为2个值,其位置参数不变;

如拆分后的值仍大于5位,则继续重复上述过程直至所有值不大于5位;将所有位置值在Y轴或图片上间距差距小于5像素的值相加,所得结果为数值列表,取其中最大值作为面宽的特征指标;

步骤(4),将户型图顺时针旋转90度,重复步骤(1)、(3),再逆时针旋转90度,重复步骤(1)、(3),所得结果为数值列表,取其中最大值作为进深的特征指标;

步骤(5),对户型图进行外轮廓墙体检测和门窗识别,作外轮廓墙体的外接矩形,将外轮廓墙体和门窗投影到对应的矩形边线上;

测量外接矩形四边及每个窗像素长度值,计算出各边窗墙比,用公式表示如下:其中,S为窗墙比,N为窗洞个数,平开门作为墙体统计,阳台栏板作为窗统计,Ci为第i个窗尺寸值,Q为外接矩形边长;

然后,计算出各边采光面系数,用公示表示如下:其中,r为采光面系数,Sx为外接矩形短边窗墙比,Sy为外接矩形长边窗墙比;

采光面的特征指标R为四边采光面系数之和;

步骤(6),获取户型的户型特点特征指标;所述的户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园入户、电梯入户、独立玄关、客厅朝南、主卧朝南、三开间朝南、U形厨房、L形厨房、II形厨房、开放厨房、中西分厨、挑高客厅、高附赠空间、独立餐厅、观景飘窗、观景落地窗。

2.根据权利要求1所述的基于计算机视觉的户型特征指标自动提取方法,其特征在于,2

通过定位建筑面积、建面、平方米、m 字符匹配得到建筑面积的特征指标;通过定位套内面2

积、使用面积、平方米、m字符匹配得到套内面积的特征指标;通过定位×室×厅×卫、x室x厅x卫x厨、x厅x室x卫字符匹配得到厅数量、室数量、厨数量、卫数量的特征指标。

3.根据权利要求1所述的基于计算机视觉的户型特征指标自动提取方法,其特征在于,步骤(5)中,如外轮廓墙体与外接矩形不平行,则按照三角投影方式分别投影到外接矩形的两个边。

4.一种应用于住宅设计行业的户型搜索系统,其特征在于,采用权利要求1‑3任意一项所述的基于计算机视觉的户型特征指标自动提取方法识别关键字并提取特征指标;包括采集单元、图库构建单元、筛选单元和检索单元;

采集单元,用于采集住宅户型图片和/或设计文件;

图库构建单元,与采集单元相连,用于将采集来的住宅户型图片、设计文件及其搜索关键字整理归档,构建符合搜索要求的图片库和数据库,作为图库;

筛选单元,与图库构建单元相连,用于根据待搜索关键字将图库进行分类筛选,得到筛选结果;

检索单元,与筛选单元相连,用于将筛选结果反馈给用户,以供用户浏览或下载。

5.根据权利要求4所述的应用于住宅设计行业的户型搜索系统,其特征在于,图片库为位图格式文件或矢量格式文件;数据库对应图片库中每个文件,记录其各个关键字的特征指标和文件编码,其文件编码指向图片库中唯一文件。

6.根据权利要求4所述的应用于住宅设计行业的户型搜索系统,其特征在于,关键字包括:建筑面积、套内面积、防火设计分类、层数、电梯数量、楼梯数量、每层户数、厅数量、室数量、厨数量、卫数量、面宽、进深、采光面、户型分类、户型特点、户型层数、开发商名称、楼盘名称、容积率、密度、城市、用户评分;每个关键字指向户型图的一到几项特征指标,用于描述其独特属性。

7.根据权利要求4所述的应用于住宅设计行业的户型搜索系统,其特征在于,搜索关键字的特征指标按照以下优先顺序采集:优先在采集户型图时同步获取,其次通过计算机视觉方式识别,当前述方法无法实现时由人工手动输入;通过计算机视觉方式识别的关键字包括:建筑面积、套内面积、电梯数量、楼梯数量、厅数量、室数量、厨数量、卫数量、面宽、进深、采光面、户型特点。

8.根据权利要求4所述的应用于住宅设计行业的户型搜索系统,其特征在于:所述筛选单元以浏览器网页或程序的形式与用户进行互动,获取用户所选择的待搜索关键字;

所述检索单元还包括户评论及评分模块,用于用户对筛选得到的户型图进行评论及评分,并将评论及评分结果保存,以供筛选单元筛选时参考使用。

9.根据权利要求6所述的应用于住宅设计行业的户型搜索系统,其特征在于:所述建筑面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;

所述套内面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;

所述防火设计分类的特征指标包括:单层住宅建筑、多层住宅建筑、二类高层住宅建筑、一类高层住宅建筑、超高层住宅建筑,筛选单元提供以下筛选方式:用户可选择其中一种或多种;

所述层数的特征指标为正整数,筛选单元提供以下筛选方式:用户可自由选择任意正整数数值区间;

所述电梯数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;

所述楼梯数量的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;

所述每层户数的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;

所述厅数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;

所述室数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;

所述厨数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;

所述卫数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;

所述面宽的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;

所述进深的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;

所述采光面的特征指标包括:1短边为采光面,R=1;1长边为采光面,R=3;1短边+1长边为采光面,R=4;2长边为采光面,R=6;2短边为采光面,R=2;2长边+1短边为采光面,R=

7;2短边+1长边为采光面,R=4,4边均为采光面,R=8,筛选单元提供以下筛选方式:用户可选择其中一种或多种;

所述户型分类的特征指标包括:独栋低层住宅、双拼低层住宅、联排低层住宅、叠拼低层住宅、多层洋房、小高层住宅、高层住宅、公寓,筛选单元提供以下筛选方式:用户可选择其中一种或多种;

所述户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园入户、电梯入户、独立玄关、客厅朝南、主卧朝南、三开间朝南、U形厨房、L形厨房、Ⅱ形厨房、开放厨房、中西分厨、挑高客厅、高附赠空间、独立餐厅、观景飘窗、观景落地窗,筛选单元提供以下筛选方式:用户可选择其中一种或多种;

所述户型层数的特征指标包括:平层、跃层、错层、复式,筛选单元提供以下筛选方式:用户可选择其中一种或多种;

所述开发商名称的特征指标为开发商名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;

所述楼盘名称的特征指标为楼盘名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;

所述容积率的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正有理数数值区间;

所述密度的特征指标为小于1的正有理数,筛选单元提供以下筛选方式:用户可选择任意小于1的正有理数数值区间;

所述城市的特征指标为城市名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;

所述用户评分的特征指标为0至5的整数,0为默认值,用户可根据情况对户型作1‑5的评分,筛选单元提供以下筛选方式:用户可选择任意数值区间。

说明书 :

基于计算机视觉的户型特征指标自动提取方法及系统

技术领域

[0001] 本发明属于住宅设计技术领域,具体涉及一种基于计算机视觉的户型特征指标自动提取方法及应用于住宅设计行业的户型搜索系统。

背景技术

[0002] 在勘察设计行业中,设计人员在进行住宅户型设计时,经常会参考现有市场中的项目户型图。其来源主要有三种,一种是设计公司内部多年积累的户型图库,一种是由第三
方公司提供的户型图库,还有一种是互联网中各个楼盘的图片。前两者一般是经过整理的
CAD图,提供建筑面积、居室数量等筛选条件;而互联网中的户型图片则主要是面对购房者
的,不提供针对设计人员的筛选选项。目前并没有成熟的针对应用于住宅设计行业的户型
搜索系统。

发明内容

[0003] 本发明的目的是为了解决现有技术的不足,提供一种基于计算机视觉的户型特征指标自动提取方法及应用于住宅设计行业的户型搜索系统,以便于住宅设计人员能够在成
千上万种户型图中,最快搜索到符合自己要求的户型。
[0004] 为实现上述目的,本发明采用的技术方案如下:
[0005] 基于计算机视觉的户型特征指标自动提取方法,包括如下步骤:
[0006] 步骤(1),对户型图进行OCR处理,得到其所包含文本和文本位置的列表;
[0007] 步骤(2),以正则表达式对文本列表进行处理:通过字符匹配得到建筑面积的特征指标,通过字符匹配得到套内面积的特征指标,通过字符匹配得到厅数量、室数量、厨数量、
卫数量特征指标,无厨房描述时,默认厨数量为1;
[0008] 步骤(3),提取所有数值,舍弃小数和小于3位数的值,并将大于5位数的值以“0”字符后第一个非“0”字符为条件进行定位,以此字符左侧为界切片分拆为2个值,其位置参数
不变;如拆分后的值仍大于5位,则继续重复上述过程直至所有值不大于5位;将所有位置值
在Y轴或图片上间距差距小于5像素的值相加,所得结果为数值列表,取其中最大值作为面
宽的特征指标;
[0009] 步骤(4),将户型图顺时针旋转90度,重复步骤(1)、(3),再逆时针旋转90度,重复步骤(1)、(3),所得结果为数值列表,取其中最大值作为进深的特征指标;
[0010] 步骤(5),对户型图进行外轮廓墙体检测和门窗识别,作外轮廓墙体的外接矩形,将外轮廓墙体和门窗投影到对应的矩形边线上;
[0011] 测量外接矩形四边及每个窗像素长度值,计算出各边窗墙比,用公式表示如下:
[0012]
[0013] 其中,S为窗墙比,N为窗洞个数,平开门作为墙体统计,阳台栏板作为窗统计,Ci为第i个窗尺寸值,Q为外接矩形边长;
[0014] 然后,计算出各边采光面系数,用公示表示如下:
[0015]
[0016] 其中,r为采光面系数,Sx为外接矩形短边窗墙比,Sy为外接矩形长边窗墙比;
[0017] 采光面的特征指标R为四边采光面系数之和;
[0018] 步骤(6),获取户型的户型特点特征指标;所述的户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园
入户、电梯入户、独立玄关、客厅朝南、主卧朝南、三开间朝南、U形厨房、L形厨房、Ⅱ形厨房、
开放厨房、中西分厨、挑高客厅、高附赠空间、独立餐厅、观景飘窗、观景落地窗中的至少一
种。
[0019] 至此,户型特征指标自动提取完毕。
[0020] 进一步,优选的是,通过定位建筑面积、建面、平方米、m2字符匹配得到建筑面积的2
特征指标;通过定位套内面积、使用面积、平方米、m 字符匹配得到套内面积的特征指标;通
过定位x室x厅x卫、x室x厅x卫x厨、x厅x室x卫字符匹配得到厅数量、室数量、厨数量、卫数量
的特征指标。
[0021] 进一步,优选的是,步骤(5)中,如外轮廓墙体与外接矩形不平行,则按照三角投影方式分别投影到外接矩形的两个边。
[0022] 本发明同时提供一种应用于住宅设计行业的户型搜索系统,包括采集单元、图库构建单元、筛选单元和检索单元;
[0023] 采集单元,用于采集住宅户型图片和/或设计文件;
[0024] 图库构建单元,与采集单元相连,用于将采集来的住宅户型图片、设计文件及其搜索关键字整理归档,构建符合搜索要求的图片库和数据库,作为图库;
[0025] 筛选单元,与图库构建单元相连,用于根据待搜索关键字将图库进行分类筛选,得到筛选结果;
[0026] 检索单元,与筛选单元相连,用于将筛选结果反馈给用户,以供用户浏览或下载。
[0027] 进一步,优选的是,图片库为位图格式文件或矢量格式文件;数据库对应图片库中每个文件,记录其各个关键字的特征指标和文件编码,其文件编码指向图片库中唯一文件。
[0028] 进一步,优选的是,关键字包括:建筑面积、套内面积、防火设计分类、层数、电梯数量、楼梯数量、每层户数、厅数量、室数量、厨数量、卫数量、面宽、进深、采光面、户型分类、户
型特点、户型层数、开发商名称、楼盘名称、容积率、密度、城市、用户评分;每个关键字指向
户型图的一到几项特征指标,用于描述其独特属性。
[0029] 进一步,优选的是,搜索关键字的特征指标按照以下优先顺序采集:优先在采集户型图时同步获取,其次通过计算机视觉方式识别,当前述方法无法实现时由人工手动输入;
通过计算机视觉方式识别的关键字包括:建筑面积、套内面积、电梯数量、楼梯数量、厅数
量、室数量、厨数量、卫数量、面宽、进深、采光面、户型特点。
[0030] 进一步,优选的是,所述的应用于住宅设计行业的户型搜索系统,是采用上述基于计算机视觉的户型特征指标自动提取方法识别关键字并提取特征指标。
[0031] 进一步,优选的是,所述筛选单元以浏览器网页或程序的形式与用户进行互动,获取用户所选择的待搜索关键字;
[0032] 所述检索单元还包括户评论及评分模块,用于用户对筛选得到的户型图进行评论及评分,并将评论及评分结果保存,以供筛选单元筛选时参考使用。
[0033] 进一步,优选的是,所述建筑面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0034] 所述套内面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0035] 所述防火设计分类的特征指标包括:单层住宅建筑、多层住宅建筑、二类高层住宅建筑、一类高层住宅建筑、超高层住宅建筑,筛选单元提供以下筛选方式:用户可选择其中
一种或多种;
[0036] 所述层数的特征指标为正整数,筛选单元提供以下筛选方式:用户可自由选择任意正整数数值区间;
[0037] 所述电梯数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
[0038] 所述楼梯数量的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0039] 所述每层户数的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0040] 所述厅数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
[0041] 所述室数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
[0042] 所述厨数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
[0043] 所述卫数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
[0044] 所述面宽的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0045] 所述进深的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0046] 所述采光面的特征指标包括:1短边为采光面,R=1;1长边为采光面,R=3;1短边+1长边为采光面,R=4;2长边为采光面,R=6;2短边为采光面,R=2;2长边+1短边为采光面,
R=7;2短边+1长边为采光面,R=4,4边均为采光面,R=8,筛选单元提供以下筛选方式:用
户可选择其中一种或多种;
[0047] 所述户型分类的特征指标包括:独栋低层住宅、双拼低层住宅、联排低层住宅、叠拼低层住宅、多层洋房、小高层住宅、高层住宅、公寓,筛选单元提供以下筛选方式:用户可
选择其中一种或多种;
[0048] 所述户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园入户、电梯入户、独立玄关、客厅朝南、主卧
朝南、三开间朝南、U形厨房、L形厨房、Ⅱ形厨房、开放厨房、中西分厨、挑高客厅、高附赠空
间、独立餐厅、观景飘窗、观景落地窗,筛选单元提供以下筛选方式:用户可选择其中一种或
多种;
[0049] 所述户型层数的特征指标包括:平层、跃层、错层、复式,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
[0050] 所述开发商名称的特征指标为开发商名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
[0051] 所述楼盘名称的特征指标为楼盘名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
[0052] 所述容积率的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正有理数数值区间;
[0053] 所述密度的特征指标为小于1的正有理数,筛选单元提供以下筛选方式:用户可选择任意小于1的正有理数数值区间;
[0054] 所述城市的特征指标为城市名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
[0055] 所述用户评分的特征指标为0至5的整数,0为默认值,用户可根据情况对户型作1‑5的评分,筛选单元提供以下筛选方式:用户可选择任意数值区间。
[0056] 本发明优选,依据ZL201810023786.7《户型特征的自动提取方法、系统、电子设备和存储介质》来提取户型的户型特点特征指标。
[0057] 本发明所述的图片库是户型图载体,为JPG、PNG等位图格式文件或CAD、BIM等矢量格式文件。
[0058] 本发明采集的住宅户型图片和/或设计文件来源于公开信息、公司内部整理信息、购买自其他公司信息以及其他经合法方式取得的信息,需要去除其中完全重复的内容,去
除其中完全重复的内容的方式本发明不做限制,可以采用经电子计算机编程或人工复核方
式甄别去除。采集单元可以为实时采集,实时更新图库内容,也可以是定期采集,定期更新
图库内容。
[0059] 本发明中,所述搜索关键字是以住宅设计角度建立的、可从各个维度描述住宅户型特征的关键字。
[0060] 本发明中,优选开发商名称筛选时,提供全国前十强开发商,本省前十强开发商等特定选择集。
[0061] 本发明中,多层住宅建筑(建筑高度小于等于27m);小高层住宅建筑(建筑高度大于27m且小于等于33m);二类高层住宅建筑(建筑高度大于33m且小于等于54m);一类高层住
宅建筑(建筑高度大于54m且小于等于100m);超高层住宅建筑(建筑高度大于100m)的防火
设计是依据《建筑设计防火规范》GB 50016‑2014(2018年版)和《住宅设计规范》GB 50096‑
2011相关内容,并随规范更新而调整。
[0062] 本发明与现有技术相比,其有益效果为:
[0063] 本发明通过将户型图库中的内容与筛选单元相关联,通过其总共23个维度的关键字,囊括了户型设计中几乎所有的指标,使设计人员能在最短的时间内获取到自己需要的
户型图。同时,此系统也可由开发商或第三方信息中介提供给购房者,使后者能更有针对性
地得到自己心仪楼盘户型的信息并作出选择。
[0064] 住宅户型设计千变万化,即使是同样面积的户型,由于设计条件或理念不同(如面宽受限,层数不同,或需要追求尽可能多的房间数等等),也会有成百上千种实现方式。但目
前市场种现有的户型参考库,大多只提供一到数种分类方法(如建筑面积、厅室数量)进行
筛选。以平均每次筛选留下上次结果的20%样本,筛选3次计算,最终结果为总样本数的
0.8%,如有100万个样本,仍然剩下8000个需要人工浏览确认,难以有效地剔除无关户型;
而使用本发明中的方法,即使只使用23个关键字中的10个,同样是100万个样本,理论上最
终只剩下0.1024个样本(即表示筛选维度仍然过剩),即使户型设计日新月异,也能在将来
很长一段时间内满足筛选需求。本发明可有效改变现在样本少时不堪使用,样本多时又挑
花了眼的鸡肋局面,使采用户型库进行参考设计能成为一种有力的选择。

附图说明

[0065] 图1是本发明应用于住宅设计行业的户型搜索系统的结构示意图;
[0066] 图2是使用本发明应用于住宅设计行业的户型搜索系统的流程图;
[0067] 图3为本发明应用实例中OCR处理图片;
[0068] 图4是本发明应用实例中采光面特征指标的计算示意图。

具体实施方式

[0069] 下面结合实施例对本发明作进一步的详细描述。
[0070] 本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件
或者按照产品说明书进行。所用材料或设备未注明生产厂商者,均为可以通过购买获得的
常规产品。
[0071] 本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措
辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加
一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元
件被“连接”到另一元件时,它可以直接连接到其他元件,或者也可以存在中间元件。此外,
这里使用的“连接”可以包括无线连接。这里使用的措辞“和/或”包括一个或更多个相关联
的列出项的任一单元和全部组合。
[0072] 在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。术语“内”、“上”、“下”等指示的方位或状态关系为基于附图所示的方位或状态关系,仅是为了便于描
述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定
的方位构造和操作,因此不能理解为对本发明的限制。
[0073] 在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“连接”、“设有”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可
以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本
领域的普通技术人员而言,根据具体情况理解上述术语在本发明中的具体含义。
[0074] 本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该
理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意
义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
[0075] 基于计算机视觉的户型特征指标自动提取方法,包括如下步骤:
[0076] 步骤(1),对户型图进行OCR处理,得到其所包含文本和文本位置的列表;
[0077] 步骤(2),以正则表达式对文本列表进行处理:通过字符匹配得到建筑面积的特征指标,通过字符匹配得到套内面积的特征指标,通过字符匹配得到厅数量、室数量、厨数量、
卫数量特征指标,无厨房描述时,默认厨数量为1;
[0078] 步骤(3),提取所有数值,舍弃小数和小于3位数的值,并将大于5位数的值以“0”字符后第一个非“0”字符为条件进行定位,以此字符左侧为界切片分拆为2个值,其位置参数
不变;如拆分后的值仍大于5位,则继续重复上述过程直至所有值不大于5位;将所有位置值
在Y轴或图片上间距差距小于5像素的值相加,所得结果为数值列表,取其中最大值作为面
宽的特征指标;
[0079] 步骤(4),将户型图顺时针旋转90度,重复步骤(1)、(3),再逆时针旋转90度,重复步骤(1)、(3),所得结果为数值列表,取其中最大值作为进深的特征指标;
[0080] 步骤(5),对户型图进行外轮廓墙体检测和门窗识别,作外轮廓墙体的外接矩形,将外轮廓墙体和门窗投影到对应的矩形边线上;
[0081] 测量外接矩形四边及每个窗像素长度值,计算出各边窗墙比,用公式表示如下:
[0082]
[0083] 其中,S为窗墙比,N为窗洞个数,平开门作为墙体统计,阳台栏板作为窗统计,Ci为第i个窗尺寸值,Q为外接矩形边长;
[0084] 然后,计算出各边采光面系数,用公示表示如下:
[0085]
[0086] 其中,r为采光面系数,Sx为外接矩形短边窗墙比,Sy为外接矩形长边窗墙比;
[0087] 采光面的特征指标R为四边采光面系数之和;
[0088] 步骤(6),获取户型的户型特点特征指标;所述的户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园
入户、电梯入户、独立玄关、客厅朝南、主卧朝南、三开间朝南、U形厨房、L形厨房、Ⅱ形厨房、
开放厨房、中西分厨、挑高客厅、高附赠空间、独立餐厅、观景飘窗、观景落地窗。至此,户型
特征指标自动提取完毕。
[0089] 其中,优选,通过定位建筑面积、建面、平方米、m2字符匹配得到建筑面积的特征指2
标;通过定位套内面积、使用面积、平方米、m字符匹配得到套内面积的特征指标;通过定位
x室x厅x卫、x室x厅x卫x厨、x厅x室x卫字符匹配得到厅数量、室数量、厨数量、卫数量的特征
指标。
[0090] 优选,步骤(5)中,如外轮廓墙体与外接矩形不平行,则按照三角投影方式分别投影到外接矩形的两个边。
[0091] 一种应用于住宅设计行业的户型搜索系统,包括采集单元101、图库构建单元102、筛选单元103和检索单元104;
[0092] 采集单元101,用于采集住宅户型图片和/或设计文件;
[0093] 图库构建单元102,与采集单元101相连,用于将采集来的住宅户型图片、设计文件及其搜索关键字整理归档,构建符合搜索要求的图片库和数据库,作为图库;
[0094] 筛选单元103,与图库构建单元102相连,用于根据待搜索关键字将图库进行分类筛选,得到筛选结果;
[0095] 检索单元104,与筛选单元103相连,用于将筛选结果反馈给用户,以供用户浏览或下载。
[0096] 优选,图片库为位图格式文件或矢量格式文件;数据库对应图片库中每个文件,记录其各个关键字的特征指标和文件编码,其文件编码指向图片库中唯一文件。
[0097] 优选,关键字包括:建筑面积、套内面积、防火设计分类、层数、电梯数量、楼梯数量、每层户数、厅数量、室数量、厨数量、卫数量、面宽、进深、采光面、户型分类、户型特点、户
型层数、开发商名称、楼盘名称、容积率、密度、城市、用户评分;每个关键字指向户型图的一
到几项特征指标,用于描述其独特属性。
[0098] 优选,搜索关键字的特征指标按照以下优先顺序采集:优先在采集户型图时同步获取,其次通过计算机视觉方式识别,当前述方法无法实现时由人工手动输入;通过计算机
视觉方式识别的关键字包括:建筑面积、套内面积、电梯数量、楼梯数量、厅数量、室数量、厨
数量、卫数量、面宽、进深、采光面、户型特点。
[0099] 优选,所述的应用于住宅设计行业的户型搜索系统,是采用上述基于计算机视觉的户型特征指标自动提取方法识别关键字并提取特征指标。
[0100] 优选,所述筛选单元103以浏览器网页或程序的形式与用户进行互动,获取用户所选择的待搜索关键字;
[0101] 所述检索单元104还包括户评论及评分模块,用于用户对筛选得到的户型图进行评论及评分,并将评论及评分结果保存,以供筛选单元筛选时参考使用;更为优选,用户评
分为0~5,满意度越高分值越大,默认为0分。
[0102] 优选,所述建筑面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0103] 所述套内面积的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0104] 所述防火设计分类的特征指标包括:单层住宅建筑、多层住宅建筑、二类高层住宅建筑、一类高层住宅建筑、超高层住宅建筑,筛选单元提供以下筛选方式:用户可选择其中
一种或多种;
[0105] 所述层数的特征指标为正整数,筛选单元提供以下筛选方式:用户可自由选择任意正整数数值区间;
[0106] 所述电梯数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
[0107] 所述楼梯数量的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0108] 所述每层户数的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0109] 所述厅数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
[0110] 所述室数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
[0111] 所述厨数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
[0112] 所述卫数量的特征指标为非负整数,筛选单元提供以下筛选方式:用户可选择任意非负整数数值区间;
[0113] 所述面宽的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0114] 所述进深的特征指标为正整数,筛选单元提供以下筛选方式:用户可选择任意正整数数值区间;
[0115] 所述采光面的特征指标包括:1短边为采光面,R=1;1长边为采光面,R=3;1短边+1长边为采光面,R=4;2长边为采光面,R=6;2短边为采光面,R=2;2长边+1短边为采光面,
R=7;2短边+1长边为采光面,R=4,4边均为采光面,R=8,筛选单元提供以下筛选方式:用
户可选择其中一种或多种;
[0116] 所述户型分类的特征指标包括:独栋低层住宅、双拼低层住宅、联排低层住宅、叠拼低层住宅、多层洋房、小高层住宅、高层住宅、公寓,筛选单元提供以下筛选方式:用户可
选择其中一种或多种;
[0117] 所述户型特点包括:南北通透、明厨明卫、动静分区、带储物间、带衣帽间、带地下室、带露台、带屋顶花园、景观阳台、双阳台、花园入户、电梯入户、独立玄关、客厅朝南、主卧
朝南、三开间朝南、U形厨房、L形厨房、Ⅱ形厨房、开放厨房、中西分厨、挑高客厅、高附赠空
间、独立餐厅、观景飘窗、观景落地窗,筛选单元提供以下筛选方式:用户可选择其中一种或
多种;
[0118] 所述户型层数的特征指标包括:平层、跃层、错层、复式,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
[0119] 所述开发商名称的特征指标为开发商名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
[0120] 所述楼盘名称的特征指标为楼盘名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
[0121] 所述容积率的特征指标为正有理数,筛选单元提供以下筛选方式:用户可选择任意正有理数数值区间;
[0122] 所述密度的特征指标为小于1的正有理数,筛选单元提供以下筛选方式:用户可选择任意小于1的正有理数数值区间;
[0123] 所述城市的特征指标为城市名称文本,筛选单元提供以下筛选方式:用户可选择其中一种或多种;
[0124] 所述用户评分的特征指标为0至5的整数,0为默认值,用户可根据情况对户型作1‑5的评分,筛选单元提供以下筛选方式:用户可选择任意数值区间。
[0125] 具体实现中,本发明实施例中描述的终端包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的其它便
携式设备。还应当理解的是,在某些实施例中,所述设备并非便携式通信设备,而是具有触
摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
[0126] 应用实例
[0127] 某用户希望搜索54米高度,2梯3户,3室2厅1厨1卫,建筑面积为105平方米的中户型,在终端设备输入如下:建筑面积:100‑110平方米,防火设计分类:二类高层住宅建筑,电
梯数量:2部,楼梯数量:1部,每层户数:3户,厅数量:2,室数量:3,厨数量:1,卫数量:1,采光
面:1长边,户型分类:高层住宅,户型层数:平层,开发商:全国前十强开发商,用户评分:4分
及以上。筛选单元根据用户输入信息,筛选后将筛选结果提交检索单元。用户可在此结果基
础上更改或补充条件,如输入:建筑面积:103‑108平方米,城市:北京,以进一步得到更符合
需求的筛选结果。
[0128] 所述检索单元,用于将上一步得到的筛选结果反馈给用户,以供用户浏览或下载。
[0129] 本实例中,所述检索单元得到了所有符合要求的结果,用户可逐一浏览,或选择其中部分或全部文件下载,并可对其进行评分及评论。
[0130] 本发明中户型特征指标自动提取过程如下:
[0131] 步骤(1),对图3进行OCR处理,得到其所包含文本和文本位置的列表如下:
[0132] 序号内容
[0133] 1 12200
[0134] 宽度:35高度:16
[0135] 左间距:298上间距:9
[0136] 2 1300
[0137] 宽度:47高度:21
[0138] 左间距:70上间距:32
[0139] 3 3000
[0140] 宽度:27高度:14
[0141] 左间距:161上间距:34
[0142] 4 2400
[0143] 宽度:29高度:14
[0144] 左间距:275上间距:34
[0145] 5 2800
[0146] 宽度:28高度:14
[0147] 左间距:386上间距:34
[0148] 6 2700
[0149] 宽度:27高度:14
[0150] 左间距:503上间距:34
[0151] 7阳台
[0152] 宽度:38高度:26
[0153] 左间距:216上间距:114
[0154] 8卧室
[0155] 宽度:38高度:26
[0156] 左间距:158上间距:201
[0157] 9厨房
[0158] 宽度:38高度:25
[0159] 左间距:268上间距:198
[0160] 10卧室
[0161] 宽度:39高度:25
[0162] 左间距:408上间距:215
[0163] 11卫
[0164] 宽度:17高度:24
[0165] 左间距:513上间距:320
[0166] 12餐厅
[0167] 宽度:39高度:25
[0168] 左间距:306上间距:381
[0169] 13卫
[0170] 宽度:17高度:24
[0171] 左间距:513上间距:396
[0172] 14卫
[0173] 宽度:18高度:24
[0174] 左间距:94上间距:492
[0175] 15主卧
[0176] 宽度:37高度:24
[0177] 左间距:466上间距:521
[0178] 16起居室
[0179] 宽度:58高度:26
[0180] 左间距:275上间距:566
[0181] 17卧室
[0182] 宽度:39高度:27
[0183] 左间距:118上间距:600
[0184] 18阳台
[0185] 宽度:38高度:25
[0186] 左间距:240上间距:696
[0187] 19 8
[0188] 宽度:14高度:27
[0189] 左间距:650上间距:702
[0190] 20 3300
[0191] 宽度:29高度:17
[0192] 左间距:113上间距:802
[0193] 21 5100
[0194] 宽度:29高度:16
[0195] 左间距:291上间距:802
[0196] 22 3800
[0197] 宽度:28高度:16
[0198] 左间距:480上间距:803
[0199] 23 12200
[0200] 宽度:35高度:16
[0201] 左间距:299上间距:833
[0202] 24 4室2厅1厨3卫建筑面积约148平方米
[0203] 宽度:356高度:27
[0204] 左间距:135上间距:871
[0205] 步骤(2),通过字符匹配得到建筑面积特征指标为“148”,得到厅数量、室数量、厨数量、卫数量特征指标分别为“4,2,1,3”;
[0206] 步骤(3),提取所有数值,并计算后可得面宽特征指标为“12200”;
[0207] 步骤(4),将户型图顺时针旋转90度,重复步骤(1)、(3),再逆时针旋转90度,重复步骤(1)、(3),提取所有数值,并计算后可得面宽特征指标为“15500”;
[0208] 步骤(5),采光面特征指标的计算示例如图3所示,具体计算方法如下:
[0209] 外接矩形两个长边Qy的窗墙比分别为:Sy1=0;
[0210] Sy2=(Cy1+Cy2+Cy3+Cy4+Cy5)/Qy;
[0211] 外接矩形两个短边Qx的窗墙比分别为:
[0212] Sx1=(Cx3+Cx4+Cx5)/Qx;
[0213] Sx2=(Cx1+Cx2)/Qx;
[0214] 四个边的r值分别为0,3,1,1,
[0215] R=0+3+1+1=5,特征指标为2短边+1长边。
[0216] 步骤(6)根据发明专利ZL201810023786.7《户型特征的自动提取方法、系统、电子设备和存储介质》,提供一种户型特征的自动提取方法、系统、电子设备和存储介质,自动提
取方法包括:读取目标户型图像的矢量信息;将所述目标户型图像的矢量信息输入预设的
户型特征提取模型中,得到对应所述目标户型图像的特征标签,其中,所述户型特征提取模
型中存储有各矢量信息与特征标签之间的一一对应关系;根据预设的评分规则,对所述目
标户型图像的各个特征标签进行打分,并统计所述目标户型图像的全部特征标签的分数,
得到所述目标户型图像的总评分;以及,输出所述目标户型图像的特征标签及总评分。本发
明能够高效、准确且自动地提取户型的各种特征,进而能够有效降低人力和时间成本。
[0217] 以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本
发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变
化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其
等效物界定。