收录1亿套房源的楼盘字典:贝壳找房真房源管理的基础与前提
收录1亿套房源的楼盘字典:贝壳找房真房源管理的基础与前提
秋田
相当长的一段时间里,你在一些房地产信息平台搜寻房源的时候,可能会看到北京一套100平方米的房子,标价50万元,这会吸引你点击浏览房源信息,进一步会拨打经纪人在房源页面上留下的电话询问究竟,很可能经纪人会向你推荐另外一些房源。
但在贝壳找房平台,尽管容纳了数以百万计的在售在租房源,但是根本没有虚假信息的生存土壤,利用平台的数据、技术和信用管理,抑制了商家和经纪人录入虚假房源的动机。
“经纪人可以在一些房地产信息平台杜撰、虚构一套根本不存在的房源,但是在贝壳找房,通过楼盘字典,必须对应到房源地址,这是最初流程的审查,审查过后会进入真房源管理流程。”贝壳找房平台规则中心高级总监胡景阳说,“贝壳找房平台上录入房源,北京一套100平方米的房子,标价50万元,估价识别会发现异常,拦截了房源的录入,并且会在7×24小时循环监测管理。”
收录1亿套房源的楼盘字典
楼盘字典,既是贝壳找房平台上全生命周期的真房源验真系统的起点和基础,也是对全国的房屋进行的一次“人口普查”。
链家从2008年即已开始打造楼盘字典,彼时并没有真房源或用户体验的概念,当时的想法,是为了链家的业务战略和内部效率的提升,首先必须掌握各个城市有多少房子。这意味着楼盘字典一开始只是为了服务内部管理打造的一套系统。
到今天,经过十年时间的发展和积累,楼盘字典已经收录了全国135个城市、25万个小区、230万栋楼,共计1亿零400万套房子,而且,每天收录的房源还在以50万套的数量递增。
基于贝壳找房平台战略,楼盘字典也会面向行业开放,预计到2018年底,楼盘字典会进入到更多的城市,大致盘点全国2亿套房源,覆盖到全国300多个城市及下辖的2000多个县城。楼盘字典还计划在将来描绘出500万张户型图,大致描述出全国2亿套房子的基本结构和面积,因为根据贝壳找房的估算,全国每40套房子的户型和面积基本一致。
楼盘字典过去十年间,对房源已经实现了46类实体管理,除了房子内部的面积、户型、朝向、窗户等信息,现在还包括房子的周边信息,比如地铁、医院、公园、学校、商场等,楼盘字典要用433个维度和字段来描述一套房子,它是一系列关系到用户买房、租房产生决策的指标。
楼盘字典相当于让全国300多个城市的每一套房子都拥有一张身份证,无论客户买房、租房或装修,都会关联到楼盘字典建立的房源身份证,它支持了贝壳找房内部的各个业务线,相当于贝壳的一种官方数据语言。
“链家、德佑、自如、万链、租赁、社区服务等业务,都会与楼盘字典的房源ID关联,建立房源‘身份证’以后,才能够实现贝壳找房平台上所有房源信息的统一,以后任何一套贝壳找房平台上房源的前世今生,都会产生记录,这会降低平台内部的交互成本,随着贝壳找房平台的开放,楼盘字典不仅会成为贝壳找房的基础语言,我们希望它也可以成为整个行业的基础语言。”贝壳找房不动产数据中心总经理白智广说。
楼盘字典现在已经收录1亿多套房屋数据,从1.0版本升级到了4.0版本,中间经历了团队成员拿着笔和纸记录房源数据人工记录阶段,之后慢慢升级到手持GPS和照相机采集数据,数据质量得以提升,但由于无法支持APP上传,通过PC端整理、上传和后台审核的效率仍然非常低下。