数字街道数据
文章

数字街道数据

自由和私有

近年来,对免费空间数据的强烈需求提高了互联网上志愿地理信息(VGI)的可用性。在旅行计划等大型项目中使用VGI意味着对质量评估的需求越来越大。虽然销售数字街道地图的商业数据提供商提供了一定程度的质量保证,但VGI门户网站没有纳入质量监管措施。作者们比较了佛罗里达州免费提供的和私有的街道网络数据的完整性,并在美国和德国选择了一些城市。

Web 2.0和全球定位系统(GPS)的发展及其与移动电话、摄影相机和其他移动设备的集成,使网络社区成员能够进行交互,向中心站点提供信息,从而成为地理信息的重要来源。VGI可以在各种web服务和其他数字数据源中找到。VGI的典型例子包括维基百科中的地理标记条目,维基百科中的位置描述,以及Flickr和Panoramio中的照片。过去七年来,在开放街道地图(OSM)项目的志愿者合作活动中,免费收集了街道数据,并在一定许可条件下提供。


由于VGI主要由非专业人员提供,通常缺乏经验或培训,没有遵循协议或标准,所以VGI数据的质量可能低于公共管理或商业数据集。因此,对VGI的质量检查对于地理空间应用中使用的数据特别重要。对于将专业组织提供的数据与志愿者协作提供的数据结合起来的数据收集来说,情况也是如此。这种混合血统的一个例子是美国人口普查TIGER/Line数据与美国OSM数据的整合。

数据质量
地理数据的质量,特别是VGI,在过去的几年里已经成为一个重要的研究课题。最成功的VGI项目之一OpenStreetMap的质量已经在一些欧洲国家进行了测试。例如,数据完整性,位置精度,属性精度,和参与不平等的OSM数据在英国和德国的选择地区进行了检查。


欧洲国家自愿提供VGI数据收集工作的主要动机是,地理空间数据层(如土地使用或街道数据)通常不是由机构免费提供的。因此,各种地理空间数据库需要从零开始,贡献者将通过他们的个人贡献看到数据层的显著增长。这种动机在美国可能没有那么强烈,在美国,选定的基准面已经通过联邦机构公开,如美国人口普查局(如TIGER/Line数据)或美国地质调查局(如数字线形图数据)。考虑到美国和欧洲的这些不同政策,分析美国和欧洲社区对街道数据的贡献水平是否也不同,以及不同国家不同数据源之间的总体街道长度如何变化是很有意义的。

分析数据集
虽然美国机构提供免费的街道数据集,但也有各种各样的商业数据提供商向付费客户提供专有数据集。我们使用了NAVTEQ和TeleAtlas这两家主要公司的数据,并将这些商业数据的完整性与免费提供的TIGER/Line和OSM数据进行了比较。


必须指出的是,以下分析的结果显示了四个可用数据集之间的总体街道长度的相对比较,但没有揭示的是网络数据相对于真实世界(ground truth)的绝对完整性。然而,我们分析的两个商业数据集,即NAVTEQ NAVSTREETS和Tele Atlas multiet街道数据,被广泛应用于商业应用,如GPS汽车导航系统。因此,它们可以作为比较的相对参考,特别是在导航任务方面。除了街道几何外,这四个数据集都提供了更广泛的特征类别,如交通信号,这里不作进一步讨论。

数据完整性
我们通过比较来自不同数据提供者的网格单元的总道路长度来确定道路网络的相对完整性。每个网格单元的总街道长度的差异表明一个数据集比另一个数据集更完整。我们将这种方法应用于佛罗里达州的一个1平方公里网格。在这样一个网格中,长度差异的可视化允许识别数据集之间完整性的局部变化。图1显示了佛罗里达州的OSM和TeleAtlas数据之间的差异,计算方法为OSM的街道长度减去TeleAtlas在1平方公里网格单元中的街道长度。负值(显示为橙色)表示商业数据集的覆盖率更高,正如在大多数城市地区所发现的那样。在OSM数据中也有街道密度较高的区域(绿色),如Gainesville区域(圈)。在图2中可以看到类似的结果,在图2中,NAVTEQ在城市地区(红色)的数据覆盖强于在农村地区街道密度(绿色)的OSM。

结果在上下文中
这些结果为美国OSM数据集给出的街道覆盖模式提供了新的见解。与在英国和德国观察到的OSM覆盖模式相比,与商业数据集相比,OSM数据覆盖在农村地区通常高于城市地区。OSM在农村地区的良好覆盖效果不是由于用户贡献,而是主要由于TIGER/Line的导入。这是因为TIGER/Line包含的数据比那些不导入任何TIGER/Line街道数据的商业数据提供商提供的数据更多,尤其是农业地区的数据。

尽管与商业数据集相比,OSM在城市地区的覆盖率较低,但通过对OSM和TIGER数据的比较,可以发现在一些城市地区,网络社区积极收集OSM数据,特别是街道和行人区。图3显示了旧金山的TIGER/Line街道网络,用黑色表示,红色表示附加的OSM行人区段。

我们还可以比较整个城市的街道长度。图4(上)显示了美国五个城市的整个城市街道网络中所有使用的街道类型的总长度,包括汽车/行人可达的部分和行人仅可达的部分。对于美国城市来说,这四家数据提供商之间的街道长度差异很小,没有哪家数据提供商在覆盖范围上明显占据主导地位。芝加哥TIGER/Line的总长度值稍高是TIGER/Line的一个特定分类方案的结果,该方案将采石场等工业区的私人街道也划分为当地街区和农村街道。在德国的城市中可以发现一个更明显的模式,在那里,OSM的总长度明显高于TeleAtlas (NAVTEQ无法用于比较)。科隆13%和慕尼黑44%的总长度差异(图4,下)。造成这种差异的原因是,与美国城市相比,德国城市明显有大量的小巷和人行道,而且OSM社区更加活跃。

结束语
正如这两张佛罗里达地图所显示的那样,就其完整性而言,美国的OpenStreetMap数据具有很强的异质性。在农村和城市地区之间观察到显著的差异,但与欧洲测试结果所显示的模式截然不同。然而,在美国城市,所有数据提供商的整体细分长度是相似的。这可以解释为,尽管商业数据更好地覆盖了城市地区,但城市总长度的计算是基于每个城市所在的整个县,因此包括了来自农村和城市地区的长度计算。


一些用户用大量已经免费可用的数据集来解释美国普遍较低的OSM活动水平。然而,分析也表明,近几个月来,在一些城市,如旧金山,OSM有了显著的发展。

确认
这组作者感谢NAVTEQ和Tele Atlas慷慨地提供了美国样本数据集。

进一步的阅读

- Flanagin, A.J.和Metzger, M., 2008。志愿地理信息的可信度。GeoJournal72 (3), pp137 - 148。——古德柴尔德,m.f., 2007。市民作为传感器:志愿地理的世界。GeoJournal, (69), pp211 - 221。

——哈克雷,M., 2010。志愿地理信息有多好?开放地图与军情测量数据集的比较研究。环境与规划乙:规划设计, Vol. 37, 4, pp682 - 703。

- Zielstra, D.和Hochmair, H., H. 2011。基于免费和专有网络数据的公交车站行人可达性比较研究。交通研究记录:交通研究委员会杂志。

- Zielstra, D.和Zipf, A., 2010。德国的OpenStreetMap数据质量研究。GIScience 2010。第六届地理信息科学国际会议。瑞士苏黎世。

让你的收件箱更有趣。添加一些地理。

了解测绘行业的最新动态、发展和技术进步。

免费注册

紧跟地理空间产业的发展

我们鼓励你订阅我们的每周通讯。订阅者还可以收到我们双月刊的电子版。

最新文章

Baidu