在互联网飞速发展的时代需要新型的空间标绘数据获取方法,基于互联网的空间标绘数据获取技术是当今GIS领域一个重要的演技方向,许多学者在这方面进行了相关的研究。Goodchild研究指出,随着Web2。0技术的推广与应用,产生了一种新的地理信息获取理念,并将其定义为自发空间地理信息,即完全由用户自愿提供和共享的地理信息[2]。Hua-Ping Zhang等研究了从互联网新闻报道中自动提取POI数据的方法[3]。Tezuka T等研究提出的网络爬虫技术降低了Web空间数据获取的难度[4]。Leasure D R提到,利用网络爬虫技术,可以丰富GIS空间分析的数据来源[5]。Chen X基于网络爬虫实现了自动化发现和检索WMS服务[6]。蔡地在研究开源网络爬虫框架的基础上,提出通过多线程和异步I/O两种策略来优化Web空间数据的获取效率[7]。叶琳分析了常见垂直网站中所包含空间数据的结构信息和属性信息,并探讨了不同类型Web空间数据的解析方法[8]。李明铭利用网络爬虫技术为房产价格指数编制提供了丰富实时的数据来源[9]。周浩探讨了面向网络舆情分析的Web数据获取关键技术[10]。王克永研究了面向网页文本的地理信息要素提取和空间定位方法[11]。吴芬芳,熊卿探讨了互联网大数据时代地理信息获取和服务的新方式[12]。Ager A则在研究中指出,如果能够对Web空间数据进行有效的利用,将对GIS的发展产生深远的影响[13]。88652
2 标绘数据获取来源
目前,标绘数据获取的途径主要有专题网站、兴趣点数据以及众源地理数据几种。
1)专题网站:专题数据是是空间数据的重要组成部分,它包含了与空间位置相符合相关的一系列社会、经济和人文信息。如今,由于互联网和电子商务的发展,许多企业、组织会在网络上发布专题统计数据,可以方便地获取所需要的专题空间数据。论文网
2)兴趣点数据:互联网地图包含海量的兴趣点数据,许多地图应用服务发布的数据具有高精度、髙准确性、更新周期短、免费等特点。
3)众源地理数据:众源地理数据是指由大众采集并向大众提供的开放地理数据,越来越多的定位系统和设备的不断涌现和普及,促使众源地理数据的产生。代表性的众源地理数据有GPS形式轨迹数据、用户协作标注编辑的地图服务发布的数据各类社交网站如新浪微博、Twitter、Facebook用户签到的兴趣点等。