GIS多源數據集成模式評述

論文類別:理學論文 > 地質學論文
論文作者: 未知
上傳時間:2006/9/5 10:00:00

[摘要] 地理信息系統的迅速發展和廣泛應用導致了空間数據多源性的產生,為數據綜合利用和數據共享帶來不便。本文探討空間數據多源性的產生和表現,指出多數據格式是多源空间數據集成的瓶頸;分析和評價了多源空間數據集成的三種模式,并展望了多源數據集成的發展方向。

  [關鍵詞] 地理信息系統 多格式数據源 多源數據集成

一、多數據格式是多源空間數據集成的瓶頸

  1、空間數據多源性的產生和表现

  空間數據多源性的產生和表現主要可以概括為以下幾個层次:

  (1)多語義性

  地理信息指的是地理系統中各種信息,由於地理系统的研究對象的多種類特點決定了地理信息的多語義性。對於同一個地理信息單元(feature),在現實世界中其幾何特征是一致的,但是卻對應著多種語義,如地理位置、海拔高度、气候、地貌、土壤等自然地理特征;同時也包括经濟社會信息,如行政區界限、人口、產量等。一个GIS研究的決不會是一個孤立的地理語義,但不同系统解決問題的側重點也有所不同,因而會存在語義分異问題。

  (2)多時空性和多尺度

  GIS數據具有很強的時空特性。一個GIS系統中的數據源既有同一時間不同空間的數據系列;也有同一空間不同時間序列的數據。不僅如此,GIS會根據系统需要而采用不同尺度對地理空间進行表達,不同的觀察尺度具有不同的比例尺和不同的精度。GIS數據集成包括不同時空和不同尺度數據源的集成。

  (3)獲取手段多源性

  獲取地理空間的數據的方法有多種多樣,包括来自現有系統、圖表、遙感手段、GPS手段、統計调查、實地勘測等。這些不同手段獲得的數據其存储格式及提取和處理手段都各不相同。

  (4)存儲格式多源性

  GIS數據不仅表達空間實體(真實體或者虛拟實體)的位置和幾何形状,同時也記錄空間實體對應的屬性,這就決定了GIS數據源包含有圖形數據(又稱空間數據)和屬性數據兩部分。圖形數據又可以分為柵格格式和矢量格式兩類。傳統的GIS一般將屬性數據放在關系數據庫中,而將圖形數据存放在專門的圖形文件中。不同的GIS軟件采取不同的文件存儲格式。

  2、多源空間數据集成的迫切性

  隨著Internet網絡的飛速發展和普及,信息共享已经成為一種必然的要求。地理信息也不例外,隨著信息技术以及GIS自身的發展,GIS已經從純粹地學技術系統的圈子跳了出來,正和IT行業完全融合,人們對空间信息的需求也越來越多。GIS要進一步發展,必須完全融入大型MIS(管理信息系統)中。1998年美国副總統戈爾提出數字地球的概念,更是將地理信息技術推到了最前沿。然而地理信息要真正實現共享,必須解決地理信息數据多格式、多數據庫集成等瓶颈問題。隨著技術發展,GIS已經逐步走向完全以純關系数據存儲和管理空間數据的發展道路,這為GIS完全和MIS無縫集成邁出了重要的一步。但因為GIS處理的數據對象是空間对象,有很強的時空特性,获取數據的手段也復雜多樣,這就形成多種格式的原始數据,再加上GIS應用系統很长一段時間處於以具體項目為中心孤立發展狀態中,很多GIS軟件都有自己的數據格式,这使得GIS的數據共享問題变得尤為突出。

  空間數據作為數據類型的一種,同普通數據一樣需要走過從分散到統一的過程。在計算機的發展過程中,先是數据去適應系統,每一個系統都为傾向於擁有自己的数據格式;隨著數據量的增多,数據庫系統應運而生;隨著時代的發展,信息共享的需求越來越多,不同數據庫之間的數據交换成了瓶頸;SQL(標準結构化查詢語言)以及ODBC的出現為這一難題提供了比较滿意的解決方案。但是空間數據如何引進這種思想,或者说將空間數據也納進標準組織和標準协議進行規範和管理,從而使空間數據共享成為现實。

二、 GIS多源數據集成模式比較


  由於地理信息系統的圖形數據格式各異,給信息共享帶來了極大的不便,解決多格式數據源集成一直是近年來GIS應用系統开發中需要解決的重要問题。目前,實現多源數據集成的方式大致有三種,即:數據格式轉换模式、數據互操作模式、直接數據訪問模式。

  1 、數據格式轉换模式

  格式轉換模式是傳統GIS 數據集成方法(圖1)。在這種模式下,其他數據格式经專門的數據轉換程序進行格式轉換後,復制到当前系統中的數據庫或文件中。這是目前GIS系統數據集成的主要辦法。目前得到公認的幾种重要的空間數據格式有:ESRI公司的Arc/Info Coverage、ArcShape Files、E00格式;AutoDesk的DXF格式和DWG格式;MapInfo的MIF格式;Intergraph的dgn格式等等。 數據轉換模式主要存在的問題是:

  (1)由於缺乏對空間對象統一的描述方法,從而使得不同數據格式描述空間對象時采用的數據模型不同,因而轉換後不能完全準确表達源數據的信息。

  (2)這種模式需要將數據統一起來,違背了數據分布和獨立性的原則;如果數據來源是多個代理或企業單位,這種方法需要所有權的轉讓等問題[1]。 美國國家空間數據協會(NSDI)制定了統一的空間數據格式規範SDTS(Spatial Data Transformation Standard),包括幾何坐標、投影、拓撲關系、屬性數據、數據字典,也包括柵格格式和矢量格式等不同的空間數據格式的轉換標准。許多軟件利用SDTS提供了標準的空間數據交換格式。目前,ESRI在ARC/INFO中提供了SDTSIMPORT以及SDTSEXPORT模塊,Intergraph公司在MGE产品系列中也支持SDTS矢量格式。SDTS在一定程度上解決了不同數據格式之间缺乏統一的空間對象描述基礎的问題。但SDTS目前還很不完善,還不能完全概括空间對象的不同描述方法,並且還不能统一為各個層次以及从不同應用領域為空间數據轉換提供統一的標準;並且SDTS沒有為數據的集中和分布式處理提供解決方案,所有的數據仍需要經過格式轉換復制到系統中,不能自動同步更新。

  2 、數据互操作模式

  數據互操作模式是OpenGIS consortium (OGC) 制定的规範。OGC是為了發展開放式地理數據系統、研究地學空间信息標準化以及處理方法的一個非盈利組織。GIS互操作是指在異構數據庫和分布计算的情況下,GIS用戶在相互理解的基礎上,能透明地獲取所需的信息。OGC為数據互操作制定了統一的规範,從而使得一個系统同時支持不同的空間數據格式成為可能。根據OGC頒布的規範,可以把提供數據源的軟件稱為數據服务器(Data Servers),把使用數据的軟件稱為數據客戶(Data Clients),數據客戶使用某種数據的過程就是發出數據請求,由数據服務器提供服務的過程,其最終目的是使數據客戶能讀取任意數據服務器提供的空間数據。OGC規範基於OMG的CORBA、Microsoft的OLE/COM以及SQL等,為實現不同平臺間服務器和客戶端之間數據请求和服務提供了統一的協議。OGC規範正得到OMG和ISO的承认,從而逐漸成為一種國際标準,將被越來越多的GIS软件以及研究者所接受和采納。目前,還沒有商業化GIS軟件完全支持這一规範。

轉贴於 免費論文下載中心 http://www.hi138.com

  數據互操作為多源數據集成提供了嶄新的思路和規範。它將GIS带入了開放式的時代,從而為空間數據集中式管理和分布存儲與共享提供了操作的依據。OGC標準將計算機軟件領域的非空間數據處理標準成功地應用到空间數據上。但是OGC标準更多考慮到采用了OpenGIS協議的空間數據服務软件和空間數據客戶软件,對於那些歷史存在的大量非OpenGIS標準的空間数據格式的處理辦法還缺乏標準的规範。而從目前來看,非OpenGIS標準的空間数據格式仍然占據已有數據的主體。

  數据互操作規範為多源數據集成帶來了新的模式,但這一模式在應用中存在一定局限性:首先,為真正實現各種格式數據之間的互操作,需要每個每種格式的宿主軟件都按照著統一的規範實現數據訪問接口,在一定時期內还不現實;其次,一個软件訪問其他軟件的数據格式時是通過數據服务器實現的,這個數據服務器實際上就是被訪問數據格式的宿主軟件,也就是說,用戶必須同時擁有這兩个GIS軟件,並且同时運行,才能完成數據互操作過程。

  3、直接數據訪問模式

  顾名思義,直接數據访問指在一個GIS軟件中實現對其他軟件數據格式的直接訪問,用戶可以使用單個GIS軟件存取多種數據格式。直接數據訪問不僅避免了繁的數据轉換,而且在一個GIS軟件中訪問某種軟件的數據格式不要求用戶擁有該數據格式的宿主软件,更不需要該軟件運行。直接數據訪問提供了一種更為經濟实用的多源數據集成模式。

  目前使用直接数據訪問模式實現多源數據集成的GIS軟件主要有兩個,即: Intergraph 推出的GeoMedia系列軟件和中國科學院地理信息產業發展中心研制的SuperMap。GeoMedia實現了對大多數GIS/CAD軟件數據格式的直接訪問,包括:MGE、Arc/Info、Frame、Oracle Spatial、SQL Server、Access MDB等(圖2)。SuperMap 2.0則提供了存取SQL Server、Oracle Spatial、ESRI SDE、Access MDB、SuperMap SDB文件等的能力,在以後的版本中將逐步支持对Arc/Info Coverage、AutoCAD DWG、MicroStation DGN、ArcView等數據格式的直接訪問。

三、多源空間數據格式集成的展望

  1 、文件方式和數据庫方式

  传統的空間數據往往采用文件方式,隨著技術的进步,逐漸將屬性數據移植到數據库平臺上;隨著技術發展,圖形數據也可以和属性數據一起存放在關系数據庫中。文件方式對数據管理安全性較差,存在著屬性和圖形分開管理的問題,不適合網絡共享發展的需要;数據庫方式則實現了空間數據和屬性数據一體化存儲和管理,便於開发兩層、三層甚至多層網絡應用系統。從發展趨勢來看,純关系數據庫方案取代文件方案是发展的必然趨勢,這也是IT發展的主流趨勢。隨著對信息量需求的增大以及信息需求种類增多,數據倉庫的建立,將是GIS文件系統向數據库系統發展的主流。

  2 、OpenGIS、SDTS與DLG/F

  OpenGIS是目前的主流標準,但SDTS並不會停滯不前,相反筆者認為SDTS将會與OpenGIS走向一體化。SDTS 可以為OpenGIS提供一個轉換和存取空間數據的標準,該標準是不依賴任何一種特定GIS軟件格式的,該標準中利用頭文件描述格式的方式使得數據服务者不必專門提供格式說明,而數据客戶也不必專門學習該格式,只需讀取SDTS頭文件就可獲得數據服務者提供的數据格式。筆者認為利用SDTS做數據標準,利用OGC作數據互操作的標準(例如空間SQL標準),簡單地說就是如果說SDTS提供了數據格式的頭文件,而OGC標準則提供了讀寫這個頭文件的標準方法。如果再采用數据庫作後臺,利用空間數据引擎,空間數據引擎按照SDTS存取空間數據,按照OGC標準對客戶软件提供操作接口,這將是空間數据集成的理想解決方案。 USGS還提供了一種稱作DLG/F的標準,該標准設計了空間數據在數據庫中的動態存儲結構,利用該結構可以將拓撲關系動態記錄下來,同时可以讓用戶添加自定義的空間數据類型。怎樣利用DLG/F完善SDTS和OpenGIS也將是OpenGIS以及SDTS發展的方向。

  3 、統一空間實體编碼

  多源空間數据據格式集成還有一個很重要的方面就是如何處理不同數据庫對空間實體采用的編碼方式不同的問題。從理論上來說,一个系統對同一空間實体的編碼應該是唯一的,實際上由于不同領域從不同視角對同一空間实體編碼並不一樣,甚至会出現不同空間實體具有相同編碼的情況,這些編碼放在同一系統中,就会出現空間實體標識的嚴重問題。從目前來看,OpenGIS和SDTS都是基於地理特征(Feature)定義空间實體的,但都還不能真正提供一個通用的空間實体編碼體系。

參考文獻

及網址


1.On spatial database integration, Thomas Devogele ,Geographical Information Science, 1998,12(4)

2.Issues and prospects for the next generation of the spatial data transfer standard (SDTS), DAVID ARCTUR, DAVID HAIR,GEORGE TIMSON, etc, Geographical Information Science, 1998,12(4)

3.Towards integrated geographic information processing,DAVID J.ABEL, BENG CHIN COOI, KIAN-LEE TAN etc, Geographical Information Science, 1998,12(4)

4.A framework for the integration of geographical information systems and modelbase management , DAVID A.BENNETT, Geographical Information Science, 1997,11(4)

5. Overcoming the semantic and other barriers to GIS interoperability , YASER BISHR, Geographical Information Science, 1998,12(4) 免費論文下載中心 http://www.hi138.com
下载论文

論文《GIS多源數據集成模式評述》其它版本

地質學論文服務

網站聲明 | 聯系我們 | 網站地圖 | 論文下載地址 | 代寫論文 | 作者搜索 | 英文版 | 手機版 CopyRight@2008 - 2017 免費論文下載中心 京ICP备17062730号