閱讀483 返回首頁    go 阿裏雲 go 技術社區[雲棲]


區分shapefile,coverage,geodatabase

在過去20年中,矢量數據模型是GIS中變化最大的方麵,例如,ESRI公司所開發每種新軟件包都對應一種新的矢量數據模型,Arc/Info對應Coverage,ArcView對應Shapefile,ArcGIS對應Geodatabase。Coverage和Shapefile是地理關係數據模型,它利用分離的係統來存儲空間數據和屬性數據,而Geodatabase是基於對象數據模型,它把空間數據和屬性數據存儲在唯一的係統中。

  Coverage是拓撲的,Shapefile是非拓撲的。

  Coverage支持三種基本拓撲關係:連接性、麵定義、鄰接性。

  Shapefile多邊形對於共享邊界實際上有重複弧段且可彼此重疊,不同於Coverage所用的多個文件,它用幾何學性質存儲兩個基本文件:以.shp為擴展名的文件存儲要素幾何學特征;以.shx為擴展名的文件保留要素幾何特征的空間索引。

  Shapefile:一種基於文件方式存儲GIS數據的文件格式。至少由.shp,.dbf,.shx三個文件作成,分別存儲空間,屬性和前兩者的關係。是GIS中比較通用的一種數據格式。

  Coverage:一種拓撲數據結構,一般的GIS原理書中都有它的原理論述。數據結構複雜,屬性缺省存儲在Info表中。目前ArcGIS中仍然有一些分析操作隻能基於這種數據格式進行操作。

  Geodatabase:ArcInfo發展到ArcGIS時候推出的一種數據格式,一種基於RDBMS存儲的數據格式,其有兩大類:1.PersonalGeodatabse 用來存儲小數據量數據,存儲在Access的mdb格式中。2.ArcSDE Geodatabse存儲大型數據,存儲在大型數據庫中Oracle,Sql Server,DB2等。可以實現並發操作,不過需要單獨的用戶許可。

  Coverage數據模型

  Coverage是一個集合,它可以包含一個或多個要素類。在第一個商業化GIS軟件Arc/INFO之前,計算計劃的圖形表示源自通用的CAD軟件,屬性信息和幾何要素放在一起,不利於空間信息的描述和分析。

  Coverage的優勢:

  (1)空間數據與屬性數據關聯。空間數據存儲於建立了索引的二進製文件中,屬性數據存放在DBMS表中,二者以公共的標識編碼關聯。

  (2)矢量數據間的拓撲關係得以保存。

  Shapefile數據模型

  Shapefile是ArcView GIS3.x的原生數據格式,屬於簡單要素類,用點、線、多邊形存儲要素的形狀,卻不能存儲拓撲關係,具有簡單、快速顯示的優點。一個shapefile是由若幹個文件組成的,空間信息和屬性信息分離存儲,所以稱之為“基於文件”。每個shapefile,都至少由三個文件組成,其中:*.shp存儲的是幾何要素的的空間信息,也就是XY坐標。*.shx存儲的是有關*.shp存儲的索引信息,它記錄了在*.shp中,空間數據是如何存儲的,XY坐標的輸入點在哪裏,有多少XY坐標對等信息。*.dbf存儲地理數據的屬性信息的dBase表。這三個文件是一個shapefile的基本文件,shapefile還可以有其他一些文件,但所有這些文件都與該shapefile同名,並且存儲在同一路徑下。下麵簡要介紹一下其他一些較為常見文件:*.prj如果shapefile定義了坐標係統,那麼它的空間參考信息將會存儲在*.prj文件中;*.shp.xml這是對shapefile進行元數據瀏覽後生成的xml元數據文件;*.sbn和*.sbx這兩個存儲的是shapefile的空間索引,它能加速空間數據的讀取,這兩個文件是在對數據進行操作、瀏覽或連接後才產生的,也可以通過ArcToolbox>DataManagementTools>Indexes>Add spatial Index工具生成。

  幾種常見的shapefile文件:當使用ArcCatalog對shapefile進行創建、移動、刪除或重命名等操作,或使用ArcMap對shapefile進行編輯時,ArcCatalog將自動維護數據的完整性,將所有文件同步改變。所以需要使用ArcCatalog管理shapefile。雖然Shapefile無法存儲拓撲關係,但它並不是普通用於顯示的圖形文件,作為地理數據,它自身有拓撲的。比如一個多邊形要素類,shapefile會按順時針方向為它的所有頂點排序,然後按頂點順序兩兩連接成的邊線向量,在向量右側的為多邊形的內部,在向量左側的是多邊形的外部。由於1990年代地理信息的迅速發展以及ArcViewGIS3.x軟件在世界範圍內的推廣,shapefile格式的數據使用非常廣泛,數據來源也較多。很多軟件都提供了向shapefile轉換的接口(eg:MapInfo、MapGIS等)。ArcGIS支持對shapefile的編輯操作,也支持shapefile向第三代數據模型geodatabase的轉換。

  Geodatabase數據模型

  Geodatabase作為ArcGIS的原生數據格式,體現了很多第三代地理數據模型的優勢。隨著IT技術的發展,普通的事務型數據的管理模式,早已從傳統的基於文件的管理轉向利用基於工業標準建立的關係型數據庫進行管理,這種基於數據庫的管理方式的優點是不言而喻的。那麼帶有空間信息的地理數據是否也可以利用這種非常成熟的數據庫技術進行管理呢?於是ESRI推出了geodatabase數據模型,利用數據庫技術高效安全地管理我們的地理數據。

  Geodatabase可以分為兩種,一種是基於Microsoft Access的personalgeodatabase,另一種是基於oracle、SQL Server、Informix或者DB2的enterprisegeodatabase,由於它需要中間件ArcSDE進行連接,所以nterprise geodatabase又稱為ArcSDEgeodatabase。由於Microsoft Access自身容量的限製,personalgeodatabase的容量上限為2GB,這顯然不能滿足企業級的海量地理數據的存儲需求。於是可以將geodatabase擴展為ArcSDEgeodatabase,底層數據庫可以使用oracle這樣的大型關係數據庫,能夠存儲近乎“無限”的海量數據(僅受硬盤大小的限製)。雖然底層使用的數據庫各不相同,但是geodatabase給用戶提供的是一個一致的操作環境。在geodatabase中,不僅可以存儲類似shapefile的簡單要素類還可以存儲類似coverage的要素集並且支持一係列的行為規則對其空間信息和屬性信息進行驗證表格、關聯類、柵格、注記和尺寸都可以作為eodatabase對象存儲。這些在perasonalgeodatabase和ArcSDE geodatabase中都是一樣的(柵格的存儲有點小差異,但對用戶來說都是一樣的)。

  Geodatabase的模型結構:

  (1)對象類(Object class)

  對象類是一種特殊的類,沒有空間特征。其實例是可關聯某特定行為的表記錄。如,某地塊的主人,在“地塊”“主人”間可建立某種關係。

  (2)要素類(Feature class)

  要素類是同類空間要素的集合。如,河流、道路、植被、電纜等。要素類可以獨立存在,也可以具有某種聯係。當不同的要素類之間存在關係時,就將其組織到一個要素數據集(Featuredataset)中。

  (3)要素數據集(Feature dataset)

  要素數據集由一組具有相同空間參考(Spatialreference)的要素類組成。將不同要素類放入要素數據集的原因:

  a.專題歸類表示——當不同的要素類屬於同一範疇。比如,全國範圍內某種比例尺的水係數據,其點線麵類型的要素類可組織成同一個要素數據集。

  b.創建幾何網絡——在同一幾何網絡中充當連接點和邊的各種要素類,須組織到同一要素數據集中。比如,配電網絡中,有各種開關、變壓器、電纜等,它們分別對應點或線類型的要素類,在配電網絡建模時,我們要將其全部考慮到配電網絡對應的幾何網絡模型中。此時這些要素類就要放在統一要素數據集下。

  c.考慮平麵拓撲——共享公共幾何特征的要素類。比如,用地、水係、行政區界等。當移動其中一個要素時,其公共部分也要一起移動,並保持這種公共的幾何關係不變。

  (4)關係類(Relationship class)

  定義不同要素類或對象類之間的關聯關係。如我們可以定義房子和主人之間的關係、房子和地塊之間的關係等。

  (5)幾何網絡

  在若幹要素類的基礎上建立起的新類。定義幾何網絡時,我們指定哪些要素類加入其中,同時指定其在幾何網絡中扮演什麼角色。比如,定義一個供水網絡,我們指定同屬一個要素數據集的“閥門”、“泵站”、“接頭”對應的要素類加入其中,並扮演“連接”的角色;同時,我們要指定同屬一個要素數據集的“供水幹管”、“供水支管”、“入戶管”等對應的要素類加入供水網絡,由其扮演“邊”的角色。

  (6)Domains

  定義屬性的有效範圍,可是連續的,也可是離散數值。

  (7)Validationrules對要素類的行為和取值加以約束的規則。如不同管徑的水管連接必須通過合適的接頭,規定一個地塊可擁有一到三個主人等。

  (8)Raster datasets

  用於存放柵格數據。支持海量柵格數據,支持影像鑲嵌,可通過建立“金字塔”形索引,在使用時指定可視範圍提高檢索和顯示效率。

  (9)TIN Datasets

  ARC/INFO的經典數據模型,用不規則分布的采樣點的采樣值構成不規則的三角集合。用於表達地形或其他類型的空間連續分布特征。

  (10)Locators

  定位參考和定位方法的組合。對於不同的參考,用不同的定位方法進行定位操作。所謂定位參考,不同的定位信息有不同的表達方法。在Geodatabase中,有四種定位信息:地址編碼、、地名及郵編、路徑定位。定位參考數據放在數據庫表中,定位器根據該定位參考數據在地圖上生成空間定位點。

最後更新:2017-04-03 05:39:38

  上一篇:go 連載:麵向對象葵花寶典:思想、技巧與實踐(38) - 設計模式之道
  下一篇:go poj 2028 When Can We Meet?