24
CHƯƠNG 3: QUẢN LÝ DỮ LIỆU TRONG GIS Trong các hệ thống thông tin địa lý, mỗi thực thể trong thế giới thực được biểu diễn trong máy tính số bằng những mô hình dữ liệu khác nhau để mô tả thuộc tính, vị trí, thời gian và sự quan hệ giữa chúng với nhau. Có hai dạng cấu trúc dữ liệu cơ bản trong GIS. Đó là dữ liệu không gian và dữ liệu thuộc tính. Đặc điểm quan trọng trong tổ chức dữ liệu của GIS là: dữ liệu không gian (bản đồ) và dữ liệu thuộc tính được lưu trữ trong cùng một cơ sở dữ liệu (CSDL) và có quan hệ chặt chẽ với nhau. Trong đó, mô hình Raster hoặc mô hình Vector được sử dụng để biểu diễn vị trí; mô hình phân cấp, mô hình mạng hoặc mô hình quan hệ được sử dụng để biểu diễn thuộc tính của các đối tượng, các hoạt động, các sự kiện trong thế giới thực. Hình III.1: Minh họa cấu trúc dữ liệu không gian và dữ liệu thuộc tính Dữ liệu không gian Dữ liệu thuộc tính

CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

CHƯƠNG 3: QUẢN LÝ DỮ LIỆU TRONG GIS

Trong các hệ thống thông tin địa lý, mỗi thực thể trong thế giới thực được biểu diễn trong máy tính số bằng những mô hình dữ liệu khác nhau để mô tả thuộc tính, vị trí, thời gian và sự quan hệ giữa chúng với nhau. Có hai dạng cấu trúc dữ liệu cơ bản trong GIS. Đó là dữ liệu không gian và dữ liệu thuộc tính. Đặc điểm quan trọng trong tổ chức dữ liệu của GIS là: dữ liệu không gian (bản đồ) và dữ liệu thuộc tính được lưu trữ trong cùng một cơ sở dữ liệu (CSDL) và có quan hệ chặt chẽ với nhau. Trong đó, mô hình Raster hoặc mô hình Vector được sử dụng để biểu diễn vị trí; mô hình phân cấp, mô hình mạng hoặc mô hình quan hệ được sử dụng để biểu diễn thuộc tính của các đối tượng, các hoạt động, các sự kiện trong thế giới thực.

Hình III.1: Minh họa cấu trúc dữ liệu không gian và dữ liệu thuộc tính

I. Mô hình dữ liệu không gian:

Trong máy tính số, dữ liệu không gian của các thực thể có thể được biểu diễn theo hai mô hình Raster và Vector. Các đối tượng không gian trong GIS được nhóm theo ba loại đối tượng: điểm, đường và vùng. Trong mỗi kiểu cấu trúc dữ liệu, cách tổ chức dữ liệu cho ba đối tượng không gian trên khác nhau. Tuỳ tỷ lệ hoặc mức độ chi tiết mà các đối tượng không gian được thiết kế trong GIS khác nhau. Ba đối tượng không gian dù ở mô hình cấu trúc dữ liệu GIS nào đều có một điểm chung là vị trí của chúng đều được ghi nhận bằng giá trị toạ độ trong một hệ toạ độ nào đó tham chiếu với hệ toạ độ dùng cho Trái đất.

Dữ liệu không gian

Dữ liệu thuộc tính

Page 2: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

(a) (b)

Hình III.2: Thế giới thực trên hai mô hình raster (a) và vector (b) (Theo Aronnof, 1989)

I.1/ Mô hình dữ liệu Raster:

Khái niệm ảnh Raster: Một file ảnh chụp về một đối tượng không gian qua máy ảnh photo hoặc một ảnh số chụp từ máy chụp số (digital camera) hoặc ảnh số thu nhận từ các đầu ghi phổ trên các vệ tinh là các ảnh có cấu trúc raster.

Raster được định nghĩa như là ma trận không gian của các đơn vị ảnh (picture element) còn gọi là các pixel. Các pixel có kích thước đồng nhất về mặt hình học, chúng là các ô vuông nhỏ và được xếp theo các dòng và các cột giống như một lưới ô vuông (Hình III.16).

Hình III.3: Ma trận không gian của một file ảnh raster có cấu trúc pixel

Cấu trúc raster là một trong những cấu trúc dữ liệu đơn giản nhất trong GIS. Nó còn được gọi là “tổ chức theo ô vuông của dữ liệu không gian” (cellular organization of spatial data). Pixel là phần tử cơ sở của cấu trúc dữ liệu Raster để biểu diễn một đặc trưng địa lý f(x,y) nào đó, giá trị của pixel chỉ tính chất của đối tượng không gian. Giá trị số của pixel chính là mã được gắn cho đối tượng không gian (tức là mỗi đối tượng không gian có một mã nhất định). Giá trị bằng không thường là những pixel chỉ vùng ngoài khu vực nghiên cứu. Ví dụ các đối tượng đất trồng bắp có mã bằng 1, đất trồng cam có mã bằng 2, đất trồng điều có mã bằng 3, đất trồng mía có mã bằng 4…(Hình III.4).

Page 3: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

Hình III.4: Các đối tượng không gian được mã hoá trong mô hình Raster

Như vậy, mô hình Raster biểu diễn không gian như là một ma trận số nguyên, mỗi một giá trị số nguyên đại diện cho một thuộc tính, vị trí của số nguyên chính là vị trí của đối tượng. Ma trận không gian từ các ô ảnh này được mã hoá và lưu trữ trong máy tính theo quy luật nhất định thông qua vị trí của từng ô ảnh và được tham chiếu tới hệ toạ độ dùng cho Trái đất gọi là hệ toạ độ Cartsian theo hai trục x và y.

Với cấu trúc dữ liệu dạng raster, giá trị của thông số nghiên cứu như độ cao địa hình (m), loại đất, sinh khối thực vật (gr/m2)…phải được xác định cho từng ô lưới (cell). Trong cấu trúc dữ liệu dạng raster (Hình III.5), các vật thể trên bản đồ có thể được mô tả bằng các yếu tố (map feature) sau:

- Điểm (point): Độ lớn của pixel theo chiều x, y sẽ là độ phân giải không gian của ma trận raster (trong viễn thám gọi là độ phân giải của ảnh), có thể được biểu diễn bằng một fixel hay nhiều fixel tuỳ thuộc vào tỷ lệ (độ phân giải của ảnh)

- Đường (line): là tập hợp các ô lưới vuông có cùng giá trị f (x,y) nối tiếp nhau và sắp xếp theo một hướng nhất định. Vì trong cấu trúc Raster, các pixel được xếp theo hàng, cột, như một ma trận điểm nên đường nét không trơn, có dạng zic-zac.

- Vùng (area): Vùng được xác định bằng một mảng gồm nhiều pixel có cùng giá trị thuộc tính f (x,y) trải rộng ra theo nhiều phương.

Hình III.5: Cấu trúc dữ liệu Raster

Trên thực tế mỗi pixel có một cặp toạ độ (x, y) duy nhất. Một đối tượng không gian có kích thước nhỏ hơn một pixel, ví dụ lớn hơn một nửa pixel, sẽ được coi như là một

Page 4: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

pixel trọn vẹn và có giá trị về diện tích và toạ độ của chính pixel mà nó nằm trong. Vì vậy độ phân giải của pixel đóng vai trò hết sức quan trọng về độ chính xác của dữ liệu Raster. Kích thước được chọn cho một ô lưới (pixel) của một vùng nghiên cứu phụ thuộc vào độ phân giải dữ liệu yêu cầu cho phân tích chi tiết. Ô phải đủ nhỏ để nắm bắt chi tiết được yêu cầu, nhưng đủ lớn để bộ nhớ máy tính và phép toán phân tích có thể thực hiện hiệu quả.

Ưu điểm của cấu trúc dữ liệu dạng raster là dễ thực hiện các chức năng xử lý và phân tích. Tốc độ tính toán nhanh, thực hiện các phép toán bản đồ dễ dàng. Dễ dàng liên kết với dữ liệu viễn thám. Cấu trúc raster có nhược điểm là kém chính xác về vị trí không gian của đối tượng. Khi độ phân giải càng thấp (kích thước pixel lớn) thì sự sai lệch này càng tăng

Mô hình dữ liệu này thích hợp trong mô tả các đối tượng, hiện tượng phân bố liên tục trong không gian (độ cao, nhiệt độ, loại hình sử dụng đất…), dùng để lưu giữ thông tin dạng ảnh (ảnh mặt đất, hàng không, vũ trụ...). Một số dạng mô hình biểu diễn bề mặt như DEM (Digital Elevation Model), DTM (Digital Terrain Model), TIN (Triangulated Irregular Network) trong CSDL cũng thuộc dạng raster.

Hình III.6: Mô hình cấu trúc Raster

I.1.1/ Thuộc tính của ô ảnh:

Thuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo được ở tại vị trí của ô. Ô có thể có giá trị là số nguyên hoặc số thập phân. Khi một giá trị số nguyên được sử dụng cho ô ảnh, nó có thể được dùng làm mã nhận dạng.

Ñieåm

Ñöôøng

Vuøng

Page 5: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

Hình III.7: Minh họa thuộc tính của ô ảnh

I.1.2/ Các dạng dữ liệu raster:

- Ảnh vệ tinh: Thu nhận ảnh vệ tinh là một cách vẽ bản đồ ở mọi tỷ lệ với chi phí thấp nhất. ảnh vệ tinh có loại có màu hoặc đen trắng.

- Ảnh hàng không: Được dùng để tạo ra những bản đồ chi tiết.

- Bản đồ quét.

- Các loại hình ảnh khác.

- Chuyển đổi từ những dữ liệu khác: Phát sinh từ những nguồn dữ liệu khác, như từ những tập dữ liệu đặc trưng hoặc từ TIN. Những kết quả phân tích từ raster bề mặt trái đất có thể sử dụng để làm bản đồ độ dốc.

I.1.3/ Vai trò của Raster trong hiển thị và phân tích:

Dùng làm bản đồ nền: Thông thường, raster được sử dụng làm nền bản đồ. Chúng nằm ở dưới các layer vectơ. Sử dụng ảnh raster giúp nhìn thấy độ sâu và tăng sự tin tưởng của người dùng bản đồ.

Dùng trong quản lý sử dụng đất: Dữ liệu Raster rất lý tưởng để lập mô hình và vẽ bản đồ sử dụng đất. Đa số các nghiên cứu sử dụng đất đều bắt đầu bằng ảnh vệ tinh hoặc ảnh hàng không, sau đó các lớp đặc trưng sẽ được đưa vào. Công việc này được tiến hành hàng năm và từ so sánh các kết quả thu nhận người ta sẽ đưa ra các quyết định về sử dụng đất.

Dùng trong phân tích thủy văn: Thông tin địa thế thông thường nằm ở dạng raster với những giá trị độ cao cho từng ô ảnh. Đây là mô hình số độ cao (DEM). Các công cụ GIS dành cho Raster cho phép xác định được hướng nước chảy, lưu lượng tích trữ của dòng nước ở hạ lưu và dự đoán được lũ lụt.

Dùng trong phân tích môi trường:Bởi vì dữ liệu về phân bố sử dụng đất, về thực phủ và địa thế thông thường được cất giữ dưới dạng ảnh raster, do vậy đa số các phép tính toán phân tích môi trường đều liên quan đến dữ liệu raster. Công cụ phân tích GIS dành cho Raster đã phát triển đến mức cho phép sử dụng dữ liệu raster để giải quyết những vấn đề ở nhiều mức độ. Từ công tác bảo tồn rừng cho tới nghiên cứu những thay đổi của động vật hoang dã do đô thị hóa.

Page 6: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

Dùng trong phân tích địa thế: Mô hình số độ cao chứa những giá trị độ cao cho từng ô ảnh. ArcInfo có nhiều công cụ phân tích raster để tính độ dốc, khả năng nhận ánh sáng và tính toán độ cong của mặt đất mà thường được sử dụng trong lập kế hoạch sử dụng đất hoặc chọn vị trí để xây dựng công trình.

I.2/ Mô hình dữ liệu Vector:

Cấu trúc vector mô tả vị trí và phạm vi của các đối tượng không gian bằng tọa độ cùng các kết hợp hình học gồm nút, cạnh, mặt và quan hệ giữa chúng. Về mặt hình học, các đối tượng được phân biệt thành 3 dạng: đối tượng dạng điểm (point), đối tượng dạng đường (line) và đối tượng dạng vùng (region hay polygon). Điểm được xác định bằng một cặp tọa độ X,Y. Đường là một chuỗi các cặp tọa độ X,Y liên tục. Vùng là khoảng không gian được giới hạn bởi một tập hợp các cặp tọa độ X,Y trong đó điểm đầu và điểm cuối trùng nhau. Với đối tượng vùng, cấu trúc vector phản ảnh đường bao.

Trong mô hình dữ liệu vector vị trí của đối tượng không gian được ghi nhận chích xác bằng các toạ độ x, y trong một hệ toạ độ tham chiếu với hệ toạ độ dùng cho Trái đất.

Ví dụ để lưu trữ dữ liệu biểu thị một vật thể hình tròn thì trong cấu trúc raster ta tạo mã (code) cho tập hợp những ô vuông sơ cấp nằm trong phạm vi hình tròn trong khi đối với cấu trúc dạng vector thì ta chỉ cần lưu trữ tọa độ điểm tâm vòng tròn và giá trị bán kính của hình tròn.

Thực thể điểm (point entity): Trong mô hình vector, điểm (thực thể địa lý) được thể hiện như một vector có độ dài bằng không (không có kích thước), và vị trí của nó được xác định bởi một cặp tọa độ (x,y) duy nhất. Ngoài ra thì các dữ liệu mô tả điểm đó như ký hiệu, tên gọi…cũng được lưu trữ cùng với cặp tọa độ.

Thực thể đường (line entity, Hình III.8): được định nghĩa như là tập hợp các thực thể địa lý được xác định bằng những đoạn thẳng có ít nhất hai hay nhiều cặp tọa độ. Đường đơn giản nhất là đường nối giữa hai điểm bất kỳ có toạ độ (Xi, Yi) và (X j Yj) và có thể kèm theo dữ liệu ký hiệu thể hiện nó trên bản đồ. Điểm xuất phát và điểm kết thúc của đường gọi là nút (node). Một cung (arc), một kênh (chain) hay một chuỗi (string) là tập hợp của n cặp tọa độ biểu thị một đường cong phức tạp và liên tục.

Đường cong hay đường gấp khúc tạo nên bằng các đoạn thẳng nhỏ. Các đoạn thẳng nhỏ này được nối với nhau tại các điểm trung gian gọi là vertex và toạ độ của chúng cũng được ghi nhận trong GIS. Đường trong mô hình dữ liệu vector có hướng và có độ dài. Mô hình vector ghi nhận hướng của đường theo một trật tự nhất định, có thể là bắt đầu từ nút i

và kết thúc là nútj

Các dữ liệu điểm dù là nút của đường hoặc là vertex (điểm trung gian) đều có mã của chúng. Mã này có thể là số thứ tự được tạo nên khi ta nhập dữ liệu vector vào máy tính (bằng số hoá hoặc một phương pháp nào đó).

Khái niệm mạng lưới đường (line network): Tổ hợp các đoạn thẳng đơn giản không chứa các thông tin liên quan đến mạng lưới và sẽ gây khó khăn trong các phân tích đường tiêu nước, hệ thống giao thông…Để có thể tạo được một cấu trúc mạng, trong đó máy tính dễ dàng xác định thứ tự liên quan giữa các đường, người ta phải tạo các quan hệ ràng buộc, chỉ ra sự liên kết giữa các đoạn thẳng. Line Network là sự tổ hợp của các đoạn thẳng gắn với sự thể hiện liên tục quan hệ giữa chúng qua các điểm nút (node). Các node

Page 7: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

cho biết hướng và xác định góc mà mỗi đoạn cong gắn vào nút, tạo thành mối quan hệ không gian cho toàn bộ mạng lưới (topology). Hình III.8 là minh họa cho các loại đường khác nhau được thể hiện dạng vector trong GIS.

Thực thể vùng (polygon entity, region or area): Vùng là một đối tượng hình học 2 chiều. Đối tượng không gian dạng vùng trong mô hình vector được thể hiện là một đa giác (polygon) khép kín bởi các đường. Vậy vùng là tổ hợp của đường khép kín nên toạ độ của vùng tại ranh giới vùng chính là toạ độ của các điểm (nút hoặc vertex) nằm trong các đường hình thành nên vùng. Khi có bất kỳ toạ độ nào nằm trong vùng mà không được ghi nhận trong cơ sở dữ liệu vùng, GIS có thể cho phép đưa ra toạ độ của chúng bằng các modul nội suy một cách nhanh chóng và chính xác.

Vùng có thể là một đa giác đơn giản hay hợp của nhiều đa giác đơn giản. Do một vùng được cấu tạo từ các đa giác nên cấu trúc dữ liệu của đa giác phải ghi lại được sự hiện diện của các thành phần này và các phần tử cấu tạo nên đa giác.

Mô hình dữ liệu này thích hợp trong biểu diễn dữ liệu có ranh giới rõ ràng như ranh nhà, ranh đường…

Hình III.8: Quan hệ hình học và hình học topo của dữ liệu vector

Ví dụ dưới đây minh họa cách thể hiện các dạng đối tượng dưới dạng dữ liệu vector. Với các cặp tọa độ (x,y) ta có thể biểu diễn điểm, đường và polygons dưới dạng

Page 8: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

danh sách các tọa độ thay cho sơ đồ vẽ. Trong hình ví dụ dưới đây, cặp tọa độ (3,2) biểu diễn cho một điểm vị trí (nhà); Các cặp (1,5)   (3,5)   (5,7)   (8,8) và (11,7) biểu diễn cho đối tượng đường (đường giao thông); và các cặp (6,5)   (7,4)   (9,5)   (11,3)   (8,2)  (5,3) và (6,5) biểu diễn cho polygon (hồ). Tọa độ đầu và cuối của polygon là giống nhau; polygon luôn luôn khép kín. Danh sách của các tọa độ này cho ta thấy các đối tượng địa lý được lưu trữ trong máy tính dưới dạng các tập hợp tọa độ (x,y).

Hình III.9: Mô hình dữ liệu Vector

Cấu trúc vector có ưu điểm là vị trí của các đối tượng được định vị chính xác (nhất là các đối tượng điểm, đường và đường bao). Cấu trúc này giúp cho người sử dụng dễ dàng biên tập bản đồ, chỉnh sửa, in ấn. Tuy nhiên cấu trúc này có nhược điểm là phức tạp khi thực hiện các phép chồng xếp bản đồ.

I.3/ So sánh mô hình Raster và Vector:

Cấu trúc lưu trữ dữ liệu không gian trong một phần mềm GIS có thể bao gồm thông tin topo khi cần thiết. Thông tin về topo không những chỉ diễn tả vị trí của vật thể trong không gian mà còn chỉ ra những quan hệ không gian của vật thể với các vật thể cận kề nó. Những thông tin topo đặc biệt quan trọng đối với rất nhiều loại phân tích dữ liệu không gian như tự động nhận biết lỗi nhập dữ liệu, tạo cửa sổ biểu thị vật thể và giao diện trên màn hình, ứng dụng tính toán mạng lưới, xác định nếu một điểm có nằm trong một vùng, tạo vùng đệm, chồng xếp bản đồ, và các xử lý cắt bản đồ khác. Tuy vậy, nếu ứng dụng phần mềm không đòi hỏi các thông tin chi tiết về quan hệ không gian thì có thể lưu trữ các thông tin topo chỉ làm phức tạp hóa không cần thiết cấu trúc của cơ sở dữ liệu. Điều này chỉ làm cho các động tác quản lý như cập nhật, mở rộng CSDL trở nên kém hiệu quả. Ví dụ chỉ cần cấu trúc dữ liệu vector không bao gồm thông tin topo, cho công việc thể hiện bản đồ lên màn hình và in ấn bản đồ.

Mô hình raster có ưu điểm là có cấu trúc dữ liệu đơn giản, dễ dàng chồng xếp các dữ liệu, cho nhiều khả năng biến động không gian ở mức cao, hiệu quả trong việc tăng dầy và thể hiện các dạng ảnh số. Nhược điểm của mô hình là lưu trữ và nén dữ liệu gặp khó khăn, khó thể hiện các mối quan hệ vị trí không gian, chất lượng ảnh không cao. Muốn khắc phục điều này thường phải tăng độ phân giải, giảm kích thước của ô vuông cơ sở, pixel (tăng số lượng pixel) nhưng điều đó lại tăng khối lượng dữ liệu lưu trữ và tất nhiên ảnh hưởng lớn đến hiệu suất việc quản lý dữ liệu lưu trữ và công tác phân tích sau này.

Mô hình vector có ưu điểm hơn hẳn raster trong việc lưu trữ dữ liệu. Có hiệu quả cao khi phân tích dữ liệu với mô hình topo ví dụ như trong phân tích mô hình mạng

Page 9: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

(network analysis). Hình ảnh bản đồ có chất lượng cao khi in ấn và thể hiện trên màn hình. Tuy vậy mô hình vector có cấu trúc dữ liệu phức tạp gây trở ngại trong các phân tích dữ liệu như chồng xếp và xử lý cắt bản đồ.

Bảng III.1: Ưu điểm và nhược điểm của hai mô hình dữ liệu không gian Raster và Vector

Mô hình Ưu điểm Khuyết điểmRaster - Cấu trúc dữ liệu đơn giản

- Thích hợp để biểu diễn dữ liệu viễn thám hoặc dữ liệu quét- Chồng lớp được dễ dàng và hiệu quả- Phương pháp phân tích không gian đơn giản và hiệu quả

- Chiếm nhiều bộ nhớ- Tuỳ thuộc và kích thước ô, hình ảnh xuất có thể không đẹp- Khó khăn trong việc thể hiện mối quan hệ topology

Vector - Cấu trúc dữ liệu nén, chiếm ít bộ nhớ- Topology được duy trì, nên rất tiện lợi trong các bài toán phân tích không gian- Hình ảnh xuất giống với bản đồ vẽ tay

- Cấu trúc dữ liệu phức tạp- Không phù hợp đối với dữ liệu viễn thám- Phương pháp phân tích không gian phức tạp- Chồng lớp tốn nhiều thời gian

Bảng III.2: So sánh mô hình dữ liệu dạng vetor và raster

Trong phân tích không gian, tuỳ theo kinh nghiệm và thói quen của các chuyên gia GIS mà lựa chọn mô hình vector hoặc raster. Đa số các hệ GIS được dùng luôn kết hợp cả hai mô hình raster và vector trong nghiên cứu tổ hợp các nguồn dữ liệu từ số hoá bản đồ và nguồn ảnh raster từ viễn thám cũng như quét ảnh.

Trong ứng dụng, hai mô hình trên thường sử dụng đồng thời. Các phép chuyển đổi tự động từ vector sang raster và ngược lại được thiết kế trong các hệ phần mềm GIS. Sự chuyển đổi này giúp cho quá trình nhập dữ liệu hết sức nhanh chóng. Ví dụ, một bản đồ địa hình có thể được quét trên máy quét và dữ liệu thu được ở dạng raster. Dữ liệu này sẽ được chuyển sang dạng vector cho các đối tượng không gian là đường đồng mức. Quá

Page 10: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

trình này gọi là quá trình số hoá tự động. Trong quá trình số hoá, hai bước quét và chuyển đổi này yêu cầu phải thực hành những trình tự thủ thuật nghiêm ngặt sao cho các dữ liệu đường đồng mức được chuyển đổi riêng, loại bỏ được các số ghi, các tên địa danh và các đối tượng không gian không phải là đường.

II. Dữ liệu thuộc tính:

Dữ liệu thuộc tính là các thông tin đi kèm với các dữ liệu không gian chỉ ra các tính chất đặc trưng cho mỗi đối tượng điểm, đường và vùng trên bản đồ. Dữ liệu thuộc tính dùng để mô tả đặc điểm của đối tượng. Dữ liệu thuộc tính có thể là định tính - mô tả chất lượng (qualitative) hay là định lượng (quantative).

Trong ngành môi trường và tài nguyên, người ta phân các thông tin thuộc tính thành các nhóm sau:

- Thông tin cơ sở hạ tầng: gồm các thông tin bổ trợ cho các lớp dữ liệu không gian như thông tin về các loại đường giao thông, hệ thống thủy lợi, thủy văn, về mạng lưới điện, mạng lưới cấp thoát nước, về các công trình cơ sở hạ tầng…

- Thông tin kinh tế văn hóa xã hội: các thông tin về mạng lưới hành chính, dân cư, phát triển kinh tế, đầu tư giáo dục, y tế, an ninh quốc phòng…

- Thông tin môi trường: các thông tin về ô nhiễm môi trường, về hạn hán ngập lụt, sâu bệnh, về các thảm họa, rủi ro do thiên nhiên gây ra.

- Thông tin đất đai, địa chính: các thông tin về tài nguyên đất, hệ thống thửa đất, đăng ký đất đai, hệ thống thuế đất, định giá đất và tài sản, hệ thống pháp luật đất đai…

Các thông tin thuộc tính thường được lưu trữ dưới dạng các tệp tin dữ liệu của các hệ quản trị dữ liệu như DBASE, FOXPRO, EXCELS, ACCES, ORACLE. Thông thường các phần mềm GIS như MAPINFO, ARCINFO, ARCVIEW, MGE, ILLIWIS thường có thêm phần chức năng quản trị cơ sở dữ liệu thuộc tính dưới dạng các tệp *.DAT, *.DBF.

II.1/ Cấu trúc quan hệ giữa dữ liệu không gian và thuộc tính:

Để quản lý dữ liệu thuộc tính của các đối tượng địa lý trong CSDL, GIS đã sử dụng phương pháp gán các giá trị thuộc tính cho các đối tượng thông qua các bảng số liệu. Mỗi bản ghi (record) đặc trưng cho một đối tượng địa lý (đối tượng không gian), mỗi cột của bảng tương ứng với một kiểu thuộc tính của đối tượng đó.

Một bảng dữ liệu thuộc tính của các đối tượng không gian bao gồm: các hàng (mẩu tin – Record) và các cột (Field). Các cột được gọi là các trường dữ liệu, mỗi trường là một thuộc tính của một đối tượng không gian. Các trường có kích thước khác nhau về độ lớn của dữ liệu và về bản chất của trường. Một mẩu tin (row/record) trong bảng dữ liệu sẽ mô tả thuộc tính của một đối tượng không gian.

Page 11: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

Hình III.10: Minh họa cấu trúc bảng thuộc tính

Các mối quan hệ thể hiện sự kết nối giữa 2 tệp dữ liệu (2 bảng thuộc tính) có cùng một hay nhiều thuộc tính chung theo các kiểu quan hệ 1 – 1 (một bảng thuộc tính này đến một bảng thuộc tính khác), 1 – n (một bảng thuộc tính đến n bảng thuộc tính khác) hay n – m (nhiều bảng đến nhiều bảng khác). Ví dụ cấu trúc quan hệ giữa hai loại dữ liệu quan trọng này trong GIS về tình hình sử dụng đất được minh họa trong Hình III.11: quan hệ giữa thửa đất và mã thửa đất là 1 – 1, giữa tờ bản đồ và các thửa đất là 1 – n, giữa các thửa đất và các mục đích sử dụng đất là n – m.

Để thể hiện các quan hệ đó người ta sử dụng các trường khóa chung trong các tệp tin quan hệ. Các trường chung này có tên là khóa quan hệ (key field), ví dụ trường số thửa đất trong các bảng ở Hình III.11 là trường khóa quan hệ.

Hình III.11: Mô hình quan hệ giữa dữ liệu không gian và dữ liệu thuộc tính

Như vậy, trong hệ quản lý dữ liệu cần phải hiểu rõ các khái niệm: hàng (mẩu tin – Record), trường dữ liệu (Field), khoá chính (Primary key - PK), khóa phụ (khoá ngoại – Foreign key - FK).

Trường dữ liệu (Field)

Bản ghi (record)

Page 12: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

Để việc tìm kiếm dữ liệu được thực hiện nhanh và hiệu quả, các bảng dữ liệu sẽ được nhận dạng thông qua một trường đặc trưng cho bảng dữ liệu đó, trường dữ liệu này được gọi là trường khoá. Trường khoá chứa giá trị mang tính duy nhất (các giá trị thuộc tính trong trường không được trùng lắp) và được sử dụng nhiều nhất để nhận dạng các bảng dữ liệu được gọi là trường khoá chính (PK). Trường khoá ngoại (FK) của một bảng dữ liệu là trường khoá mà nó là trường khoá chính của bảng dữ liệu khác (nghĩa là khoá chính của bảng dữ liệu này sẽ là khóa ngoại của bảng dữ liệu khác có liên quan). Trường khoá ngoại có thể chứa các giá trị thuộc tính giống nhau (các giá trị thuộc tính trong trường có thể được lặp lại)

Ví dụ: Trong một trường đại học, người ta quản lý sinh viên thông qua Khoa và mã số sinh viên nên khi thiết kế cơ sở dữ liệu để quản lý người ta sẽ thiết kế như sau:

Bảng dữ liệu “thông tin Khoa”: bảng dữ liệu này được xác định tính duy nhất nhờ vào trường “Mã Khoa” – đây là trường khoá chính. Vì mỗi khoa có một mã duy nhất

Bảng dữ liệu “thông tin sinh viên”: thuộc tính của bảng dữ liệu này được xác định tính duy nhất nhờ vào trường thuộc tính “MSSV” – đây là trường khoá chính. Vì mỗi sinh viên chỉ được mang một mã số nhất định. Tuy nhiên, để biết sinh viên thuộc Khoa nào thì người ta phải thiết kế thêm trường “Mã Khoa” trong bảng dữ liệu này. Như vậy, trường “Mã Khoa” là truờng khoá chính của bảng dữ liệu “thông tin Khoa” nhưng lại là trường khoá phụ của bảng dữ liệu “thông tin sinh viên” (vì có nhiều sinh viên trực thuộc một Khoa)

Các trường khoá sẽ xác định các mối quan hệ giữa các bảng dữ liệu thuộc tính của các đối tượng (các bảng dữ liệu này có thể liên kết với các đối tượng không gian hoặc có thể là các bảng dữ liệu độc lập), dựa vào các trường khoá này ta có thể thực hiện được các thao tác liên kết, truy vấn, phân tích dữ liệu của các đối tượng.

Bảng III.3: Mô tả các trường khoá chính,trường khoá ngoại và mối quan hệ giữa các bảng dữ liệu.

II.2/ Mô hình quản lý CSDL thuộc tính:

Về nguyên tắc, số lượng các thuộc tính của một đối tượng là không có giới hạn. Phần lớn dữ liệu thuộc tính được lưu trữ trong các tệp tin riêng biệt và cấu trúc lưu trữ của chúng hiện nay được xây dựng dựa trên quan niệm về hệ thống quản lý CSDL (Database Management Systems, DBMS)

Để quản lý dữ liệu thuộc tính của các đối tượng địa lý trong CSDL, GIS đã sử dụng phương pháp gán các giá trị thuộc tính cho các đối tượng thông qua các bảng số liệu. Mỗi bản ghi (record) đặc trưng cho một đối tượng địa lý, mỗi cột của bảng tương ứng với một kiểu thuộc tính của đối tượng đó.

Page 13: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

Các dữ liệu trong GIS thường rất lớn và lưu trữ ở các dạng file khác nhau nên tương đối phức tạp. Do vậy để quản lý, người ta phải xây dựng các cấu trúc chặt chẽ cho các CSDL. Trong GIS việc sắp xếp, tổ chức dữ liệu cần được thiết kế sao cho có thể tìm được các đối tượng không gian và thuộc tính của chúng bằng nhiều cách tiếp cận khác nhau. Dữ liệu thuộc tính trong GIS có thể được tổ chức theo 3 dạng mô hình: mô hình phân cấp, mô hình mạng, mô hình quan hệ. Mô hình dữ liệu được định nghĩa là kiểu mô tả và thao tác dữ liệu trên một cơ sở dữ liệu.

Mô hình dữ liệu phân cấp: dữ liệu được tổ chức theo cấu trúc cây. Mỗi mẩu tin có một mẩu tin bậc cao hơn liên kết với chúng, quan hệ 1 – n hoặc 1 – 1. Mô hình này hiệu quả trong tìm kiếm dữ liệu nếu tất cả các đường truy xuất tuân theo mối liên kết cha con

Mô hình dữ liệu mạng: mỗi mẩu tin có thể có nhiều hơn một mẩu tin cha và mỗi mẩu tin có thể được liên kết tới một mẩu tin khác bất kỳ, quan hệ n – n. Mô hình mạng thích hợp trong các ứng dụng phân phối tài nguyên, các phân tích vị trí…

Mô hình dữ liệu quan hệ: dữ liệu được thể hiện dưới dạng bảng. Các bảng chứa đựng các cột mà nó tham chiếu đến bảng dữ liệu liên quan.

a) Mô hình dữ liệu phân cấp:

Dữ liệu được phân cấp theo quan hệ cha – con hoặc 1 – n. Đặc trưng của mô hình dữ liệu này là mỗi mẩu tin có một mẩu tin bậc cao hơn liên kết với nó, nghĩa là các mẩu tin sẽ quan hệ với nhau theo thứ bậc. Ví dụ mô hình dữ liệu phân cấp trong thể hiện các mối quan hệ trong một trường đại học: Một trường đại học có nhiều Khoa, mỗi Khoa sẽ có các thông tin đi kèm như số giảng viên, số nhân viên, tên chủ nhiệm Khoa…Mỗi Khoa sẽ có một số giảng viên với tên, bằng cấp, kinh nghiệm giảng dạy…

Trên Hình III.12 minh họa một ví dụ về cách tổ chức dữ liệu địa lý theo các mô hình phân cấp và mạng cho bản đồ M, biểu diễn hai miền I và II dưới dạng hai đa giác với các đỉnh đc đánh số ( 1, 2, 3, 4 cho đa giác I và 4, 3, 5, 6 cho đa giác II) và các cạnh ký hiệu bằng các chữ (a, b, c, d cho đa giác I và c, e, f, g cho đa giác II)

Cấu trúc này tạo thuận lợi cho việc bổ sung, sửa đổi và mở rộng, tiện lợi cho việc truy nhập dữ liệu theo thuộc tính khoá, nhưng khó khăn cho những thuộc tính không phải là khoá, nghĩa là trong mô hình này các liên kết chỉ theo phương đứng nhưng không theo phương ngang hoặc theo đường chéo, điều này muốn nói rằng không tồn tại các mối quan hệ giữa các nhánh cây. Ngoài ra, cấu trúc dữ liệu phân cấp yêu cầu các gía trị thuộc tính phải được lặp lại nhiều lần gây ra dư thừa dữ liệu làm tăng chi phí lưu trữ và truy nhập

b) Mô hình dữ liệu mạng:

Trong mô hình mạng, một đối tượng hay thực thể có thể có quan hệ với nhiều gốc và quan hệ với nhiều đối tượng nhánh gọi là đối tượng con.

Điểm khác biệt quan trọng giữa mô hình mạng và mô hình phân cấp là mỗi mẩu tin con có thể có nhiều hơn một mẩu tin cha và mỗi mẩu tin có thể được liên kết tới một mẩu tin khác bất kỳ (quan hệ 1 – n và n – n). Mô hình dữ liệu mạng được minh hoạ trong Hình III.12

Page 14: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

Hình III.12: Các cấu trúc dữ liệu địa lý mạng và phân cấp

Mô hình dữ liệu mạng cho phép giảm sự dư thừa của dữ liệu, tìm kiếm một đối tượng nhanh hơn và được tìm theo nhiều cách khác nhau. Tuy nhiên, cần phải có một chương trình tương quan để nhận biết sự tương quan theo mạng để giải quyết sự phức tạp trong tương quan đa chiều với đa đối tượng.Việc cập nhật cơ sở dữ liệu cũng mất nhiều thời gian bởi vì số lượng các mối liên kết phải xây dựng lại. Mô hình mạng thích hợp trong các ứng dụng phân phối tài nguyên, các phân tích vị trí…

c) Mô hình quan hệ:

Cấu trúc dữ liệu quan hệ tổ chức dữ liệu theo dạng các bảng hai chiều, trong đó mỗi bảng là một tệp riêng biệt. Mỗi hàng của bảng là một bản ghi, và mỗi bản ghi có một tập hợp các thuộc tính. Mỗi cột của bảng biểu thị một thuộc tính. Các bảng khác nhau có thể được liên hệ với nhau thông qua một chỉ số chung thường được gọi là khóa. Các thông tin được khai thác thông quan phương thức truy vấn. Trong trường hợp bản đồ M, cách tổ chức dữ liệu theo cấu trúc quan hệ được minh họa trên Hình III.13

Hình III.13: Mô hình cấu trúc dữ liệu quan hệ

So sánh với các mô hình vừa nêu, mô hình dữ liệu quan hệ đơn giản hơn, trong đó tất cả dữ liệu được thể hiện dưới dạng bảng (quan hệ) bao gồm các hàng (mẩu tin) và cột (trường thuộc tính). Các bảng chứa đựng các trường khoá để nó tham chiếu đến các bảng liên quan. Mô hình dữ liệu quan hệ được thể hiện trong Hình III.14

Page 15: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

Mô hình dữ liệu quan hệ có một số ưu điểm sau:

- Phương pháp thiết kế dựa trên nền tảng lý thuyết hợp lý

- Tất cả mô hình khác có thể chuyển về dạng tập các bảng quan hệ

- Dễ dàng sử dụng và thực hiện so với các mô hình dữ liệu khác

- Điều chỉnh, thêm các bảng quan hệ, dữ liệu và mẩu tin dễ dàng

- Linh động trong truy xuất dữ liệu do cơ cấu kết nối liên hệ và ngôn ngữ truy vấn mạnh

Khuyết điểm của mô hình dữ liệu quan hệ:

- Đòi hỏi về nguồn lực xử ký khi số người sử dụng gia tăng đối với hệ thống đã cho lớn hơn so với các loại mô hình dữ liệu khác

- Phương thức truy xuất tuần tự thì chậm

- Dễ dàng có lỗi luận lý do sự linh động trong mối quan hệ giữa các mẩu tin

Mô hình dữ liệu quan hệ được áp dụng rộng rãi để quản lý cơ sở dữ liệu dùng trong GIS.

Trong cơ sở dữ liệu quan hệ, việc tìm kiếm thông tin có thể được thực hiện trên một bảng quan hệ đơn hoặc thực hiện trên nhiều bảng quan hệ. Trong trường hợp tìm kiếm thông tin trải ra trên nhiều bảng quan hệ, cơ sở của việc liên kết thông tin từ các bảng quan hệ lại với nhau là việc sử dụng các trường thuộc tính chung. Việc liên kết được thực hiện thông qua kết nối từ trường khoá chính của bảng này đến trường khoá ngoại của bảng kia.

Mối quan hệ giữa các bảng:

Quan hệ 1 – 1 (one to one): Quan hệ giữa hai bảng là mỗi dòng trong bảng này tương ứng với một dòng trong bảng kia

Quan hệ 1 – n (one to many) hoặc n – 1: Quan hệ 1 – n giữa hai bảng là mỗi dòng trong bảng này có quan hệ với nhiều dòng trong bảng kia. Quan hệ n – 1 thì ngược lại

Quan hệ n – n (many to many): Quan hệ n – n giữa hai bảng là mỗi dòng trong bảng này có quan hệ với nhiều dòng trong bảng kia và ngược lại.

Page 16: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

Hình III.14: Minh hoạ mối quan hệ giữa các bảng

III. Dữ liệu địa lý được biểu diễn như thế nào?

Hình III.15 Minh họa mô hình thế giới thực bằng dữ liệu GISYêu cầu chung về truy cập tới các dạng thức dữ liệu khác nhau đã dẫn đến việc tổ

chức các dữ liệu địa lý sử dụng trong GIS thành các lớp thông tin địa lý riêng biệt (Layers, Themes hay Coverages). Các lớp thông tin được áp dụng cho cả các dữ liệu vector và raster.

Các lớp thông tin có thể được kết hợp với nhau theo nhiều cách để tạo ra các lớp thông tin mới hay là tổng hợp của các lớp thông tin thành phần. Phương pháp kết hợp các lớp thông tin đơn giản nhất là sự chồng ghép các lớp thông tin lên nhau. Ngoài ra, công nghệ GIS cho phép sử dụng nhiều công cụ xử lý không gian phức tạp như giao (intersection), hợp (union), phân rã (dissolve)….để làm việc với các lớp thông tin địa lý.

Hình III.16: Mô hình các lớp dữ liệu trong GIS

Page 17: CHƯƠNG 3:thienthu.weebly.com/uploads/4/8/6/9/4869850/giao_trinh... · Web viewThuộc tính gán cho ô sẽ định nghĩa phân lớp, nhóm, chủ đề hoặc giá trị đo

Mục đích tổ chức dữ liệu trong GIS là để tối ưu hóa việc nhập dữ liệu, giảm bớt sự lưu trữ và các yêu cầu về xử lý dữ liệu. Các dữ liệu được tổ chức như sau (Hình III.17):

Hình III.17: Khái niệm về các lớp dữ liệu và tổ chức dữ liệu trong GISKhi đã xác định được các đối tượng và thuộc tính của chúng, chúng ta có thể tổ chức các đặc tính địa lý thành các tầng (lớp) dữ liệu như trong Hình III.17. Có nhiều yếu tố ảnh hưởng đến tổ chức lớp trong cơ sở dữ liệu địa lý và chúng khác nhau trong mỗi kiểu ứng dụng. Cách thông thường nhất là tổ chức lớp theo kiểu của các đặc tính (điểm, đường, vùng) và nhóm theo các chuyên đề. Các lớp được tổ chức sao cho các điểm, đường và vùng được lưu trữ trong các lớp riêng biệt. Ví dụ như các nhà ở mang đặc tính điểm có thể được lưu riêng thành một lớp trong khi đường giao thông đại diện cho đặc tính đường thì được lưu trong một lớp khác. Các đặc tính có thể tổ chức theo chuyên đề mà nó đại diện. Ví dụ dòng chảy và đường giao thông tuy cùng mang đặc tính đường nhưng có thể tổ chức thành 2 lớp khác nhau. Các thuộc tính đi kèm đặc tính địa lý thủy hệ (sông suối) có thể là tên gọi, phân loại (sông hoặc kênh rạch) và vận tốc dòng chảy trong khi thuộc tính của đường giao thông là tên gọi, kết cấu bề mặt và độ rộng…Do sự khác nhau rất xa về thuộc tính nên chúng phải được lưu trữ vào các lớp khác nhau nhưng phải cùng chung một vùng quan trắc địa lý (cùng một hệ thống tham chiếu không gian)