Tải bản đầy đủ - 0 (trang)
CƠ SỞ LÝ THUYẾT

CƠ SỞ LÝ THUYẾT

Tải bản đầy đủ - 0trang

xử lý. Hình dung như con người ta với khối lượng thơng tin vừa phải còn bao qt

được, chứ q nhiều thơng tin khơng có tổ chức làm sao mà xem hết được.

1.1.3. Các ngành khoa học không phải là Cơng nghệ thơng tin

Thí dụ như vật lý, hố học, sinh học, ngơn ngữ... cũng có các nhu cầu cần

lưu trữ, xử lý dữ liệu. Các cơ sở dữ liệu riêng biệt này mang những đặc tính riêng

của từng ngành. Các dữ liệu về địa lý, bao gồm các bảng số, các ảnh, các phương

pháp truy nhập đến các kho dữ liệu... cần được tổ chức và xử lý hợp lý. Các dữ

liệu địa lý, địa chất, thủy văn, môi trường... thường đòi hỏi các phương tiện nhớ

có dung lượng lớn và được xử lý trên các bộ xử lý đặc biệt để đảm bảo tốc độ

cao.

1.1.4. Tổ chức lưu trữ và xử lý dữ liệu

Việc tổ chức lưu trữ và xử lý dữ liệu cũng có nhu cầu trong các ứng dụng

có sử dụng hệ chuyên gia, người máy, xử lý các q trình cơng nghiệp. Hơn nữa,

trong đề án máy tính các thế hệ sau này, cơ sở dữ liệu có vị trí đáng kể. Riêng về

nhu cầu này, cơ sở dữ liệu cần có khả năng cơ giới hố việc tìm kiếm thơng tin

nhờ cơ chế suy luận tự động. Vấn đề thời gian thực trong cơ sở dữ liệu được giả

quyết để phù hợp với các hệ thống cơng nghiệp, thời gian có thể được thể hiện

trong cơ sở dữ liệu thông qua hai cách:

- Thời gian tương đối hệ quản trị cơ sở dữ liệu, liên quan đến thay đổi

trạng thái của cơ sở dữ liệu.

- Thời gian tuyệt đối của môi trường được mô tả trong cơ sở dữ liệu, liên

quan đến trạng thái của mơi trường.

Kiến thức về cơ sở dữ liệu còn được dùng để tổ chức cơ sở tri thức, thiết

lập hệ thống câu hỏi, chọn mơ hình trong hệ thống hỗ trợ giảng dạy, hay trong

công nghệ dạy học.

1.1.5. Ứng dụng trong hệ thống đa phương tiện

Việc xây dựng cơ sở dữ liệu đa phương tiện không thể không đề cập giao

diện người dùng trong cơ sở dữ liệu, đề cập các nghiên cứu về quan hệ và sự

kiện, đề cập việc tổ chức các câu hỏi cho người sử dụng. Người ta nhận thấy



khơng có ngơn ngữ nào là đặc biệt quan trọng và ưu điểm trội hơn hẳn, ngay cả

ngôn ngữ đồ thị. Một giao diện hiển thị thường được người ta ưa chuộng, với khả

năng:

+ Đưa ra câu trả lời dưới dạng hiển thị như đồ thị, lược đồ, có tác dụng

nhấn mạnh trực giác.

+ Có khả năng lựa chọn thông tin nhanh một cách tự nhiên, và nhanh

chóng.

+ Tìm kiếm trong cơ sở dữ liệu theo phương thức con người đã quen

thuộc, chẳng hạn theo cách tìm sách trong các tủ sách của thư viện.

Trong số các giao diện người dùng, giao diện đa hình thái, giao diện dùng

ngôn ngữ tự nhiên được quan tâm và nay cũng có nhiều kết quả tốt đẹp.

Tuy khơng được xây dựng như hệ thống tri thức hay hệ chuyên gia, cơ sở

dữ liệu có thể mơ tả và xử lý các tri thức. Một thế hệ mới của các cơ sở dữ liệu

suy diễn, các tri thức xử lý được thể hiện dưới các dạng:

1. Tri thức tổng quát như các luật và sự kiện,

2. Các điều kiện thay đổi, hoặc kích hoạt dữ liệu,

3. Suy diễn các thơng tin có liên hệ với các sự kiện và luật.

Ngồi ra, người ta còn đề cập khía cạnh về xử lý các tri thức không đầy

đủ.

* Cơ sở dữ liệu được thành lập từ các tập tin cơ sở dữ liệu để quản lý và

khai thác. Mỗi tập tin cơ sở dữ liệu bao gồm các mẩu tin (Record) chứa một số

thơng tin về đối tượng.

Nhu cầu tích lũy và xử lý các dữ liệu đã nảy sinh trong mọi công việc,

trong mọi hoạt động của con người. Một cá nhân hay một tổ chức có thể đã ngầm

có một hệ thống xử lý dữ liệu, cho dù cơ chế hoạt động của nó là thủ cơng và

chưa tự động hoá.

Một bài toán nhỏ cũng cần đến dữ liệu, nhưng không nhất thiết phải quản lý

các dữ liệu này theo các phương pháp khoa học. Do khả năng tổng hợp của người

xử lý các, các dữ liệu được lấy ra, được xử lý mà khơng vấp phải khó khăn nào.

Tuy nhiên khi bài tốn có kích thước lớn hơn hẳn và số lượng dữ liệu cần phải xử



lý tăng lên nhanh thì e rằng tầm bao quát của con người bình thường khó có thể

quản lý hết được đấy là không kể đến một số loại dữ liệu đặc biệt, chúng đòi hỏi

được quản lý tốt khơng phải vì kích thước mà vì sự phức tạp của bản thân chúng.

Lúc bắt đầu cơng tác tự động hố xử lý dữ liệu, người ta sử dụng các tệp

dữ liệu nơi chứa thơng tin và dùng các chương trình để tìm kiếm, thao tác trên

các dữ liệu của tệp đó. Đó tiền thân của các hệ thống cơ sở dữ liệu. Tuy nhiên

một vài người hiểu chưa chính xác về cơ sở dữ liệu, họ coi các hệ quản trị là cơ

sở dữ liệu. Việc coi các “tệp dữ liệu” là cơ sở dữ liệu hoặc coi một phần mềm nào

cho phép xử lý dữ liệu như hệ quản trị cơ sở dữ liệu... là nhìn nhận khơng chính

xác. Để hiểu đầy đủ các khía cạnh về hệ quản trị cơ sở dữ liệu, người ta cần được

trang bị các khái niệm cơ bản.

Tổ chức việc xử lý dữ liệu một cách khoa học đòi hỏi con người sử dụng

cơ sở dữ liệu. Trên các hệ thống máy lớn cũng như các máy vi tính, phần mềm

quản trị cơ sở dữ liệu phải có những đặc trưng để người dùng có thể phân biệt nó

với chương trình thao tác đơn giản trên các dữ liệu.

Hệ quản trị cơ sở dữ liệu có phương pháp, cơng cụ để lưu trữ, tìm kiếm,

sửa đổi và chuyển đổi các dữ liệu. Đó là các chức năng đầu tiên, được thực hiện

theo các thuật tốn hồn thiện, đảm bảo được bảo vệ và đảm bảo việc thực hiện

đạt hiệu quả.

Hệ quản trị cơ sở dữ liệu có giao diện sử dụng cho phép người dùng liên

hệ với nó. Nó cũng liên hệ với các bộ nhớ ngồi qua giao diện, qua các lệnh các

ngơn ngữ người/máy. Người sử dụng dùng ngôn ngữ hỏi cơ sở dữ liệu để khai

thác các chức năng của hệ quản trị cơ sở dữ liệu. Hệ quản trị trao đổi với các tệp

cơ sở dữ liệu đang được lưu trữ trên phương tiện nhớ.

Mô tả dữ liệu được xem như việc xác định tên, dạng dữ liệu và tính chất

của dữ liệu. Hệ quản trị cơ sở dữ liệu khác hẳn với hệ quản lý các tệp hay các tệp

cơ sở dữ liệu bởi lẽ nó cho phép mơ tả dữ liệu theo cách không phụ thuộc vào

người sử dụng, không phụ thuộc vào yêu cầu tìm kiếm và thay đổi thông tin.

Tuy phân biệt được các hệ thống quản trị tệp với các hệ quản trị cơ sở dữ

liệu, người ta vẫn nhìn nhận việc xử lý dữ liệu theo cách người ta đã quen dùng.



Theo cách nhìn từ bộ nhớ ngoài đang lưu trữ các dữ liệu cho đến nơi có người

yêu cầu xử lý dữ liệu, người ta thấy có các chức năng liên quan đến dữ liệu như:

- Chức năng quản lý dữ liệu ở bộ nhớ phụ, như hệ thống quản lý các tệp

phân phối khoảng trống trên thiết bị nhớ.

- Chức năng quản lý dữ liệu trong các tệp, quản lý quan hệ giữa các dữ

liệu nhằm tìm kiếm nhanh. Đó là hệ truy nhập dữ liệu hay hệ thống quản trị dữ

liệu theo cấu trúc vật lý của dữ liệu. Do vậy chương trình ứng dụng thực hiện

chức năng quản trị dữ liệu không thể quản lý dữ liệu một cách rõ ràng được.

- Chức năng quản trị dữ liệu theo các ứng dụng. Nếu người sử dụng được

phép mô tả dữ liệu, họ có thể diễn tả yêu cầu về dữ liệu nhờ một ngơn ngữ. Đó là

hệ quản trị cơ sở dữ liệu ngồi, có các khả năng phân tích, dịch các câu hỏi, và

tạo dạng dữ liệu phù hợp với thế giới bên ngoài.

1.2. Cấu trúc một hệ cơ sở dữ liệu

Một hệ cơ sở dữ liệu được chia thành các mức khác nhau: mức vật lý, mức

lơgíc.

- Cơ sở dữ liệu mức vật lý là tập hợp các tệp CSDL theo một cấu trúc nào

đó được lưu trữ trên các thiết bị nhớ thứ cấp như đĩa từ, băng từ. Cơ cấu ở mức

lôgic là một sự biểu diễn trừu tượng của cơ sở dữ liệu vật lý. Cấu trúc của một

CSDL bao gồm:

- Thể hiện (Instance): Một khi đã được thiết kế, thường người ta quan tâm

tới “Bộ khung” hay còn gọi là “mẫu” của CSDL. Dữ liệu hiện có trong CSDL gọi

là thể hiện của CSDL, mặc dù khi dữ liệu thay đổi trong một chu kỳ thời gian nào

đó thì “Bộ khung” của CSDL vẫn khơng thay đổi.

- Lược đồ (scheme): Thường “Bộ khung” nêu trên bao gồm một số danh

mục, hoặc chỉ tiêu hoặc một số kiểu của các thực thể trong CSDL. Giữa các thực

thể có thể có mối quan hệ nào đó với nhau.

* Có các lược đồ sau:

- Lược đồ khái niệm là bộ khung của cơ sở dữ liệu khái niệm.

- Lược đồ vật lý là bộ khung của cơ sở dữ liệu mức vật lý.

- Lược đồ con là mức khung nhìn.



Mơ hình dữ liệu: Có nhiều loại mơ hình dữ liệu, hiện đang có ba loại mơ

hình dữ liệu đang sử dụng là:

+ Mơ hình phân cấp: Mơ hình dữ liệu là một cây, trong đó các nút biểu

diễn các tập thực thể, giữa các nút con và nút cha được liên hệ theo mối liên hệ

xác định.

+ Mơ hình mạng: Mơ hình được biễu diễn là một đồ thị có hướng.

+ Mơ hình quan hệ: Mơ hình dựa trên cơ sở khái niệm lý thuyết tập trung

của các quan hệ tức là tập hợp các k bộ (với k cố định).

- Tính độc lập dữ liệu: Là sự bất biến của các hệ ứng dụng đối với các

thay đổi trong cấu trúc dữ liệu và chiến lược truy nhập. Tính độc lập dữ liệu là

mục tiêu chủ yếu của hệ CSDL.

* Có hai mức độc lập dữ liệu:

+ Độc lập dữ liệu mức vật lý:

Việc tổ chức lại CSDL vật lý (thay đổi các tổ chức, cấu trúc dữ liệu trên

các thiết bị nhớ thứ cấp) có thể làm thay đổi hiệu quả tính tốn của các chương

trình ứng dụng mà không cần thiết phải viết lại các chương trình đó.

+ Độc lập dữ liệu mức lơgic:

Khi sử dụng một CSDL, có thể cần thiết phải thay đổi lược đồ khái niệm

như thêm thông tin về các loại khác nhau của các thực thể đang tồn tại trong

CSDL. Việc thay đổi lược đồ khái niệm không nhất thiết phải thay đổi các

chương trình ứng dụng.

Trong các loại mơ hình dữ liệu trên thì mơ hình quan hệ có nhiều ưu điểm

và được quan tâm nhiều nhất bởi vì mơ hình quan hệ có tính độc lập dữ liệu rất

cao lại dễ sử dụng. Song điều quan trọng chủ yếu là mơ hình quan hệ được hình thức

hố tốn học tốt, do đó được nghiên cứu phát triển và cho nhiều kết quả lý thuyết

cũng như ứng dụng trong thực tiễn.

1.3. Mơ hình cơ sở dữ liệu quan hệ

1.3.1. Cơ sở dữ liệu quan hệ

CSDL là tập các dữ liệu (DL) có cấu trúc cho nên CSDL quan hệ là CSDL

nhưng phải có các đặc trưng sau:



-



Một quan hệ là một quan hệ 2 chiều bao gồm các cột và các hàng của các

thành phần DL.



-



Mỗi bảng (Table) là một quan hệ.Và tên mỗi bảng phải là duy nhất, một

bảng bao gồm 1 hay nhiều cột (Đây là số trường - field). Số cột có trong

bảng chính là số trường quan hệ.



-



Mỗi bảng bao gồm khơng hoặc nhiều dòng (Số bản ghi - record). Đây

chính là các bản ghi của quan hệ.



 Khố chính : Là một hay nhiều cột trong bảng có đặc điểm dữ liệu của các

cột này phải có khi nhập, và là duy nhất khơng trùng lặp.

 Khố ngồi: Là một hoặc nhiều cột chứa khố chính của một quan hệ

khác, dùng để tạo mối liên kết giữa 2 bảng.

VD: Ta có một CSDL quản lý nhân sự cho Uỷ ban Kiểm tra Tỉnh uỷ Yên

Bái với các bảng như sau: Bảng NHANVIEN: Lưu trữ các thông tin chung của

cán bộ như mã cán bộ, họ tên, ngày sinh,… Bảng LUONG: lưu trữ thông tin về

lương của cán bộ. Bảng CHUCVU: lưu trữ thông tin về chức vụ của nhân viên.



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

CƠ SỞ LÝ THUYẾT

Tải bản đầy đủ ngay(0 tr)

×