Tài liệu

Cơ sở dữ liệu là gì? Hệ quản trị CSDL, Mô hình, Thiết kế CSDL

Tài nguyên về dữ liệu gồm các cơ sở dữ liệu (CSDL – Database).

Cơ sở dữ liệu là tổng thể các dữ liệu đã được thu thập, lựa chọn và tổ chức một cách khoa học theo một mô hình có cấu trúc xác định, tạo điều kiện cho người sử dụng có thể truy cập một cách dễ dàng và nhanh chóng. CSDL lưu trữ tất cả các dữ liệu liên quan trong một kho dữ liệu duy nhất.

Các CSDL trong quản lý bao gồm: CSDL quản trị nhân lực, CSDL tài chính, CSDL kế toán, CSDL công nghệ, CSDL kinh doanh…

1. Hệ quản trị CSDL là gì?

Hệ quản trị CSDL là phần mềm hay chương trình thiết kế để quản trị một CSDL. Các chương trình thuộc loại này hỗ trợ khả năng lưu trữ, sửa chữa, xóa và tìm kiếm thông tin trong một CSDL. Có rất nhiều loại hệ quản trị CSDL khác nhau: từ phần mềm nhỏ chạy trên máy tính cá nhân cho đến những hệ quản trị phức tạp chạy trên một hoặc nhiều siêu máy tính.

Mỗi CSDL cần có một hệ quản trị CSDL. Mỗi hệ quản  trị  CSDL  đều  được cài  đặt  dựa trên một mô hình dữ liệu cụ thể. Dù là dựa trên mô hình dữ liệu nào, một hệ quản trị

CSDL cũng phải hội đủ các yếu tố sau:

Ngôn ngữ giao tiếp giữa người sử dụng và CSDL, bao gồm :

+ Ngôn  ngữ  mô  tả  dữ  liệu:  cho  phép  khai  báo  cấu  trúc  của CSDL, các mối  liên hệ của dữ liệu và các quy tắc quản lý áp đặt lên các dữ liệu đó.

+ Ngôn ngữ thao tác dữ liệu: cho phép người sử dụng có thể cập nhật dữ liệu (thêm/sửa/xoá).

+ Ngôn ngữ truy vấn dữ liệu: cho phép người sử  dụng truy vấn các thông tin cần  thiết trong CSDL.

+ Ngôn ngữ quản lý dữ liệu:  cho  phép  những  người  quản  trị  hệ thống thay đổi cấu trúc của các  bảng dữ liệu, khai báo  bảo mật thông tin và cấp quyền hạn khai thác CSDL  cho người sử dụng.,…

  • Từ điển dữ liệu:  ghi các  thành phần cấu trúc của CSDL, chứa định  nghĩa các phần  tử dữ liệu (hay trường dữ liệu) và đặc điểm dữ liệu, dùng để mô tả các ánh xạ liên kết, các chương trình ứng dụng, mật mã, quyền hạn sử dụng,…
  • Cơ chế giải quyết vấn đề tranh chấp dữ liệu: Mỗi hệ quản trị CSDL cũng có thể cài đặt một cơ chế riêng để giải quyết các vấn đề này. Một số biện pháp sau đây thường được sử dụng: cấp quyền ưu tiên  cho từng người sử dụng; đánh dấu yêu cầu truy xuất dữ liệu,  phân  chia thời gian, người nào có yêu cầu trước thì có quyền truy xuất dữ liệu trước,…
  • Cơ chế sao lưu (backup) và phục hồi (restore) dữ liệu khi có sự cố xảy ra. Sau một thời gian nhất định, hệ quản trị CSDL sẽ tự động tạo ra một bản sao CSDL.  Tuy  nhiên cách  này hơi tốn kém, nhất là đối với CSDL lớn.

Các hệ quản trị CSDL thông dụng hiện nay: FOXPRO, ACCESS, SQL, ORACLE.

2. Mô hình CSDL

Mô hình CSDL là tập hợp các cấu trúc logic được sử dụng để mô tả cấu trúc dữ liệu và các mối quan hệ giữa các dữ liệu trong một CSDL. Về cơ bản có thể chia mô hình CSDL thành hai nhóm: các mô hình khái niệm và các mô hình thực hiện.

– Mô hình khái niệm: tập trung vào bản chất logic của việc biểu diễn dữ liệu. Nó chỉ quan tâm đến cái gì được biểu diễn trong CSDL hơn là làm thế nào để biểu diễn. Mô hình khái niệm gồm ba dạng quan hệ mô tả sự liên hệ giữa các dữ liệu, đó là quan hệ một – một, một – nhiều và nhiều – nhiều.

Ví dụ các dạng quan hệ của mô hình khái niệm
Ví dụ các dạng quan hệ của mô hình khái niệm

– Mô hình thực hiện: khác với mô hình khái niệm, mô hình này quan tấm đến vấn đề làm thế nào để biểu diễn dữ liệu trong một CSDL. Mô hình thực hiện có ba loại: mô hình dữ liệu thứ bậc, mô hình dữ liệu mạng lưới và mô hình dữ liệu quan hệ.

+ Mô hình CSDL thứ bậc: ra đời vào năm 1969 do nhu cầu quản lý dữ liệu thuộc dự án Apollo của Công ty North Americal Rockwell. Đây là mô hình đầu tiên có tính thương mại dành cho một CSDL lớn.

CSDL thứ bậc được xây dựng như một cây từ trên xuống dưới với các nút là các báo cáo khác nhau của doanh nghiệp. Nút đầu tiên là nút mẹ, các nút ở tầng trên sinh ra các nút ở tầng dưới. Để tìm một nút nào đó, cây quan hệ sẽ thiết lập một đường dẫn tới nút đó.

Những mối quan hệ trong dạng cấu trúc này là: một nút mẹ có nhiều nút con; mỗi nút con chỉ có một nút mẹ và duy nhất một nút mẹ mà thôi. Đây chính là mối liên hệ kiểu một – nhiều và thường gặp trong các tổ chức. Ví dụ một tổ chức có nhiều phòng ban, mỗi phòng ban có nhiều bộ phận…

Cấu trúc của CSDL thứ bậc
Cấu trúc của CSDL thứ bậc

Các mô hình dữ liệu thứ bậc có một số ưu điểm cơ bản sau đây: tạo mối liên hệ chặt chẽ giữa các nút mẹ và các nút con và nhờ đó đảm bảo tính toàn vẹn của dữ liệu từ trên xuống dưới; phù hợp với CSDL chứa một lượng lớn dữ liệu có quan hệ một – nhiều và khi tổ chức có một số lượng lớn các giao dịch sử dụng những mối quan hệ cố định trong một thời gian dài (ví dụ như các ngân hàng); CSDL được thiết lập từ đầu là rất lớn nên người lập trình có khả năng thiết lập các chương trình một cách có hiệu quả hơn…

Tuy nhiên không phải tổ chức nào cũng sử dụng mô hình này do nó có một số nhược điểm sau đây: việc thiết kế CSDL rất phức tạp; CSDL khó quản lý, không linh hoạt; bất cứ thay đổi nào trong cấu trúc dữ liệu (như thiết lập lại các mô đun) đều đỏi hỏi thay đổi tất cả các chương trình ứng dụng; không phù hợp với những mối quan hệ nhiều – nhiều…

+ Mô hình CSDL mạng: được thiết lập để biểu thị những mối quan hệ phức tạp hơn mô hình CSDL thứ bậc. Chế độ báo cáo ở mô hình này được thiết lập từ nhiều nguồn, nghĩa là có nhiều nút mẹ tới một nút con.

Ví dụ về CSDL mạng
Ví dụ về CSDL mạng

Mô hình CSDL mạng có một số ưu điểm giúp nó khắc phục được những nhược điểm của CSDL thứ bậc: có thể dễ dàng biểu diễn các mối quan hệ nhiều – nhiều; việc truy cập dữ liệu và độ linh hoạt của CSDL cao hơn; cho phép nâng cao tính bảo toàn dữ liệu do người sử dụng buộc khai báo cáo chủ trước rồi mới đến báo cáo thành phần. Mô hình CSDL mạng đảm bảo tính độc lập của các dữ liệu một cách cao nhất, một sự thay đổi ở dữ liệu này không ảnh hưởng đến các dữ liệu khác nên các chương trình ứng dụng cũng không phải thay đổi theo.

Một số nhược điểm của mô hình này: khó thiết kế và sử dụng (người sử dụng phải nắm vững và quen thuộc với cấu trúc dữ liệu mới tận dụng được hết những ưu thế của hệ thống); khó có thể thay đổi trong CSDL (mặc dù có sự độc lập về dữ liệu nhưng nó lại không tạo ra sự độc lập về cấu trúc); môi trường truy cập phải theo một dòng thống nhất (ví dụ muốn đi từ biểu ghi A đến biểu ghi E trong dãy biểu ghi A, B, C, D, E, F thì phải đi qua B, C, D).

Nhìn chung, mô hình CSDL mạng chỉ thích hợp với những người lập trình và các nhà quản lý mà không tạo được hệ thống tiện ích cho người sử dụng nói chung. Do đó, mô hình này ít được sử dụng.

+ Mô hình CSDL quan hệ: do E.F. Codd phát minh vào năm 1970, đã khắc phục được những nhược điểm của CSDL mạng, tạo một bước ngoặt cho cuộc cách mạng về CSDL.

Mô hình CSDL quan hệ được thực hiện thông qua một hệ thống CSDL quan hệ như một tập hợp các bảng biểu lưu trữ dữ liệu. Mỗi bảng là một ma trận gồm các hàng và các cột, các bảng có thể liên kết với nhau bởi một tính chất chung nào đó. Dữ liệu ở các bảng hoàn toàn độc lập với nhau nhưng chúng ta vẫn có thể dễ dàng liên kết dữ liệu giữa các bảng với nhau. Mô hình CSDL quan hệ loại bỏ được hầu hết sự trùng lặp dữ liệu giữa các bảng khác nhau mà hệ thống các tệp thường mắc phải.

Ưu điểm của mô hình này: CSDL quan hệ là một kho dữ liệu riêng biệt. Khác với CSDL thứ bậc và CSDL mạng, trong hệ CSDL quan hệ, người thiết kế và người sử dụng hoàn toàn không phải quan tâm đến cấu trúc CSDL – tức khía cạnh vật lý của CSDL, mà chỉ cần tập trung quan tâm đến khía cạnh logic của CSDL. Hệ CSDL quan hệ có khả năng linh hoạt rất cao và dễ tạo ra một giao diện thích hợp với người sử dụng hơn các CSDL khác.

Tuy nhiên, hệ CSDL này gần như che hết toàn bộ cấu trúc vật lý của CSDL nên đòi hỏi phải có hệ điều hành và phần cứng hoàn hảo đối với người sử dụng. Hiện nay, khi hệ thống máy tính ngày càng phát triển thì các yêu cầu này được đáp ứng.

3. Thiết kế CSDL

Trong một HTTT lớn thì CSDL thường được xây dựng thông qua một quá trình liên tục có lặp lại gọi là vòng đời của CSDL – với các bước cơ bản như sau:

– Nghiên cứu ban đầu về CSDL: bao gồm phân tích tình trạng của tổ chức, xác định các vấn đề tồn tại, mục tiêu cơ bản, phạm vi thực hiện… Việc xác định chính xác những thông tin này sẽ cho phép chúng ta thiết lập một CSDL hợp lý và hiệu quả trong công việc.

– Thiết kế CSDL: cần tập trung phân tích những tính chất cơ bản của dữ liệu tạo nên CSDL. Các bước thiết kế CSDL:

+ Thiết kế khái niệm: nhằm tạo ra một cấu trúc CSDL ngắn gọn giới thiệu những đối tượng thực sự cần quản lý và cần đảm bảo rằng các dữ liệu đưa vào CSDL là cần thiết. Các công việc cần thực hiện: phân tích dữ liệu và nhu cầu thông tin, mô hình hoá và tiêu chuẩn hoá các mối quan hệ giữa các thực thể; kiểm tra mô hình dữ liệu (kiểm tra các quá trình chính, các giao diện, tính toàn vẹn dữ liệu…); thiết kế CSDL (xác định vị trí các bảng, nhu cầu truy cập…).

+ Lựa chọn phần mềm quản lý CSDL: nghiên cứu những ưu nhược điểm của các phần mềm; các chi phí liên quan (chi phí mua bán, duy trì, điều hành, thiết lập, đào tạo và chi phí chuyển giao); các công cụ và các đặc điểm của hệ quản trị CSDL; mô hình CSDL.

+ Thiết kế logic: chuyển đổi từ thiết kế khái niệm thành mô hình bên trong của hệ thống quản lý CSDL được lựa chọn. Đối với hệ thống quản lý CSDL quan hệ, thiết kế logic bao gồm thiết kế các bảng, các chỉ số, các giao diện, các chuyển đổi, các thủ tục truy cập thông tin…

+ Thiết kế vật lý: là quá trình lựa chọn việc lưu trữ dữ liệu và các tính chất của dữ liệu được cập nhật trong CSDL.

– Thực hiện CSDL: đòi hỏi thiết lập các nhóm lưu trữ, các bảng và khoảng cách giữa các bảng. Sau khi đã tạo ra CSDL thì việc tiếp theo là đưa dữ liệu vào CSDL đó. Nếu dữ liệu đã được lưu trữ dưới dạng khác với dạng trong CSDL thì cần phải chuyển đổi cho phù hợp trước khi cập nhật vào

– Kiểm tra và đánh giá: Ngay khi dữ liệu được nạp vào CSDL thì hệ điều hành CSDL sẽ nhanh chóng kiểm tra khả năng thực hiện, tính toàn vẹn dữ liệu, khả năng truy cập đồng thời và độ an toàn dữ liệu.

– Vận hành CSDL: cần dựa trên quan điểm vận hành CSDL của người quản lý, người sử dụng. Khi người sử dụng đã thực sự tham gia vào quá trình truy cập dữ liệu, cần lưu ý các sai sót xuất hiện để có hướng sửa chữa và nâng cấp.

– Duy trì và phát triển CSDL: các hoạt động duy trì bao gồm bảo quản phòng ngừa, bảo quản để hiệu chỉnh, bảo quản để thích ứng, tạo báo cáo thống kê trên dữ liệu… Trong quá trình hoạt động của một doanh nghiệp, nhu cầu về các dạng báo cáo mới, các ứng dụng mới, các thay đổi nhỏ trong cấu trúc và nội dung dữ liệu sẽ xuất hiện nên cần định kỳ xem xét phát triển CSDL.

Rate this post

Hanoi1000

Là một người sống hơn 30 năm ở Hà Nội. Blog được tạo ra để chia sẻ đến mọi người tất cả mọi thứ về Hà Nội. Hy vọng blog sẽ được nhiều bạn đọc đón nhận.

Related Articles

Trả lời

Email của bạn sẽ không được hiển thị công khai.

Back to top button
>
>