24/05/2018, 22:02

Kỹ thuật thiết kế cơ sở dữ liệu

Hiện nay, có khá nhiều kỹ thuật thiết kế cơ sở dữ liệu đang được sử dụng. Chúng ta có thể kể đến ba loại kỹ thuật thiết kế cơ sở dữ liệu: Kỹ thuật khách/chủ Data mining Liên kết ứng dụng website với các siêu cơ sở dữ liệu ...

Hiện nay, có khá nhiều kỹ thuật thiết kế cơ sở dữ liệu đang được sử dụng. Chúng ta có thể kể đến ba loại kỹ thuật thiết kế cơ sở dữ liệu:

  1. Kỹ thuật khách/chủ
  2. Data mining
  3. Liên kết ứng dụng website với các siêu cơ sở dữ liệu

Kỹ thuật khách/chủ ra đời vào khoảng những năm 90. Đó là phương thức chia sẻ thông tin trên mạng theo cách chia sẻ các chức năng sử dụng và khai thác phần mềm thành hai phần riêng biệt. Máy khách sử dụng mạng truy cập, lấy dữ liệu, và xử lý dữ liệu trên các máy trạm với các công cụ máy tính thông thường. Máy chủ hoạt động thường là một máy tính lớn được sử dụng chủ yếu để lưu trữ, khôi phục và bảo vệ dữ liệu. Nói một các khác, trong mô hình này, cơ sở dữ liệu nằm trên một máy khác với các máy có thành phần xử lý ứng dụng. Phầm mềm cơ sở dữ liệu đựơc tách ra giữa hệ thống các máy khách chạy các trình ứng dụng và hệ thống máy chủ lưu trữ các cơ sở dữ liệu. Khi có một người dùng tạo ra một yêu cầu thông thông tin để láy dữ liệu tổng hợp từ 1000 bản ghi, chỉ có lời yêu cầu tin khởi dộng ban đầu và kết quả cuối cùng được đưa lên mạng, phần mềm cơ sở dữ liệu chạy trên máy lưu trữ cơ sở dữ liệu sẽ truy cập các bản ghi cần thiết, xử lý chúng, và gọi các thủ tục cần thiết để đưa ra kết quả cuối cùng.

Quá trình xử lý dữ liệu theo kỹ thuật khách/ chủ đòi hỏi:

  • Máy chủ và máy khách phải có khả năng truyền thông với nhau.
  • Máy khách chủ động tạo các thiết lập đường truyền tới máy chủ.
  • Máy chủ phải có đủ các dữ liệu và dịch vụ nhằm đáp ứng đựơc những yêu cầu của máy khách và đồng thời có khả năng giao quyền tới cho máy khách.
  • Máy chủ chịu trách nhiệm giải quyết các xung đột giữa các máy khách trên đường truyền.
  • Quá trình xử lý dữ liệu bằng các phần mềm ứng dụng được chia sẻ giữa máy chủ và máy khách

Ưu điểm

  • Các chi phí cho phần cứng, phần mềm và việc bảo trì thiết bị thấp hơn só với hệ thống các máy tính lớn hoặc máy tính mini.
  • Chiến lược cực đại hoá việc sử dụng các máy trạm thông minh để chia sẻ bớt các công việc xử lý dữ liệu đã làm giảm nhu cầu phải có những máy tính có bộ nhớ lớn.
  • Do có sự kiểm soát tập trung về dữ liệu ở các máy chủ, nên cơ cấu này làm tăng môi trường bảo vệ cho việc kiểm tra tích hợp và cân đối dữ liệu.
  • Các thành phần dữ liệu và mã chương trình có thể sử dụng lại các chương trình phần mềm, nhờ đó làm giảm thời gian và phí tổn.
  • Việc truyền dữ liệu qua mạng được giới hạn, giảm thời gian đáp ứng yêu cầu và tối ưu hoá các nguồn lực cho mạng.
  • Các hệ thống mở có thể thay đổi, cho phép nâng cao tính linh hoạt nhằm đối phó với sự thay đổi nhanh chóng của môi trường.

Nhược điểm

  • Giải phảo mang tính phòng ban.
  • Các ứng dụng máy tính mất tính linh hoạt.
  • Các công nghệ và các ứng dụng khó hoán chuyển cho nhau.

Kho dữ liệu (Data warehouse)

Một data warehouse là một cơ sở dữ liệu, với các công cụ báo cáo và truy vấn, lưu trữ dữ liệu hiện thời và trước đó về một lĩnh vực cảu công ty mà các nhà quản lý quan tâm. Dữ liệu được thu thập từ nhiều hệ thống then chốt trong công ty cũng như các nguồn từ bên ngoài, kể cảc những giao dịch trên trang web. Các nguồn dữ liệu đó có thể được ứng dụng vào hệ thống quản lý cơ sở dữ liệu quan hệ hoặc hướng đối tượng, hay các tài liệu HTML hoặc XML. Sau khi thu thập đựơc, các dữ liệu đó được chuẩn hoá thành một dạng dữ liệu chung, và được hợp nhất để có thể phục vụ phân tích và ra quyết định trong toàn bộ doanh nghiệp.

Kho dữ liệu phải được thiết kế một cách cẩn thận bởi cả các chuyên viên kỹ thuật và kinh doah để đảm bảo cung cấp đúng thông tin cho các quyết định kinh doanh quan trọng. Công ty có thể cần thiết thay đổi quy trình nghiệp vụ để sử dụng thông tin trong kho một các hiệu quả nhất.

Công ty có thể xây dựng một kho dữ liệu trung ương cho toàn bộ doanh nghiệp, hay cũng có thể tạo ra nhiều kho nhỏ hơn, phân quyền chứa một phần dữ liệu của tổ chức phục vụ những bộ phận chức năng chuyên dụng.

Khai phá dữ liệu (Data Mining)

Một hệ thống kho dữ liệu cung cấp một loạt các công cụ truy vấn, phân tích và lập báo cáo đồ hoạ, gồm cả các công cụ hỗ trợ phân tích dữ liệu đa chiều và khai phá dữ liệu. Data mining sử dụng một số kỹ năng tìm kiếm các mô hình và mối liên hệ ẩn chứa trong những lượng dữ liệu lớn, và rút ra các quy luật để định hướng quyết định phán đoán tương lai. Có rất nhiều ứng dụng khai phá dữ liệu dùng cho lĩnh vực khoa học và kinh doanh, đặc biệt là marketing.

Khai phá dữ liệu là một ccu mạnh mẽ và có lợi, nhưng nó cũng gợi ra những thách thức trong việc bảo vệ bí mật cá nhân. Ví dụ, công nghệ khai phá dữ liệu có thể tổng hợp thông tin từ nhiều nguồn phong phú để tạo ra một bộ dữ liệu đầy đủ về mỗi người, như thu nhập, thói qun lái xe, sở thích, gia đình, và quan điểm chính trị. Qua đó có thể thấy rằng cần phải có những biện pháp công cụ bảo mật thích hợp.

Sử dụng công nghệ website vào các ứng dụng tin học là một xu thế cho các hệ thống quản lý hiện nay. Các phần mềm trình duyện Web rất dễ sử dụng đối với mọi người. Giao diện web không đòi hỏi cơ sở dữ liệu nội bộ thay đổi, có hiệu quả và ít tốn kém hơn rất nhiều so với tái thiết lập hệ thống cũ để tăng khả năng truy cập. Ngoài ra, ưu điểm nổi bật của công nghệ web là khả năng tải tự động ứng dụng từ máy chủ. Ưu điểm này hơn hẳn mô hình khách/chủ ở khả năng triển khai rộng.

Phương thức làm việc chính của dạng kỹ thuật này là lấy nội dung từ cơ sở dữ liệu và hiển thị nội dung lên trang ưeb bằng trình duyệt (browser). Việc tách giao diện người dùng khỏi chức năng ứng dụng đã cho phép người thiết kế dễ dàng thay đổi cả thiết kế lẫn nội dung động. Thông tin đựơc đưa lên trang web theo phương thức động (thay đổi số liệu trong cơ sở dữ liệu ) cho phép giải phóng nhiều sức lao động khỏi viẹc tạo thông tin trực tuyến.

Khi thiết kế những trang mạng như vậy, ta cần lưu ý nên sử dụng loại cơ sở dữ liệu như thế nào (cơ sở dữ liệu quan hệ, SQL, kiểu văn bản thuần tuý, hay kiểu phân cấp). Quyết định lựa chọn phụ thuộc khá nhiều vào cấu trúc dữ liệu và kiểu của hệ thống tra cứu và tìm kiếm mà ta muốn. Cũng cần phải cân nhắc xem loại dữ liệu đó là dữ liệu dạng văn bản, hay nó là bảng hoặc có cấu trúc mắt lưới? Nếu là dạng dữ liệu bảng, ta có muốn tìm kiếm trên một hay nhiều cột một lúc hay muốn tìm kiếm qua công thức sử dụng tập hợp giá trị Boolean.

Công nghệ này hoạt động với cấu hình mạng, trang web sẽ hiện thị các thông tin cần thiết đối với từng tên người sử dụng, mât mã, cũng như giới hạn quyền sửa, gửi báo cáo, phân tích, tổng hợp báo cáo, đồng thời với các nhà quản trị mạng có thể giám sát chặt chẽ việc truy cập cũng như gửi báo cáo của các đơn vị thành viên.

Truy cập cơ sở dữ liệu của doanh nghiệp thông qua web tạo ra nhiều hiệu quả và cơ hội, thậm chí còn có thể làm thay đổi phương thức kinh doanh. Một số công ty đã thiết lập những công việc kinh doanh mới dựa trên khả năng truy cập các cơ sở dữ liệu lớn thông qua web. Một số khác sử dụng công nghệ web để nhân viên có thể thấy đựơc tổng thể thông tin của công ty mình.

Tại Việt Nam hiện nay một số tổ chức (Ban viễn thong thuộc tổng công ty bưu chính viễn thông Việt Nam) cũng như đã ứng dụng hiệu quả công nghệ này, từ đó giảm bớt chi phí nhân công, cũng như thuận tiện trong việc điều hành và quản lý, từ đó có các biện pháp quản lý hiệu quả, nhanh chóng đưa ra các quyết định sáng suốt, phù hợp.

Đối với một hệ cơ sở dữ liệu nằm phân tán trên mạng máy tính thì hệ quản trị cơ sở dữ liệu có ý nghĩa rất quan trọng vì phải đảm bảo tính thống nhất và vẹn toàn dữ liệu, đảm bảo cho các chương trình người dùng truy xuất đến cơ sở dữ liệu phân tán như là một khối cơ sở dữ liệu duy nhất.

Ngoài ra, hệ quản trị cơ sở dữ liệu còn phải đảm bảo chức năng phân quyền truy cập và bảo mật tren đường truyền. Trong các hệ quản trị cơ sở dữ liệu phân tán hiện nay thì hệ quản trị cơ sở dữ liệu Oracle được đánh giá là ưu việt nhất với các chức năng tiên tiến: phân tán, sao bản, bảo mật cao, tính nhất quán dữ liệu, thủ tục chạy ngầm, xử lý sự kiện tích hoạt, khóa dữ liệu đến từng tháng, chạy thông suốt đến trên 120 loại phần cứng từ máy lớn đến máy nhỏ và 19 hệ điều hành, hỗ trợ hầu hết các giao thức mạng, là cơ sở dữ liệu đầu tiên trên thế giới tích hợp website.

0