24/05/2018, 19:17

Đặc tả cấu trúc với DTD

Dạng 1 : Khai báo cấu trúc tài liệu XML đuợc lưu trữ ngay bên trong chính tài liệu XML đó <!DOCTYPE Ten_the_goc [Đặc tả cấu trúc nội dung các thẻ Đặc tả thuộc tính các thẻ ]> Dạng 2 : Khai báo cấu trúc tài liệu XML đuợc lưu ...

Dạng 1 : Khai báo cấu trúc tài liệu XML đuợc lưu trữ ngay bên trong chính tài liệu XML đó

<!DOCTYPE Ten_the_goc [Đặc tả cấu trúc nội dung các thẻ Đặc tả thuộc tính các thẻ ]>

Dạng 2 : Khai báo cấu trúc tài liệu XML đuợc lưu trữ bên ngoài dưới dạng một tập tin chứa Đặc tả cấu trúc nội dungcác thẻ , Đặc tả thuộc tính các thẻ

<!DOCTYPE Ten_the_goc SYSTEM Ten_tap_tin >

<!DOCTYPE DUONG_TRON SYSTEM "DUONG_TRON.dtd" >

Dạng 3 : Khai báo cấu trúc tài liệu XML đã được chuẩn hóa , có phạm vi sử dụng rộng rải. dạng này thường đuợc dùng với các ngôn ngữ XML chung có phạm vi áp dụng toàn cầu như MathML, VML, XHTML, v.v…

<!DOCTYPE Ten_the_goc PUBLIC Chuoi_nhan_dang >

Cú pháp chung đặc tả cấu trúc nội dung của một thẻ như sau

<!ELEMENT Ten_the Bieu_thuc_dac_ta cau_truc_noi_dung > Bieu_thuc_cau_truc_dac_ta_noi_dung có thể chỉ là một từ khoá

Bieu_thuc_cau_truc_dac_ta_noi_dung cũng có thể bao gồm nhiều từ khóa khác mô tả cách bố trí, sắp xép các thành phần con bên trong thẻ

Với A, B là 2 thẻ con của thẻ X

A, B A, B sắp xếp theo thứ tự tuần tự A đến B A* A có thể lặp lại ít nhất 0 lần

B+ B có thể lặp lại ít nhất 1 lần

A? A có thể có hay không có

A|B Có thể chọn sử dụng A hay B

* Dạng 1

Từ khóa ANY : Thẻ có nội dung bất ký theo định chuẩn XML

<!ELEMENT X ANY >

X có thể chứa nội dung bất kỳ. Thông thường cách khai báo này chỉ để mô tả sự tồn tại của X bên trong một thẻ khác

Từ khóa EMPTY : Thẻ không có nội dung

<!ELEMENT PHAN_SO EMPTY >

PHAN_SO không thể có nội dung mà chỉ có thể có các thuộc tính

Từ khóa #PCDATA : Thẻ với nội dung là chuỗi văn bản

<!ELEMENT Ho_ten (#PCDATA) >

Ho_ten có nội dung là chuỗi và không thể chứa các thẻ khác. Đây là một trong các giới hạn chính của DTD vì không cho phép mô tả chi tiết về “kiểu” hay “loại” của chuỗi văn bản.

Với DTD muốn mô tả chi tiết hơn có thể dùng thẻ ghi chú

<!ELEMENT He_so (#PCDATA) >

 

* Dạng 2

Bieu_thuc_dac_ta_cau_truc_noi_dung cũng có thể bao gồm nhiều từ khóa khác mô tả cách bố trí, sắp xép các thành phần con bên trong thẻ

Với A, B là 2 thẻ con của thẻ X

A, B A, B sắp xếp theo thứ tự tuần tự A đến B A* A có thể lặp lại ít nhất 0 lần

B+ B có thể lặp lại ít nhất 1 lần

A? A có thể có hay không có

A|B Có thể chọn sử dụng A hay B

- Tuần tự

Dạng tuần tự : Các thẻ con chỉ có thể xuất hiện 1 lần duy nhất và phải theo đúng thứ tự xuất hiện trong biểu thức

Cú pháp :

<!ELEMENT Ten_the (Ten_the_1, Ten_the_2, ...) >

Ý nghĩa :

The_1, The_2, ..., The_k phải xuất hiện một lần duy nhất theo đúng thứ tự trên

<!ELEMENT Ten_the(Ten_the_1,Ten_the_2,…)>

Ý nghĩa :

The_1, The_2, ..., The_k phải xuất hiện một lần duy nhất theo đúng thứ tự trên

<!ELEMENT DON THUC(He so,So mu)>

Thẻ DON_THUC phải bao hàm bên trong 2 thẻ con He_so,So_mu theo đúng thứ tự trên

Các thẻ bên trong có thể có tên trùng nhau

<!ELEMENT TAM_GIAC (DIEM,DIEM,DIEM) >

Thẻ TAM_GIAC phải bao hàm bên trong đúng 3 thẻ con với tên thẻ là DIEM

- Có thẻ sử dụng từ khóa #PCDATA trong biểu thức tuần tự ( và các loại biểu thức khác )

<!ELEMENT X (#PCDATA,A,#PCDATA)>

Thẻ X phải bao gồm 3 thành phần :

Thành phần thứ 1 là chuỗi văn bản Thành phần thức 2 là thẻ có tên A Thành phần thứ 3 là chuỗi văn bản.

- Tùy chọn

Dạng tùy chọn : Thẻ con có thể được sử dụng hay không sử dụng

Cú pháp ( dạng đơn giản) :

<!ELEMETNT Ten_the (Ten_the_con ?) >

Thẻ đang xét có thẻ chứa 1 hay 0 lần xuất hiện của thẻ có tên là Ten_the_con

<!ELEMETNT DON THUC(Ten?)>

Thẻ DON_THUC có thẻ chứa hay không thẻ Ten

Có thể kết hợp với biểu thức tuần tự

<!ELEMENT X (A,B?,C) >

Thành phần đầu tiên của thẻ X là thẻ A, kế đến có thẻ có hay không có thẻ B và thành phần cuối cùng phải là C

- Có thể cho phép tùy chọn một tập họp các thẻ

<!ELEMENT X (A,B,C)? >

X có thể bao hàm bên trong các thẻ A,B,C ( theo thứ tự trên ) hay cũng có thẻ không chứa bất kỳ thẻ nào

Dạng chọn : Bắt buộc chọn một thẻ con để sử dụng trong tập họp thẻ cho trước

Cú pháp ( dạng đơn giản) :

<!ELEMETNT Ten_the(Ten_the_1|Ten_the_2|..|Ten_the_k) >

Thẻ đang xét bắt buộc phải chứa duy nhất một trong các thẻ có tên Ten_the_1 hay ten_the_2, hay ... Ten_the_k

Có thể kết hợp với biểu thức tuần tự

<!ELEMENT X (A,B|C,D) >

Thành phần đầu tiên của thẻ X là thẻ A, kế đến là thẻ B hay thẻ C và thành phần cuối cùng phải là D

- Có thể cho phép chọn một tập họp các thẻ

<!ELEMENT X ( (A,B) | (C,D) ) >

X có thể bao hàm bên trong cặp thẻ A,B ( theo thứ tự trên ) hay cặp thẻ C,D ( theo thứ tự trên )

- Lặp

Dạng lặp ít nhất 0 lần : Các thẻ con có thể lặp lại nhiều lần hay có thẻ không có lần nào

Cú pháp :

<!ELENEMT Ten_the (Ten_the_con*) >

Ý nghĩa :

Thẻ đang xét có thẻ bao hàm bên trong nhiều thẻ có tên là Ten_the_con hay cũng có thể là thẻ rổng ( không có nội dung )

<!ELEMENT LOP (HOC_SINH*) >

Thẻ LOP có thẻ chứa nhiều thẻ HOC_SINH hay không có thẻ HOC_SINH nào

Ghi chú :

-Có thể mô tả lặp đồng thời nhiều thẻ con

<!ELEMENT X (A,B,C)* >

Các thẻ A,B,C theo thứ tự trên có thẻ lặp lại ít nhất 0 lần trong thẻ X

- Có thể kết hợp với biểu thức tuần tự

<!ELEMENT X (A,B*,C) >

Thẻ X có thành phần đầu tiên là thẻ A, kế đến có thể có nhiều hay 0 lần lặp của thẻ B và cuối cùng là thẻ C

- Có thể kết hợp với biểu thức tùy chọn

<!ELEMENT X (A,B*,C?,D) >

Thẻ X có thành phần đầu tiên là thẻ A, kế đến có thể có nhiều hay 0 lần lặp của thẻ B, kế đến có thẻ có hay không thẻ C và cuối cùng là thẻ D

- Có thể kết hợp với biểu thức chọn

<!ELEMENT X (A|B,C*,D) >

Thẻ X có thành phần đầu tiên là thẻ A hay thẻ B , kế đến có thể có nhiều hay 0 lần lặp của thẻ B và cuối cùng là thẻ D

Dạng lặp ít nhất 1 lần : Các thẻ con có thể lặp lại nhiều lần và ít nhất là một lần

Cú pháp :

<!ELENEMT Ten_the (Ten_the_con+) >

Ý nghĩa :

Thẻ đang xét có thẻ bao hàm bên trong ít nhất một thẻ có tên là Ten_the_con

<! ELEMENT DA THUC (DON THUC +)>

Thẻ DATHUC phải bao hàm bên trong ít nhất một thẻ DON_THUC

Có thể mô tả lặp đồng thời nhiều thẻ con

<!ELEMENT CT_HOA_DON (Mat_hang,So_luong,Don_gia) + >

Các thẻ CT_HOA_DON phải bao hàm ít nhất 3 thẻ Mat_hang,So_luong,Don_gia

- Có thể kết hợp với biểu thức tuần tự

<!ELEMENT DA_GIAC (DIEM,DIEM,DIEM+) >

Các thẻ DA_GIAC phải bao hàm ít nhất 3 thẻ DIEM

- Có thể kết hợp với biểu thức tùy chọn

<!ELEMENT BIEU_THUC (Ten?,PHAN_SO+) >

Thẻ BIEU_THUC có thẻ chứa hay không thành phần đầu là thẻ Ten và kế đến ít nhất một thẻ PHAN_SO

- Có thể kết hợp với biểu thức chọn

<!ELEMENT X (A|B,C+,D) >

Thẻ X có thành phần đầu tiên là thẻ A hay thẻ B , đến ít nhất một thẻ B và cuối cùng là hẻ D

Cú pháp khai báochung :

Cú pháp khai báo các thuộc tính của thẻ tương tự như cú pháp khai báo kiểu cấu trúc trong ngôn ngữ lập rình

<!ATTLIST Ten_the

Ten_thuoc_tinh_1 Kieu_1 Tham_so_1

Ten_thuoc_tinh_2 Kieu_2 Tham_so_2

...

Ten_thuoc_tinh_k Kieu_k Tham_so_k

>

Ý nghĩa :

Ten_the : tên thẻ cần khai báo các thuộc tính

Ten_thuoc_tinh_1,Ten_thuoc_tinh_2, ...Ten_thuoc_tinh_k : Tên các thuộc tính của thẻ đang khai báo

Kieu_1,Kieu_2, ..., Kieu_k : Mô tả tập họp các giá trị mà thuộc tính có thể nhận

Tham_so_1,Tham_so_2,.., Tham_so_k : Mô tả một số tính chất trên thuộc tính tương ứng

Đặc tả cấu trúc tài liệu XML biểu diễn thông tin về biểu thức phân số P = 4/5 + 6/7*1/3 - 10/3+11/2*2/3

<?xml version="1.0" encoding="utf-8"?>

<!DOCTYPE BIEU_THUC [

<!ELEMENT BIEU_THUC (PHAN_SO | TICH_SO)+ >

<ATTLIST BIEU_THUC

Ten CDATA #IMPLIED

 

>

<!ELEMENT PHAN_SO EMPTY >

<ATTLIST PHAN_SO

Tu_so CDATA #REQUIRED

 

Mau_so CDATA #REQUIRED

 

>

<!ELEMENT TICH_SO (PHAN_SO)+ >

]>

* Kiểu

Kiểu : Mô tả tập họp các giá trị của thuộc tính

Có nhiều cách khác nhau cho phép mô tả tập họp các giá trị có thể có của một thuộc tính. Phần sau chỉgiới thiệu 2 cách mô tả chính và thông dụng. Đề biết thêm chi tiết về cáccách mô tả khác xin tham khảocác tài liệu chuyên biệt về DTD Cách 1 : Dùng từ khoáCDATA Cú pháp :

<!ATTLIST Ten_the

...

Ten_thuoc_tinh CDATA

...

>

Ý nghĩa :

Tập họp các giá trị của huộc tính với khai báo CDATA chính là tập họp các chuỗi. Đây là trường hợp sử dụng thông dụng nhất, và đây cũng là một trong các giới hạn của DTD vì không cho phép mô tả hi tiết hơn về kiểu của thuộc tính. Tương tự như nội dung văn bản của thẻ, để mô tả thêm thông tin cần ử dụng các ghi chú

Đặc tả cấu trúc tài liệu XMl biểu diễn phương trình đuờng thẳng trong mặt phẳng

<?xml version="1.0" encoding="utf-8"?>

<!DOCTYPE DUONG_THANG [

<!ELEMENT DUONG_THANG EMPTY>

<!- phương trình ax + by+c =0 -->

<ATTLIST DUONG_THANG

Ten CDATA #IMPLIED

 

a CDATA #REQUIRED

 

b CDATA #REQUIRED

 

c CDATA #REQUIRED

 

>

<!a,b không đồng thời là 0 -->

]>

Cách 2 : Dùng biểu thức liệt kê

Cú pháp :

<!ATTLIST Ten_the

...

Ten_thuoc_tinh ( Gia_tri_1,Gia_tri_2,...._gia_tri_k)

...

>

Ý nghĩa :

Tập họp các giá trị có thể có của thuộc tính đang xét chính là tập họp các giá trị được liệt kê

Gia_tri_1,Gia_tri_2, ....,Gia_tri_k. Các giá trị này là các chuỗi ký tự

Đặc tả cấu trúc tài liệu XML biểu diễn thông tin về phiếu điểm của một học sinh

<?xml version="1.0" encoding="utf-8"?>

<!DOCTYPE PHIEU_DIEM [

<!ELEMENT PHIEU_DIEM (HOC_SINH, DIEM_SO+ ) >

<!ELEMENT HOC_SINH EMPTY >

<ATTLIST HOC_SINH

Ho_ten CDATA #REQUIRED

 

Ngay_sinh CDATA #REQUIRED

 

Xep_loai ("Giỏi", "Khá", "Trung bình", "Yếu") #IMPLIED

>

<!ELEMENT DIEM_SO EMPTY >

<ATTLIST DIEM

Ten_mon CDATA #REQUIRED

 

Gia_tri CDATA #REQUIRED

 

>

]>

* Tham số

Tham_so : Mô tả tính chất của thuộc tính

Có nhiều cách khác nhau cho phép mô tả tập họp các giá trị có thể có của một thuộc tính. Phần sau chỉ iới thiệu 3 cách mô tả chính và thông dụng. Đề biết thêm chi tiết về các cách mô tả khác xin tham khảo ác tài liệu chuyên biệt về DTD

Cách 1 : Dùng từ khóa #REQUIRED

Cú pháp :

<!ATTLIST Ten_the

...

Ten_thuoc_tinh Kieu #REQUIRED

...

>

Ý nghĩa :

Thuộc tính đang xét là thuộc tính bắt buộc phải có. Đây là cách sử dụng phổ biến nhất

Đặc tả cấu trúc tài liệu XML biểu diễn thông tin về các đơn thức với tên bắt buộc phải có

<?xml version="1.0" encoding="utf-8"?>

<!DOCTYPE DON_THUC [

<!ELEMENT DON_THUC (He_so, So_mu ) >

<ATTLIST DON_THUC

Ten CDATA #REQUIRED

 

Bien_so CDATA #REQUIRED

 

>

<!ELEMENT He_so #PCDATA >

 

<!ELEMENT So_mu #PCDATA >

 

]>

Cách 2 : Dùng từ khóa #IMPLIED

Cú pháp :

<!ATTLIST Ten_the

...

Ten_thuoc_tinh Kieu #IMPLIED

...

>

Ý nghĩa :

Thuộc tính đang xét là tùy chọn và không bắt buộc phải có

Đặc tả cấu trúc tài liệu XML biểu diễn thông tin về tam thức P(x) =2x2 -4x +6

<?xml version="1.0" encoding="utf-8"?>

<!DOCTYPE TAM_THUC [

<!ELEMENT TAM_THUC (DON_THUC,DON_THUC,DON_THUC) >

<ATTLIST TAM_THUC

Ten CDATA #IMPLIED

  Bien_so CDATA "x"

 

>

<!ELEMENT DON_THUC EMPTY >

<ATTLIST DON_THUC

He_so CDATA #REQUIRED

  So_mu (0,1,2) #REQUIRED

 

>

]>

Cách 3 : Dùng từ khóa #FIXED

Cú pháp :

<!ATTLIST Ten_the

...

Ten_thuoc_tinh Kieu #FIXED Gia_tri

...

>

Ý nghĩa :

Thuộc tính đang xét phải có giá trị cố định là Gia_tri. Trường hợp này ít được sử dụng

Đặc tả cấu trúc tài liệu XML biểu diễn thông tin về các đơn thức chỉ với biến số x

<?xm lversion="1.0" encoding="utf-8"?>

<!DOCTYPE DON_THUC [

<!ELEMENT DON_THUC (He_so, So_mu ) >

<ATTLIST DON_THUC

Ten CDATA #REQUIRED

 

Bien_so CDAT #FIXED "x"

 

>

<!ELEMENT He_so (#PCDATA) >

 

<!ELEMENT So_mu (#PCDATA) >

 

]>
0