25/05/2018, 09:31

Heapsort

Cây sắp thứ tự bộ phận hay còn gọi là heap là cây nhị phân mà giá trị tại mỗi nút (khác nút lá) đều không lớn hơn giá trị của các con của nó. Ta có nhận xét rằng nút gốc a[1] của cây sắp thứ tự bộ phận có giá trị nhỏ nhất. ...

Cây sắp thứ tự bộ phận hay còn gọi là heap là cây nhị phân mà giá trị tại mỗi nút (khác nút lá) đều không lớn hơn giá trị của các con của nó.

Ta có nhận xét rằng nút gốc a[1] của cây sắp thứ tự bộ phận có giá trị nhỏ nhất.

Ví dụ 2-5: Cây sau là một heap.

  1. Xem mảng ban đầu là một cây nhị phân. Mỗi nút trên cây lưu trữ một phần tử mảng, trong đó a[1] là nút gốc và mỗi nút không là nút lá a[i] có con trái là a[2i] và con phải là a[2i+1]. Với cách tổ chức này thì cây nhị phân thu được sẽ có các nút trong là các nút a[1],..,a[n DIV 2]. Tất cả các nút trong đều có 2 con, ngoại trừ nút a[n DIV 2] có thể chỉ có một con trái (trong trường hợp n là một số chẵn).
  2. Sắp xếp cây ban đầu thành một heap căn cứ vào giá trị khoá của các nút.
  3. Hoán đổi a[1] cho cho phần tử cuối cùng.

(4) Sắp lại cây sau khi đã bỏ đi phần tử cuối cùng để nó trở thành một heap mới.

Lặp lại quá trình (3) và (4) cho tới khi cây chỉ còn một nút ta sẽ được mảng sắp theo thứ tự giảm.

Thủ tục PushDown

Thủ tục PushDown nhận vào 2 tham số first và last để đẩy nút first xuống.

Giả sử a[first],..,a[last] đã đúng vị trí (giá trị khoá tại mỗi nút nhỏ hơn hoặc bằng giá trị khoá tại các nút con của nó) ngoại trừ a[first]. PushDown dùng để đẩy phần tử a[first] xuống đúng vị trí của nó trong cây (và có thể gây ra việc đẩy xuống các phần tử khác).

Xét a[first], có các khả năng có thể xẩy ra:

  • Nếu a[firrst] chỉ có một con trái và nếu khoá của nó lớn hơn khoá của con trái (a[first].key > a[2*first].key) thì hoán đổi a[first] cho con trái của nó và kết thúc.
  • Nếu a[first] có khoá lớn hơn con trái của nó (a[first].key > a[2*first].key) và khoá của con trái không lớn hơn khoá của con phải (a[2*first].key <= a[2*first+1].key) thì hoán đổi a[first] cho con trái a[2*first] của nó, việc này có thể gây ra tình trạng con trái sẽ không đúng vị trí nên phải xem xét lại con trái để có thể đẩy xuống.
  • Ngược lại, nếu a[first] có khoá lớn hơn khoá của con phải của nó (a[first].key > a[2*first+1].key ) và khoá của con phải nhỏ hơn khoá của con trái (a[2*first+1].key < a[2*first].key) thì hoán đổi a[first] cho con phải a[2*first+1] của nó, việc này có thể gây ra tình trạng con phải sẽ không đúng vị trí nên phải tiếp tục xem xét con phải để có thể đẩy xuống.
  • Nếu tất cả các trường hợp trên đều không xẩy ra thì a[first] đã đúng vị trí.

Như trên ta thấy việc đẩy a[first] xuống có thể gây ra việc đẩy xuống một số phần tử khác, nên tổng quát là ta sẽ xét việc đẩy xuống của một phần tử a[r] bất kỳ, bắt đầu từ a[first].

PROCEDURE PushDown(first,last:integer);

VAR r:integer;

BEGIN

r:= first; {Xét nút a[first] trước hết}

WHILE r <= last DIV 2 DO

If last = 2*r THEN BEGIN {nút r chỉ có con trái }

IF a[r].key > a[last].key THEN swap(a[r],a[last]);

r:=last; {Kết thúc}

END ELSE

IF (a[r].key>a[2*r].key)and(a[2*r].key<= a[2*r+1].key)

THEN BEGIN

swap(a[r],a[2*r]);

r := 2*r ; {Xét tiếp nút con trái }

END

ELSE

IF (a[r].key>a[2*r+1].key)and(a[2*r+1].key<a[2*r].key)

THEN BEGIN

swap(a[r],a[2*r+1]);

r := 2*r+1 ; {Xét tiếp nút con phải }

END

ELSE

r := last; {Nút r đã đúng vị trí }

END;

Thủ tục PushDown chỉ duyệt trên một nhánh nào đó của cây nhị phân, tức là sau mỗi lần lặp thì số nút còn lại một nửa. Nếu số nút lúc đầu là n, trong trường hợp xấu nhất (luôn phải thực hiện việc đẩy xuống) thì lệnh lặp WHILE phải thực hiện i lần sao cho 2i = n tức là i = logn. Mà mỗi lần lặp chỉ thực hiện một lệnh IF với thân lệnh IF là gọi thủ tục Swap và gán, do đó tốn O(1) = 1 đơn vị thời gian. Như vậy thủ tục PushDown lấy O(logn) để đẩy xuống một nút trong cây có n nút.

Thủ tục HeapSort

  • Việc sắp xếp cây ban đầu thành một heap được tiến hành bằng cách sử dụng thủ tục PushDown để đẩy tất cả các nút trong chưa đúng vị trí xuống đúng vị trí của nó, khởi đầu từ nút a[n DIV 2], lần ngược tới gốc.
  • Lặp lại việc hoán đổi a[1] cho a[i], sắp xếp cây a[1]..a[i-1] thành heap, i chạy từ n đến 2.

PROCEDURE HeapSort;

VAR i:integer;

BEGIN

{1} FOR i := (n div 2) DOWNTO 1 DO

{2} PushDown(i,n);

{3} FOR i := n DOWNTO 2 DO BEGIN

{4} swap(a[1],a[i]);

{5} pushdown(1,i-1);

END;

END;

Ví dụ 2-6: Sắp xếp mảng bao gồm 10 phần tử có khoá là các số nguyên như trong các ví dụ 2.1:

Chỉ số 1 2 3 4 5 6 7 8 9 10
Khoá ban đầu 5 6 2 2 10 12 9 10 9 3

Mảng này được xem như là một cây nhị phân ban đầu như sau:

Trong cây trên, giá trị ghi trong các nút là khoá của các phần tử mảng, giá trị ghi bên ngoài các nút là chỉ số của các phần tử mảng.

Việc sắp xếp cây này thành một heap sẽ bắt đầu từ việc đẩy xuống nút a[5] (vì 5 = 10 DIV 2)

Xét nút 5 ta thấy a[5] chỉ có một con trái và giá trị khóa tương ứng của nó lớn hơn con trái của nó nên ta đổi hai nút này cho nhau và do con trái của a[5] là a[10] là một nút lá nên việc đẩy xuống của a[5] kết thúc.

Nút 4 và nút 3 đã đúng vị trí nên không phải thực hiện sự hoán đổi. Tại nút 2, giá trị khóa của nó lớn hơn khoá con trái và khoá của con trái nhỏ hơn khoá của con phải nên ta hóan đổi nút 2 cho con trái của nó (nút 4), sau khi hoán đổi, ta xét lại nút 4, thấy nó vẫn đúng vị trí nên kết thúc việc đẩy xuống của nút 2.

Hình 2-10: Thực hiện đẩy xuống của nút 2

Cuối cùng ta xét nút 1, ta thấy giá trị khoá của nút 1 lớn hơn khoá của con trái và con trái có khoá bằng khoá của con phải nên hóan đổi nút 1 cho con trái của nó (nút 2).

Sau khi thực hiện phép hóan đổi nút 1 cho nút 2, ta thấy nút 2 có giá trị khoá lớn hơn khoá của con phải của nó (nút 5) và con phải có khoá nhỏ hơn khoá của con trái nên phải thực hiện phép hoán đổi nút 2 cho nút 5. Xét lại nút 5 thì nó vẫn đúng vị trí nên ta được cây mới trong hình 2-11.

Cây này là một heap tương ứng với mảng

Chỉ số 1 2 3 4 5 6 7 8 9 10
Heap 2 3 2 6 5 12 9 10 9 10

Từ heap đã có ở trên, hoán đổi a[1] cho a[10] ta có a[10] là nút có khóa nhỏ nhất, cắt bỏ nút a[10] ra khỏi cây. Như vậy phần cuối mảng chỉ gồm một phần tử a[10] đã được sắp.

Thực hiện việc đẩy a[1] xuống đúng vị trí của nó trong cây a[1]..a[9] ta được cây:

Hoán đổi a[1] cho a[9] và cắt a[9] ra khỏi cây. Ta được phần cuối mảng bao gồm hai phần tử a[9]..a[10] đã được sắp. Thực hiện việc đẩy a[1] xuống đúng vị trí của nó trong cây a[1]..a[8] ta được cây

Tiếp tục quá trình trên ta sẽ được một mảng có thứ tự giảm.

Trình bày heapsort bằng mảng

Như trong phần ý tưởng đã nói, chúng ta chỉ xem mảng như là một cây. Điều đó có nghĩa là các thao tác thực chất vẫn là các thao tác trên mảng. Để hiểu rõ hơn, ta sẽ trình bày ví dụ trên sử dụng mô hình mảng.

Mảng của 10 mẩu tin, có khoá là các số nguyên đã cho là:

Chỉ số 1 2 3 4 5 6 7 8 9 10
Khoá ban đầu 5 6 2 2 10 12 9 10 9 3

Mặc dù không vẽ thành cây, nhưng ta vẫn tưởng tượng mảng này như là một cây nhị phân với nút gốc là a[1], các nút a[i] có con trái là a[2i] và on phải là a[2i+1]. Chỉ có các nút từ a[1] đến a[5] là nút trong, còn các nút từ a[6] đến a[10] là nút lá.

Từ mảng ban đầu, chúng ta sẽ tạo thành heap bằng cách áp dụng thủ tục PushDown từ a[5] đến a[1].

Xét a[5], nút này chỉ có một con trái là a[10] và khoá của a[5] lớn hơn khoá của a[10] (10 > 3) nên đẩy a[5] xuống (hoán đổi a[5] và a[10] cho nhau).

Xét a[4], nút này có hai con là a[8] và a[9] và khoá của nó đều nhỏ hơn khoá của hai con (2 < 10 và 2 < 9) nên không phải đẩy xuống.

Tương tự a[3] cũng không phải đẩy xuống.

Xét a[2], nút này có con trái là a[4] và con phải là a[5]. Khoá của a[2] lớn hơn khoá của con trái (6 > 2) và khoá của con trái nhỏ hơn khoá của con phải (2 < 3) do đó đẩy a[2] xuống bên trái (hoán đổi a[2] và a[4] cho nhau). Tiếp tục xét con trái của a[2], tức là a[4]. Khoá của a[4] bây giờ là 6, nhỏ hơn khoá của con trái a[8] (6 < 10) và khoá của con phải a[9] (6 < 9) nên không phải đẩy a[4] xuống.

Xét a[1], nút này có con trái là a[2] và con phải là a[3]. Khoá của a[1] lớn hơn khoá của con trái a[2] (5 > 2) và khoá của con trái bằng khoá của con phải (2 = 2) nên đẩy a[1] xuống bên trái (hoán đổi a[1] và a[2] cho nhau). Tiếp tục xét con trái a[2]. Nút này có con trái là a[4] và con phải là a[5]. Khoá của a[2] bây giờ là 5 lớn hơn khoá của con phải a[5] (5 > 3) và khoá của con phải a[5] nhỏ hơn khoá của con trái a[4] (3 < 6) nên đẩy a[2] xuống bên phải (hoán đổi a[2] và a[5] cho nhau). Tiếp tục xét con phải a[5]. Nút này chỉ có một con trái là a[10] và khoá của a[5] nhỏ hơn khoá của a[10] nên không phải đẩy a[5] xuống. Quá trình đến đây kết thúc và ta có được heap trong bảng sau:

Chỉ số 1 2 3 4 5 6 7 8 9 10
Ban đầu 52 62 5 3 2 26 103 5 12 9 10 9 310
Heap 2 3 2 6 5 12 9 10 9 10

Hình 2-14: Mảng ban đầu đã tạo thành heap

Trong bảng trên, dòng Ban đầu bao gồm hai dòng. Dòng trên ghi các giá trị khoá ban đầu của mảng. Dòng dưới ghi các giá trị khoá sau khi đã có một sự hoán đổi. Thứ tự ghi từ trái sang phải, tức là số bên trái là giá trị khoá sau khi thực hiện việc hoán đối đầu tiên trong quá trình PushDown.

Sau khi đã có heap, ta bắt đầu quá trình sắp xếp.

Ở bước đầu tiên, ứng với i = 10. hoán đổi a[1] và a[10] cho nhau, ta được a[10] có khóa nhỏ nhất. Để đẩy a[1] xuống trong cây a[1]..a[9], ta thấy khóa của a[1] bây giờ lớn hơn khóa của con phải a[3] (10 > 2) và khóa của con phải a[3] nhỏ hơn khóa của con trái a[2] (2 < 3) do đó đẩy a[1] xuống bên phải (hoán đổi a[1] và a[3] cho nhau). Tiếp tục xét a[3], khóa của a[3] lớn hơn khóa của con phải a[7] và khóa của con phải nhỏ hơn khóa của con trái, do đó ta đẩy a[3] xuống bên phải (hóan đổi a[3] và a[7] cho nhau) và vì a[7] là nút lá nên việc đẩy xuống kết thúc. Ta có bảng sau:

Chỉ số 1 2 3 4 5 6 7 8 9 10
Ban đầu 52 62 5 3 2 26 103 5 12 9 10 9 310
Heap 210 2 3 210 9 6 5 12 910 10 9 102
i = 10 2 3 9 6 5 12 10 10 9 2

Hình 2-15: Hoán đổi a[1] với a[10] và đẩy a[1] xuống trong a[1..9]

Với i = 9, ta hoán đổi a[1] và a[9] cho nhau. Để đẩy a[1] xuống trong cây a[1]..a[8], ta thấy khóa của a[1] bây giờ lớn hơn khóa của con trái a[2] và khóa của con trái nhỏ hơn khóa của con phải a[3] nên đẩy a[1] xuống bên trái (hoán đổi a[1] và a[2] cho nhau). Tiếp tục xét a[2], khóa của a[2] lớn hơn khóa của con phải a[5] và khóa của con phải nhỏ hơn khóa của con trái a[4] nên đẩy a[2] xuống bên phải (hoán đổi a[2] và a[5] cho nhau) và vì a[5] là nút lá (trong cây a[1]..a[8]) nên việc đẩy xuống kết thúc. Ta có bảng sau

Chỉ số 1 2 3 4 5 6 7 8 9 10
Ban đầu 52 62 5 3 2 26 103 5 12 9 10 9 310
Heap 210 2 3 210 9 6 5 12 910 10 9 102
i = 10 29 3 39 5 9 6 59 12 10 10 92 2
i = 9 3 5 9 6 9 12 10 10 2

Hình 2-16: Hoán đổi a[1] với a[9] và đẩy a[1] xuống trong a[1..8]

Với i = 8, ta hoán đổi a[1] và a[8] cho nhau. Để đẩy a[1] xuống trong cây a[1]..a[7], ta thấy khóa của a[1] bây giờ lớn hơn khóa của con trái a[2] và khóa của con trái nhỏ hơn khóa của con phải a[3] nên đẩy a[1] xuống bên trái (hoán đổi a[1] và a[2] cho nhau). Tiếp tục xét a[2], khóa của a[2] lớn hơn khóa của con trái a[4] và khóa của con trái nhỏ hơn khóa của con phải a[5] nên đẩy a[2] xuống bên trái (hoán đổi a[2] và a[4] cho nhau) và vì a[4] là nút lá (trong cây a[1]..a[7]) nên việc đẩy xuống kết thúc. Ta có bảng sau

Chỉ số 1 2 3 4 5 6 7 8 9 10
Ban đầu 52 62 5 3 2 26 103 5 12 9 10 9 310
Heap 210 2 3 210 9 6 5 12 910 10 9 102
i = 10 29 3 39 5 9 6 59 12 10 10 92 2
i = 9 310 5 510 6 9 610 9 12 10 103 2
i = 8 5 6 9 10 9 12 10 3

Hình 2-17: Hoán đổi a[1] với a[8] và đẩy a[1] xuống trong a[1..7]

Tiếp tục quá trình trên và giải thuật kết thúc sau bước 9, ứng với bước i =2.

Thời gian thực hiện của HeapSort là O(n logn)

Như đã phân tích trong mục 2.5.3.1, thủ tục PushDown lấy O(logn) để đẩy một nút xuống trong cây có n nút.

Trong thủ tục HeapSort dòng lệnh {1}-{2}) lặp n/2 lần mà mỗi lần PushDown lấy O(logn) nên thời gian thực hiện {1}-{2} là O(n logn). Vòng lặp {3}-{4}-{5} lặp n-1 lần, mỗi lần PushDown lấy O(logn) nên thời gian thực hiện của {3}-{4}-{5} là O(n logn). Tóm lại thời gian thực hiện HeapSort là O(n logn).

0