24/05/2018, 16:29

Các phép biến đổi dữ liệu

Trong một trường hợp lý tưởng, dữ liệu ban đầu (thô) của bạn là thích hợp hoàn toàn cho loại phân tích mà bạn muốn tiến hành, và mọi quan hệ giữa các biến là hoặc tuyến tính một cách thích hợp hoặc gần như trực giao. Rất đáng tiếc đây là trường hợp rất hiếm ...

Trong một trường hợp lý tưởng, dữ liệu ban đầu (thô) của bạn là thích hợp hoàn toàn cho loại phân tích mà bạn muốn tiến hành, và mọi quan hệ giữa các biến là hoặc tuyến tính một cách thích hợp hoặc gần như trực giao. Rất đáng tiếc đây là trường hợp rất hiếm có. Các phân tích sơ bộ có thể bộc lộ các trình tự mã hoá bật tiện hoặc các sai số do mã hoá, hoặc biến đổi dữ liệu có thể bị đòi hỏi để bộ lộ mối quan hệ thực giữa các biến.

Bạn có thể thực hiện các phép biến đổi từ những nhiệm vụ đơn giản, chẳng hạn như thu nhỏ số nhóm/tổ để tiến hành phân tích, hoặc phức tạp hơn như tạo các biến mới dựa trên các phương trình phức tạp và các câu lệnh/khai báo có điều kiện

Thủ tục Compute Variable tính toán các trị số của một biến được dựa trên sự biến đổi của một biến khác

  • Bạn có thể tính các trị số cho các biến dạng số hoặc dạng chuỗi (các ký tự chuỗi có dạng số)
  • Bạn có thể lập các biến mới hoặc thay thế các trị số của biến đã có. Đối với biến mới, bạn cũng có thể chỉ định loại biến và nhãn biến.
  • Bạn có thể tính toán các trị số một cách có chọn lọc đối với các tập hợp con của dữ liệu dựa trên các điều kiện lô-gic.
  • Bạn có thể sử dụng trên 70 hàm lập sẵn {built-in}, bao gồm các hàm đại học, các hàm thống kê, các hàm phân bố và các hàm chuỗi.

Để tính toán biến

  • Từ thanh menu chọn

Transform

Compute…

  • Đánh tên của biến đích {target variable}. Nó có thể là một biến đã có hoặc một biến mới sẽ được bổ sung vào file dữ liệu làm việc.
  • Xây dựng một biểu thức, hoặc dán các bộ phận vào Numeric Expression hoặc gõ trực tiếp vào đó.
  • Dán các hàm từ danh sách các hàm {Functions} và nhập các tham số được biểu thị bằng các dấu hỏi
  • Các hằng số dạng chuỗi phải được để trong dấu mở đóng ngoặc đơn hoặc ngoặc kép
  • Các hằng số dạng số phải được nhập theo định dạng kiểu Hoa Kỳ với dấu chấm (.) là dấu thập phân.

Đối với biến dạng chuỗi mới, bạn còn phải chọn Type&Lable để xác định loại dữ liệu.

Hộp thoại Compute Variable

Tính toán biến với tuỳ chọn If Cases

Hộp thoại If Cases cho phép bạn áp dụng phép chuyển đổi dữ liệu đối với các nhóm các đối tượng được chọn lọc, có sử dụng các biểu thức điều kiện. Một biểu thức điều kiện trả lại một trị số đúng hay sai hoặc khuyết thiếu cho từng đối tượng.

  • Nếu kết quả của một biểu thức điều kiện là true {đúng}, phép biến đổi được áp dụng cho đối tượng
  • Nếu kết quả của một biểu thức điều kiện là false {sai} hoặc missing {khuyết thiếu}, phép biến đổi không được áp dụng cho đối tượng
  • Hầu hết các biểu thức điều kiện sử dụng một hoặc một số trong 6 dấu quan hệ (<, >, <= (nhỏ hơn và bằng), >= (bằng và lớn hơn), = và ~= (khác)) trên bảng tính toán.
  • Các biểu thức điều kiện có thể bao hàm các tên biến, các hằng số, các phép toán số học, các hàm số và hàm khác, các biến lô-gíc và các thao tác có điều kiện khác

Type&Label {Loại và nhãn biến} trong hộp thoại Compute Variable

Theo mặc định các biến mới có dạng số. Để tính toán một biến dạng chuỗi bạn phải xác định loại dữ liệu và độ rộng

Label. Nhãn biến là không bắt buộc phải định nghĩa, và có thể dài đến 120 ký tự. Bạn có thể nhập một nhãn biến hoặc sử dụng 110 ký tự đầu tiên của biểu thức tính toán như là nhãn biến.

Type. Các biến được tính toán có thể là dạng số hoặc dạng chuỗi (chữ cái kiểu con số). Các biến dạng chuỗi không thể được ding trong các phép tính toán.

Hộp thoại loại và nhãn biến trong thủ tục Compute Variable

Hộp thoại này toạ nên một biến đếm số lần xảy ra của cùng trị số hoặc các trị số trong một danh sách các biến cho từng đối tượng. Ví dụ một cuộc điều tra có thể bao gồm một danh sách các tạp chí với hộp đánh dấu có/không để chỉ ra xem loại tạp chí nào mà từng đối tượng điều tra đọc. Bạn có thể đếm số câu trả lời cho từng đối tượng điều tra để tạo ra một biến mới chứa đựng tổng số tạp chí được đọc.

Đếm số lần xảy ra của các trị số trong các đối tượng

Để đếm số lần các trị số xảy ra trong các đối tượng

  • Từ thanh menu chọn

Transform

Count…

  • Chọn một hay hơn một biến cùng loại (dạng số hoặc dạng chuỗi)
  • Nhắp Define Variable và xác định loại trị số hoặc các trị số nào sẽ được đếm.
  • Không bắt buộc, bạn có thể định nghĩa một tập hợp con các đối tượng để đếm số lần xảy ra của các trị số.

Hộp thoại If Cases để xác định các tập hợp con giống như được mô tả trong phần Compute Variable.

Đếm các trị số trong các đối tượng: Các trị số cần đếm

Trị số của biến đích (trong hộp thoại chính) được tăng thêm 1 cho mỗi lần khi một trong những biến được lựa chọn thoả mãn một đặc tả trong Value to Count. Nếu một đối tượng thoả mãn một số mô tả đối với bất kỳ biến nào, biến đích được tăng một số lần tương ứng đối với biến đó.

Các đặc tả về trị số có thể bao gồm các trị số riêng biệt, các trị số khuyết thiếu (hệ thống hoặc người sử dụng), và các phạm vi {range}. Các phạm vi bao gồm các điểm cuối của chúng và bất kỳ trị số khuyết thiếu của người sử dụng có độ lớn rơi vào trong phạm vi đó.

Hộp thoại các trị số cần đếm

Bạn có thể biến đổi trị số dữ liệu bằng cách mã hoá lại chúng

Mã hoá lại dữ liệu ngay trong biến có sẵn (không tạo thành biến mới)

Mã hoá lại dữ liệu ngay trong biến có sẵn {Recode into Same Variable} gán lại các trị số của biến đang có hoặc cắt giảm bớt các phạm vi của các trị số đang có vào các trị số mới

Bạn có thể mã hoá các biến dạng số và dạng chuỗi. Nếu bạn chọn nhiều biến, chúng phải có cùng loại. Bạn không thể mã hoá các biến dạng chuỗi và dạng số cùng với nhau.

Hộp thoại Recode into Same Variables

Để mã hoá lại dữ liệu ngay trong biến đã có sẵn

  • Từ thanh menu chọn

Transform

Recode

Into Same Variables…

  • Chọn các biến mà bạn muốn mã hoá, Nếu bạn chọn nhiều biến, chúng phải có cùng dạng (chuỗi hoặc số)
  • Nhắp vào Old and New Values và định rõ cách mã hoá lại trị số.

Một cách tuỳ chọn, bạn có thể chọn một nhóm các đối tượng để mã hoá

Hộp thoại If Cases để xác định một nhóm các đối tượng cũng giống như đã được mô tả trong mục tính toán biến {Compute Variable}

Hộp thoại Recode into Same Values: Old and NewValues

Bạn có thể xác định các trị số để mã hoá trong hộp thoại này. Mọi chỉ định về trị số phải cùng loại dữ liệu (dạng số hay dạng chuỗi) giống như của các biến đã được chọn trong hộp thoại chính.

Old Value. Trị số (hoặc các trị số) bị mã hoá. Bạn có thể mã hoá các trị số đơn, một phạm vi các trị số và các trị số khuyết thiếu. Các trị số khuyết thiếu hệ thống và các phạm vi không thể được chọn đối với các biến dạng chuỗi bởi vì không có khái niệm nào áp dụng cho các biến dạng chuỗi. Các phạm vi bao gồm các điểm cuối của chúng và mọi trị số khuyết thiếu của người sử dụng nằm trong phạm vi này.

New Value. Trị số đơn mà trong nó từng trị số cũ hoặc phạm vi của các trị số được mã hoá. Bạn có thể nhập một trị số hoặc chỉ định trị số khuyết thiếu hệ thống.

Old->New. Danh sách các trị số sẽ được sử dụng để mã hoá biến (hoặc các biến). Bạn có thể bổ sung, thay đổi hoặc loại bỏ các trị số này ra khỏi danh sách. Danh sách được tự động sắp xếp, dựa trên các trị số cũ, sử dụng trật tự sau: các trị số đơn, các trị số khuyết thiếu, các phạm vi và mọi trị số khác. Nếu bạn thay đổi một trị số trong danh sách, thủ tục sẽ tự động sắp xếp lại danh sách, nếu cần thiết, để duy trì trật tự này.

Hộp thoại Old and New Values

Mã hoá thành biến khác

Thủ tục Recode into Different Variables gán lại các trị số của các biến có sẵn hoặc các phạm vi của các trị số có sẵn vào các trị số mới của một biến mới. Ví dụ bạn có thể mã hoá lương năm của đối tượng điều tra vào một biến mới có các trị số là lương năm nhưng chia theo khoảng.

  • Bạn có thể mã hoá các biến dạng số và dạng chuỗi
  • Bạn có thể mã hoá các biến dạng số sang dạng chuỗi và ngược lại
  • Nếu bạn chọn nhiều biến, chúng phải có cùng loại biến. Bạn không thể cùng một lúc mã hoá lại cả biến dạng số lẫn biến dạng chuỗi được.

Hộp thoại Recode into Different Variables

Để mã hoá lại dữ liệu sang biến mới

  • Từ thanh menu chọn

Transform

Recode

Into Different Variables...

  • Chọn các biến mà bạn muốn mã hoá, Nếu bạn chọn nhiều biến, chúng phải có cùng dạng (chuỗi hoặc số)
  • Nhập một tên biến mới cho từng biến và nhắp Change.
  • Nhắp Old and New Values và định rõ cách mã hoá lại trị số.

Một cách tuỳ chọn, bạn có thể chọn một nhóm các đối tượng để mã hoá

Hộp thoại Recode into Same Values: Old and NewValues

Bạn có thể xác định các trị số để mã hoá trong hộp thoại này. Mọi chỉ định về trị số phải cùng loại dữ liệu (dạng số hay dạng chuỗi) giống như của các biến đã được chọn trong hộp thoại chính.

Old Value. Trị số (hoặc các trị số) bị mã hoá. Bạn có thể mã hoá các trị số đơn, một phạm vi các trị số và các trị số khuyết thiếu. Các trị số khuyết thiếu hệ thống và các phạm vi không thể được chọn đối với các biến dạng chuỗi bởi vì không có khái niệm nào áp dụng cho các biến dạng chuỗi. Các phạm vi bao gồm các điểm cuối của chúng và mọi trị số khuyết thiếu của người sử dụng nằm trong phạm vi này.

New Value. Trị số đơn mà trong nó từng trị số cũ hoặc phạm vi của các trị số được mã hoá. Bạn có thể nhập một trị số hoặc chỉ định trị số khuyết thiếu hệ thống.

Old->New. Danh sách các trị số sẽ được sử dụng để mã hoá biến (hoặc các biến). Bạn có thể bổ sung, thay đổi hoặc loại bỏ các trị số này ra khỏi danh sách. Danh sách được tự động sắp xếp, dựa trên các trị số cũ, sử dụng trật tự sau: các trị số đơn, các trị số khuyết thiếu, các phạm vi và mọi trị số khác. Nếu bạn thay đổi một trị số trong danh sách, thủ tục sẽ tự động sắp xếp lại danh sách, nếu cần thiết, để duy trì trật tự này.

Hộp thoại Old and New Values
0