24/05/2018, 22:07

Điều khiển file và biến đổi file

Các file dữ liệu không phải lúc nào cũng được tổ chức dưới các dạng lý tưởng cho các đòi hỏi riêng biệt của bạn. Bạn luôn cần phải kết hợp các file dữ liệu sắp xếp dữ liệu theo một trật tự khác nhau, chọn một nhóm phụ các đối tượng, hoặc thay đổi đơn vị ...

Các file dữ liệu không phải lúc nào cũng được tổ chức dưới các dạng lý tưởng cho các đòi hỏi riêng biệt của bạn. Bạn luôn cần phải kết hợp các file dữ liệu sắp xếp dữ liệu theo một trật tự khác nhau, chọn một nhóm phụ các đối tượng, hoặc thay đổi đơn vị phân tích bằng cách gộp các đối tượng với nhau. Một phạm vi lớn của khả năng biến đổi dữ liệu là có sẵn, bao gồm các năng lực để:

Sắp xếp dữ liệu. Bạn có thể sắp xếp dữ liệu dựo vào trị số của một hoặc một số biến.

Chuyển các đối tượng và các biến với nhau. Định dạng file dữ liệu SPSS đọc các hàng là các đối tượng và các cột là các biến. Đối với các file trong đó trật tự này đảo ngược, bạn có thể chuyển đổi các hàng và các cột và đọc dữ liệu trong định dạng chính xác.

Trộn các file. Bạn có thể trộn nhiều file với nhau. Bạn có thể kết hợp các file với cùng biến nhưng khác đối tượng hoặc cùng đối tượng nhưng khác biến.

Chọn các nhóm phụ các đối tượng. Bạn có thể hạn chế các phân tích của mình trong một nhóm các đối tượng hoặc tiến hành đồng thời các phép phân tích trong các nhóm đối tượng khác nhau.

Gộp chung/Tổng hợp dữ liệu. Bạn có thể thay đổi đơn vị của phép phân tích bằng cách tổng hợp các đối tượng với nhau dựa trị số của một hoặc một số biến lập nhóm.

Gia quyền dữ liệu. Gia quyền các đối tượng để phân tích dự trên trị số của một biến gia quyền.

Hộp thoại này sắp xếp các đối tượng (các hàng) của file dữ liệu dựa vào các trị số của một hoặc một số biến sắp xếp. Bạn cửa sổ thể sắp xếp các đối tượng theo trật tự tăng dần hoặc giảm dần.

  • Nếu bạn chọn nhiều biến sắp xếp, các đối tượng được sắp xếp theo từng biến trong vòng từng nhóm của biến đứng trước trong danh sách Short by. Ví dụ nếu bạn chọn biến gender {giới tính} là biến sắp xếp thứ nhất và minority {thiểu số}là biến sắp xếp thứ hai, các đối tượng sẽ được sắp xếp theo phân loại thiểu số trong từng loại giới tính.
  • Đối với các biến, các chữ in đứng trước các chữ thường giống nó trong trật tự sắp xếp.
Hộp thoại Sort Cases

Để sắp xếp các đối tượng

  • Từ thanh menu chọn

Data

Sort Cases ...

  • Chọn một hoặc một số biến sắp xếp.

Thủ tục Select Cases cung cấp một số phương pháp khác nhau để chọn một nhóm các đối tượng dựa vào các tiêu chí bao gồm các biến và các biểu thức phức. Bạn cũng có thể chọn một mẫu ngẫu nhiên các đối tượng. Tiêu chí dùng để định nghĩa một nhóm có thể bao gồm:

  • Các trị số biến và các phạm vi/khoảng biến thiên
  • Các phạm vi ngày tháng và thời gian
  • Các số hàng
  • Các biểu thức số học
  • Các biểu thức lô-gíc
  • Các hàm

Unselected Cases. Bạn có thể lọc hoặc xoá bỏ các đối tượng không đáp ứng tiêu chuẩn lựa chọn. Các đối tượng được lọc vẫn duy trì trong file dữ liệu nhưng bị loại ra khỏi phép phân tích. Thủ tục Select Cases tạo ra một biến lọc, filter_$, để chỉ rõ tình trạng lọc. Các đối tượng được chọn có trị số 1; các đối tượng không được chọn (bị lọc) có trị số 0. Các đối tượng bị lọc cũng được đánh dấu bằng một dấu gạch chéo qua số hàng trong cửa sổ Data Editor. Để đóng tình trạng lọc và bao gồm mọi đối tượng trong phép phân tích của ban, hãy chọn All Cases.

Các đối tượng bị xoá bỏ bị loại ra khỏi file dữ liệu và không thể phục hồi lại được nếu bạn lưu file dữ liệu sau khi xoá bỏ các đối tượng.

Hộp thoại Select Cases

Để chọn một nhóm các đối tượng

  • Từ thanh menu chọn:

Data

Select Cases...

  • Chọn một trong những phương pháp lựa chọn các đối tượng.
  • Định rõ các tiêu chí chọn các đối tượng.

Select Cases: If

Hộp thoại này cho phép bạn chọn các nhóm đối tượng có sử dụng các biểu thức điều kiện. Một biểu thức điều kiện trả lại một trị số true {đúng}, false {sai}, hoặc missing {khuyết thiếu} cho từng đối tượng.

Hộp thoại Select Cases: If
  • Nếu kết quả của một biểu thức điều kiện là true, đối tượng sẽ được chọn
  • Nếu kết quả của một biểu thức điều kiện là false hoặc missing, đối tượng sẽ không được chọn
  • Hầu hết các biểu thức điều kiện sử dụng một hoặc một vài trong số 6 phép tính điều kiện (<, >, =, <=, >=, và ~=) trên bảng tính toán.
  • Các biểu thức điều kiện có thể bao gồm các tên biến, hằng số, các phép tính số học, các hàm số và các hàm khác, các biến lô-gic, và các phép tính điều kiện.

Select Cases: Random Sample

Hộp thoại này cho phép bạn chọn một mẫu ngẫu nhiên dự trên một tỷ lệ thích hợp hoặc một lượng chính xác các đối tượng.

Approximately. Tạo ra một mẫu ngẫu nhiên các các đối tượng gần đúng với một tỷ lệ được xác định trước. Do cách làm này tạo ra một quyết định ngẫu nhiêu giả định độc lập cho từng đối tượng, tỷ lệ các đối tượng được chọn chỉ có thể gần đúng với tỷ lệ được xác định trước. Càng có nhiều đối tượng trong file dữ liệu, tỷ lệ các đối tượng được chọn càng gần đúng với tỷ lệ được xác định trước.

Exactly. Một số lượng đối tượng được xác định bởi người sử dụng. Bạn cũng phải chỉ rõ số các đối tượng để từ đó tạo ra mẫu. Con số thứ hai cần phải nhỏ hơn hoặc bằng tổng số đối tượng có trong file dữ liệu. Nếu con số này vượt quá tổng số đối tượng có trong file dữ liệu, mẫu sẽ bao gồm một cách tỷ lệ ít đối tượng hơn con số yêu cầu.

Hộp thoại Select Cases: Random Sample

Select Cases: Range

Hộp thoại này chọn các đối tượng dự vào một phạm vi số đối tượng hoặc một phạm vi các ngày hoặc thời gian

  • Các phạm vi đối tượng được dựa vào số hàng được thể hiện trong cửa sổ Data Editor
  • Các phạm vi ngày tháng hoặc thời gian chỉ có sẵn đối với dữ liệu chuỗi thời gian {time series data} với các biến ngày tháng được xác định (menu Data, Define Data).

Hộp thoại Select Cases: Range đối với phạm vi các đối tượng (không có các biến ngày tháng được định nghĩa)

0