Xử ký Dữ liệu thiếu và dữ liệu bỏ qua

Missing data occur when a student does not provide a response to a test item. When this happens, rather than leaving the data field blank, a missing value code is used to record why the response is missing. There are two types of missing responses: missing and omitted.
Dữ liệu thiếu xảy ra khi thí sinh không chọn phương án trả lời cho câu hỏi. Trong trường hợp này thay vì để trống thì ta sẽ nhập vào một giá trị được mã hóa để thay thế và giá trị đó được hiểu là thí sinh không trả lời. Có hai dạng trả lời thiếu: là missing và omitted.
Missing codes are assigned to variables when students could have responded to an item but chose not do so, leaving the answer blank. Such missing data will be scored as incorrect. In contrast, omitted data codes are used when students were not administered an item, as when a national assessment uses a rotated booklet design.
Missing là trường hợp thí sinh không chọn phương án nào (bỏ trống, bỏ sót), trường hợp này coi như thí sinh trả lời sai. Ngược lại, Omitted được hiểu là khi thí sinh bỏ qua câu hỏi chứ không phải là bỏ sót (trường hợp này chỉ xảy ra khi đề thi cho phép “bỏ qua” – bài thi được làm trực tiếp trên máy tính).
Codes that apply to student responses that were unreadable or where the student has answered inappropriately, such as selecting two multiple-choice options, are a form of missing response for the purpose of item distractor analysis. Depending on the circumstances of your test administration or data processing, you must decide whether these codes will be processed as missing or omitted data. Generally, if these data errors are the result of student error, the codes should be treated as missing and will be scored as incorrect. However, if the errors are the result of limitations in the data processing, such as imprecision in score card scanning that we必利勁
re not human-verified, then the codes should be treated as omitted.

Những câu trả lời không được chấp nhận như chọn nhiều hơn 1 lựa chọn đối với câu hỏi dạng multiple-choice hay không chọn phương án nào thì trong phân tích đều được xem là missing. Dựa vào trường hợp cụ thể của bài thi/kiểm và cách xử lý số liệu mà ta mã hóa dữ liệu missing ở dạng thiếu (missing) hay bỏ qua (omitted). Thông thường, nếu dữ liệu thiếu là lỗi do kết quả làm bài của thí sinh thì dữ liệu missing được xem như trả lời sai. Tuy nhiên, nếu missing không phải là do kết quả làm bài của thí sinh (lỗi nhập liệu hay những vấn đề khác về kỹ thuật, phần mềm…) thì missing được coi như omitted.
Another use of omitted data codes occurs when a balanced rotated booklet design is used. Balanced rotating booklet designs involve giving different randomly equivalent samples of items to different students, so that not all students answer the same test items (see Anderson and Morgan, 2008). These designs permit extensive subject matter coverage while limiting the amount of student test taking time. In a rotating booklet design, omitted codes must be assigned to all items for a student except those contained in the test booklet presented to the student. Omitted codes are not normally assigned to items in situations where all students are required to answer all of the items.
Trường hợp sử dụng omitted khác đó là khi kiểm tra theo hình thức “balanced rotated booklet designs”. Đây là dạng đề sinh ngẫu nhiên các câu hỏi tương đương nhưng khác nhau cho các thí sinh khác nhau, vì vậy các thí sinh sẽ trả lời các câu hỏi khác nhau (xem Anderson & Morgan, 2008). Dạng đề này cho phép bao phủ các vùng kiến thức lớn nhưng giới hạn về số lượng thí sinh và thời gian làm bài. Mã omitted được dùng cho tất cả các câu hỏi ngoại trừ các câu xuất hiện trong đề kiểm tra. Omitted không được sử dụng trong trường hợp tất cả các thí sinh cùng được yêu cầu phải làm tất cả các câu hỏi.
Common conventions use specific values for the different types of non-response data. See Greaney and Kellaghan (2012) for information on response codes. Common values used are:
Thông thường chúng ta quy ước mã hóa các giá trị cụ thể cho các kiểu dữ liệu missing. Xem Greaney & Kellaghan (2012) để có thêm thông tin về mã hóa dữ liệu.  Cách mã hóa dữ liệu thường dùng như:

  • 9 for missing responses, where students have not responded at all to an item,
  • 9 cho dữ liệu missing khi thí sinh không chọn phương án trả lời nào;
  • 8 for unscorable responses, which typically occurs in multiple choice tests when students provide multiple response and in open-ended items when student responses are illegible, and
  • 8 cho dữ liệu missing khi thi sinh chọn nhiều hơn 1 phương án đối với câu hỏi dạng multiple-choice hoặc câu trả lời không đọc được đối với câu hỏi tự luận;
  • 7 for omitted or not-presented items, which might be used in a rotated booklet design.
  • 7 cho omitted hoặc câu hỏi ẩn (không xuất hiện trong đề) đối với dạng đề “rotated booklet design”.

Regardless of the specific codes used, you must specify how IATA is to treat each non-response code, as either missing or omitted. 
Không kể những mã cụ thể được sử dụng, ta cần xác định cách IATA xử lý đối với các trường hợp không trả lời theo kiểu missing hay omitted.