There are two main types of data produced by and used in the analysis of assessments: response data and item data. Response data are produced by the individual learners as they answer questions on a test. A test is a specific collection of questions that evaluate a common domain of proficiency or knowledge. Individual questions on a test are referred to as items. Test items can be multiple-choice, short-answer, open-ended questions, or performance tasks. Item data are produced by analysing or reviewing items and recording their statistical or cognitive properties. Each row in a response data file describes the characteristics of a learner or test-taker, whereas each row in an item data file describes the characteristics of a test item.
Có hai loại dữ liệu chính được sử dụng trong phân tích: dữ liệu phản hồi và câu hỏi thi. Dữ liệu phản hồi được thu thập từ bài làm của thí sinh trong các kỳ thi. Một bài thi là tổ hợp các câu hỏi nhằm đánh giá thí sinh về một lĩnh vực nào đó. Mỗi câu hỏi trong bài thi được coi là một item. Bài thi có thể ở dạng đa lựa chọn, trả lời ngắn, tự luận hoặc giải quyết nhiệm vụ được giao. Dữ liệu câu hỏi thi được thu thập từ việc phân tích hoặc xem xét và ghi nhận những thuộc tính thống kê hoặc đặc điểm của câu hỏi (được nhận định bởi người có kinh nghiệm). Mỗi dòng trong bảng dữ liệu phản hồi cung cấp thông tin về đặc điểm của thí sinh, mỗi dòng trong bảng dữ liệu câu hỏi thi cung cấp thông tin về đặc điểm của câu hỏi thi tương ứng.
IATA can read and write a variety of common data table formats (for example, Access, Excel, SPSS, delimited text files) if they are formatted correctly. If the data are not formatted with the correct structure, IATA will not be able to carry out the analyses. Database-compatible format such as Access or SPSS already take care of most data formatting issue. However, if the data are stored in a less restrictive format, such as Excel or text file, the following conventions should be followed:
IATA có thể xử lý nhiều dạng dữ liệu khác nhau (như Access, Excel, SPSS, delimited text files) nếu dữ liệu đó được trình bày đúng cấu trúc. Nếu dữ liệu trình bày không đúng cấu trúc thì IATA không thể đọc để phân tích được. Dữ liệu được tạo bởi các phần mềm như Access, SPSS thường có cấu trúc phù hợp, tuy nhiên nếu dữ liệu được lưu trữ trên những phần mềm như Excel, text cần phải lưu ý những điềm sau:

  • The names of variables should appear in the cell at the top of each column (known as the header). Each column with data must have a column header. The name of each variable must be distinct from the names of other variables in a data file. The names of variables must begin with a letter and should not contain any spaces.
  • Tên của biến phải được đặt ở ô đầu mỗi cột (gọi là header). Mỗi cột có dữ liệu đều phải có header. Trong một file dữ liệu các biến không được trùng tên. Tên biến phải được bắt đầu bằng một chữ cái (không phải là số hay ký tự đặc biệt) và không chứa khoảng trắng.
  • The data range must not contain any empty rows or columns. The data range is the rectangle of cells that contain data, beginning with the variable name of the first variable to appear in the data file and ending with the value of the last variable in the bottom-most row.
  • Vùng dữ liệu không được chứa các cột hay dòng trống.
  • The data range must begin at the first cell in the spreadsheet or file. In Excel, this cell is labelled “A1.” In text files, this is the top-left cursor position in the text file.
  • Vùng dữ liệu được tính từ ô đầu tiên của bảng dữ liệu. Trong excel là ô “A1”. Trong file text là vị trí đầu tiên của văn bản.

The two examples in Figure 9.1 illustrate incorrect and correct data formats. In the incorrect data format, on the left, there is a blank row above the data rectangle and a blank column to the left of it. There are also blank rows and columns within the rectangle and a column containing data without a header. In the correct format, on the right, all of the data are gathered into a single rectangle at the top-left of the spreadsheet with no blank rows or columns.
Dưới đây là hai ví dụ về định dạng vùng dữ liệu đúng và vùng dữ liệu sai.

Incorrect Format – empty rows and columns within and around the data
Định dạng sai – có dòng và cột trống trong vùng dữ liệu

A B C D E F G
1
2 Var_A Var _B Var _C Var _E
3
4 1 1 1 1 1
5 2 2 2 2 2
6 3 3 3 3 4
7 4 4 4 4 4
8
9 5 5 5 5 5

Correct Format – data range is in top corner without empty rows or columns
Định dạng đúng – vùng dữ liệu được bắt đầu từ góc trên và không có dòng hay cột trống

A B C D E F G
1 Var _A Var _B Var _C Var _D Var _E
2 1 1 1 1 1
3 2 2 2 2 2
4 3 3 3 3 3
5 4 4 4 4 4
6 5 5 5 5 5
7
8
9

 

Figure 8.1 Incorrect and correct data formatting examples