Тест (оценка) - Test (assessment)

Камбоджийский студенты, сдающие экзамен на поступление в Техническую школу Дона Боско Сиануквиль в 2008
Американец студенты в классе компьютерных основ проходят компьютерный тест

А тест или же осмотр (неофициально, экзамен или же оценка) является образовательная оценка предназначен для измерения тестируемого знание, навык, способность, физическая подготовка или классификации по многим другим темам (например, верования ).[1] Тест может быть проведен устно, на бумаге, на компьютер или в заранее определенной области, где тестируемый должен продемонстрировать или применить набор навыков.

Тесты различаются по стилю, строгости и требованиям. Не существует единого мнения или неизменного стандарта для форматов и сложности тестов. Часто формат и сложность теста зависят от образовательной философии преподавателя, предмета, размера класса, политики учебного заведения и требований аккредитации или руководящих органов.

Тест может проводиться формально или неформально. Примером неформального теста является тест по чтению, который родители проводят для ребенка. Формальный тест может быть Выпускной экзамен под руководством учителя в классе или Тест IQ под руководством психолога в клинике. Формальное тестирование часто приводит к оценка или результат теста.[2] Результат теста можно интерпретировать в отношении норма или же критерий, а иногда и то, и другое. Норма может быть установлена ​​самостоятельно или статистический анализ большого количества участников.

Тест может быть разработан и проведен инструктором, клиницистом, руководящим органом или провайдером тестирования. В некоторых случаях разработчик теста не может нести прямую ответственность за его администрирование. Например, Служба образовательного тестирования (ETS), некоммерческая образовательная организация по тестированию и оценке, разрабатывает стандартизованные тесты, такие как SAT, но не может напрямую участвовать в проведении или контроле за этими тестами.

История

Ранняя история

Древний Китай был первой страной в мире, внедрившей общенациональный стандартизированный тест, который назывался имперский экзамен. Основной целью этого экзамена был отбор способных кандидатов на определенные государственные должности.[3] Имперская экспертиза была учреждена Династия Суй в 605 году нашей эры, а затем был отменен Династия Цин 1300 лет спустя, в 1905 году. Англия приняла это система экзаменов в 1806 г. для отбора конкретных кандидатов на должности в Гражданская служба, по образцу китайца имперский экзамен.[4] Эта экзаменационная система позже была применена в образовании и начала влиять на другие части мира, поскольку стала заметным стандартом (например, правила, запрещающие маркерам узнать личность кандидатов). стандартизированные тесты.

Современная эра

Гражданская служба

С середины 19 века университеты начали вводить письменные экзамены для оценки способностей учеников. Это отрывок из 1842 г. Tripos экспертиза в Кембриджский университет.

По мере перехода профессии к современной системе массового образования стиль вступительный экзамен на государственную службу стал фиксированным, с упором на стандартизированные работы, которые должны были быть заполнены большим количеством студентов. Лидером в этом отношении был растущий Гражданская служба который начал двигаться к меритократический Основа для выбора в середине 19 века в Англии.

Британская государственная служба находилась под влиянием имперские экзамены система и меритократическая система Китая. Томас Тейлор Медоуз, британский консул в Гуанчжоу, Китай утверждал в своем Беспорядочные заметки о правительстве и народе Китая, опубликованный в 1847 году, что «долгая жизнь Китайской империи исключительно и целиком обусловлена ​​хорошим правительством, которое заключается в продвижении только талантливых и достойных людей», и что британцы должны реформировать свою гражданскую службу, сделав этот институт меритократический.[5]Еще в 1806 г. Почетная Ост-Индская компания создал колледж недалеко от Лондона для обучения и проверки администраторов территорий Компании в Индии.[6] Экзамены на индийскую «государственную службу» (термин, введенный Компанией) были введены в 1829 году.[7]

В 1853 г. Канцлер казначейства Уильям Гладстон, заказал сэр Стаффорд Норткот и Чарльз Тревельян изучить работу и организацию Гражданская служба. Под влиянием древнего китайского императорского экзамена Отчет Northcote – Trevelyan от 1854 г. сформулировал четыре основных рекомендации: прием на работу должен производиться на основе заслуг, определяемых посредством стандартизированного письменного экзамена, кандидаты должны иметь солидное общее образование, позволяющее переводить их из одного отдела в другой, призывники должны распределяться по иерархии и продвижение по службе должно быть благодаря достижениям, а не «продвижению по службе, покровительству или покупке».[8] А Комиссия по государственной службе также была создана в 1855 году для надзора за открытым набором и прекращением патронажа, и большинство других рекомендаций Норткота-Тревельяна были реализованы в течение нескольких лет.[9]

Модель меритократического экзамена Норткота-Тревельяна оставалась практически стабильной в течение ста лет. Это была дань успеху в искоренении коррупции, предоставлении государственных услуг (даже в условиях стресса двух мировых войн) и эффективном реагировании на политические изменения. Он также имел большое международное влияние и был адаптирован членами Содружество. В Закон Пендлтона о реформе государственной службы установил аналогичную систему в Соединенных Штатах.

Образование

Студенты, получающие стипендия экзамен в аудитории 1940 г.

Письменные экзамены были неслыханными для европейского образования до 1702 года. «Китайские экзамены неоднократно описывались в западной литературе о Китае семнадцатого и восемнадцатого веков».[10] Стандартизированное тестирование начал влиять на методы экзаменов в британских университетах с 1850-х годов, где устный экзамен было нормой с Средний возраст. В США переход произошел под влиянием реформатора образования. Гораций Манн. Этот сдвиг решительно помог перейти образование в современную эпоху за счет стандартизации расширяющихся учебных программ по естествознанию и наукам. гуманитарные науки, создавая рационализированный метод оценки учителей и учебных заведений и создавая основу для потоковая передача студентов по способности.[11]

И Первая мировая война, и Вторая мировая война продемонстрировали необходимость стандартизированное тестирование и преимущества, связанные с этими тестами. Тесты использовались для определения умственных способностей призывников в армию. Армия США использовала Шкала интеллекта Стэнфорда – Бине проверить IQ солдат.[12]

После войны промышленность начала использовать тесты для оценки претендентов на различные должности на основе их результатов. В 1952 году был проведен первый тест Advanced Placement (AP), чтобы сократить разрыв между средними школами и колледжами.[13]

Современное использование

Образование

Тесты используются в большинстве образовательных систем. Тесты могут варьироваться от коротких неформальных вопросов, выбранных учителем, до основных тестов, на подготовку к которым ученики и учителя тратят месяцы.

Некоторые страны, такие как Великобритания и Франция, требуют, чтобы все учащиеся средних школ прошли стандартизированный тест по отдельным предметам, таким как Общий аттестат о среднем образовании (GCSE) (в Англии) и Бакалавриат соответственно как требование для получения диплома.[14] Эти тесты используются в первую очередь для оценки знаний учащегося по определенным предметам, таким как математика, естественные науки или литература. В отличие от этого, от учащихся старших классов в других странах, например в Соединенных Штатах, может не потребоваться сдавать стандартизированный тест для получения диплома. Более того, студенты в этих странах обычно сдают стандартизированные тесты только для того, чтобы подать заявку на должность в университетской программе, и, как правило, им предоставляется возможность пройти различные стандартизированные тесты, такие как ДЕЙСТВОВАТЬ или же СИДЕЛ, которые используются в первую очередь для измерения навыков мышления учащегося.[15][16] Учащиеся средней школы в США также могут брать Расширенное размещение тесты по конкретным предметам для получения кредита университетского уровня. В зависимости от политики производителя тестов или страны, администрирование стандартизированных тестов может осуществляться в большом зале, классе или центре тестирования. А наблюдатель или наблюдатель также могут присутствовать в период тестирования, чтобы давать инструкции, отвечать на вопросы или предотвращать мошенничество.

Оценки или результаты стандартизированного теста могут также использоваться университетами для определения того, следует ли зачислять студента-претендента на одну из своих академических или профессиональных программ. Например, университеты в Соединенном Королевстве принимают абитуриентов на свои программы бакалавриата, основываясь в основном или исключительно на оценках заявителя по довузовской квалификации, такой как GCE A-level или же Cambridge Pre-U.[17][18] В отличие от этого, университеты в Соединенных Штатах используют результаты теста абитуриента по тестам SAT или ACT только как один из многих критериев приема, чтобы определить, следует ли абитуриенту быть принятым на одну из своих программ бакалавриата. Другие критерии в этом случае могут включать оценки заявителя в средней школе, внеклассные занятия, личное заявление и рекомендательные письма.[19] После зачисления студенты бакалавриата в Соединенном Королевстве или Соединенных Штатах могут быть обязаны их соответствующими программами пройти комплексное обследование как требование для прохождения курсов или окончания соответствующих программ.

Некоторые страны иногда используют стандартизированные тесты для контроля качества своих учебных заведений. Например, Ни один ребенок не останется без внимания в Соединенных Штатах требует, чтобы отдельные штаты разработали систему оценивания для учащихся определенных классов. На практике эти оценки обычно представляют собой стандартизированные тесты. Затем результаты тестов учащихся определенных классов учебного заведения используются для определения статуса этого учебного заведения, т. Е. Следует ли разрешить ему продолжать работать таким же образом или получать финансирование.

Наконец, стандартные тесты иногда используются для сравнения навыков студентов из разных учебных заведений или стран. Например, Организация экономического сотрудничества и развития (ОЭСР) использует Программа международной оценки учащихся (PISA) оценить определенные навыки и знания студентов из разных стран-участниц.[20]

Лицензирование и сертификация

Некоторые руководящие органы иногда используют стандартизированные тесты, чтобы определить, разрешено ли экзаменуемому заниматься какой-либо профессией, использовать определенное название должности или претендовать на компетенцию в определенном наборе навыков. Например, от экзаменуемого, который намеревается стать юристом, обычно требуется руководящий орган, такой как правительственное агентство по лицензированию адвокатуры, чтобы он прошел экзамен на адвоката.

Иммиграция и натурализация

Стандартные тесты также используются в некоторых странах для регулирования иммиграции. Например, предполагаемые иммигранты в Австралию по закону обязаны пройти тест на гражданство в рамках процесса натурализации этой страны.[21]

Языковое тестирование в процессе натурализации

При анализе в контексте языковых текстовых сообщений в процессах натурализации идеология может быть обнаружена в двух различных, но почти связанных моментах. Один относится к конструированию и деконструированию составляющих элементов нации, составляющих их собственную идентичность, а второй имеет более ограниченное представление о понятии конкретного языка и идеологий, которые могут служить определенной цели.[22]

Уровень интеллекта

Соревнования

Иногда тесты используются в качестве инструмента для отбора участников, которые могут добиться успеха в соревнованиях, таких как спортивные соревнования. Например, серьезные фигуристы, желающие участвовать в соревнованиях по фигурному катанию в США, должны пройти официальные тесты по фигурному катанию в США только для того, чтобы пройти квалификацию.[23]

Членство в группах

Иногда группы используют тесты, чтобы выбрать людей определенного типа для присоединения к группе. Например, Mensa International это общество с высоким IQ который требует, чтобы люди набрали 98-й процентиль или выше в стандартизированном контролируемом IQ-тесте.[24]

Типы

Типы оценки включают:[25][26][27]

  • Формирующие оценки представляют собой неформальные и формальные тесты, которые проводятся в процессе обучения. Эти оценки изменяют последующую учебную деятельность, чтобы улучшить успеваемость учащихся. Они определяют сильные и слабые стороны и помогают определить области, которые требуют работы. Целью формирующего оценивания является мониторинг обучения студентов, чтобы обеспечить постоянную обратную связь, которую могут использовать преподаватели для улучшения своего обучения, а студенты - для улучшения своего обучения.[нужна цитата ]
  • Итоговые оценки оценивать компетентность в конце учебной единицы с целью определения, усвоил ли кандидат знания или навыки в соответствии с требуемым стандартом. Итоговые оценки могут охватывать несколько дней обучения или работу в течение всего семестра в таких случаях, как выпускные экзамены, или даже многолетнее обучение, в случае выпускные экзамены из средней школы, Продвинутый уровень GCE примеры или профессиональные тесты на лицензирование, такие как Экзамен на получение медицинской лицензии в США.
  • Нормативные испытания сравнить успеваемость учащегося с результатами национальной или другой «нормальной» группы. Лишь определенный процент тестируемых получит лучшие или худшие результаты. Нормативно-ориентированное обращение обычно называют оценка по кривой когда группа сравнения - это студенты в одном классе. Нормативные тесты сообщают о том, справились ли тестируемые лучше или хуже, чем у гипотетического среднего ученика, что определяется путем сравнения результатов с результатами статистически отобранной группы тестируемых, обычно одного возраста или класса, которые уже сдавали экзамены. экзамен.[нужна цитата ]
  • Критерийные тесты предназначены для измерения успеваемости учащихся по фиксированному набору критериев или стандартов обучения. Все тестируемые могут сдать, так же как и все тестируемые.
  • Оценка на основе результатов требовать от студентов решения реальных задач или создания чего-либо с использованием реальных приложений. Например, студент может продемонстрировать выпечка навыки выпечки торта и оценки результата по внешнему виду, аромату и текстуре.
  • Аутентичная оценка - это измерение достижений, которые заслуживают внимания по сравнению со стандартизованными тестами с множественным выбором. Например, подлинная оценка навыков арифметики - это выяснить, сколько будут стоить продукты для семьи на этой неделе. Это дает столько же информации о навыках сложения учащихся, сколько и тестовый вопрос, в котором задается сумма различных чисел.
  • Стандартизированные тесты все тесты проводятся и оцениваются одинаково, независимо от того, является ли это быстрый тест, созданный местным учителем, или тщательно изученный тест, который проводится миллионам людей.[28] Стандартизированные тесты часто используются в образование, профессиональная сертификация, психология (например., MMPI ), военный, и многие другие поля.
  • Нестандартизированные тесты гибки по объему и формату, а также разной сложности. Например, учитель может ходить по классу и задавать каждому ученику разные вопросы. Некоторые вопросы неизбежно будут сложнее, чем другие, и учитель может быть более строгим к ответам от лучших учеников. Нестандартизованный тест может использоваться для определения уровня знаний студентов, для мотивации студентов к учебе, для предоставления обратной связи студентам и изменить учебный план чтобы сделать его более подходящим для студентов с низким или высоким уровнем квалификации.
  • Тесты с высокими ставками это тесты, которые имеют важные последствия для каждого тестируемого, например, получение водительских прав. Тест с высокими ставками не обязательно должен быть стресс-тестом, если тестируемый уверен в успешном прохождении.[нужна цитата ]

Один тест может иметь несколько качеств. Например, экзамен на адвоката для начинающих юристов может быть нормативная, стандартизированная, итоговая оценка. Это означает, что сдают только те участники теста, которые набрали более высокие баллы, что все они прошли один и тот же тест при одинаковых обстоятельствах и были оценены по одним и тем же стандартам оценки, и что тест предназначен для определения того, насколько юридическая школа выпускники узнали достаточно, чтобы практиковать свою профессию.[нужна цитата ]

Форматы оценки

Письменные тесты

Индонезийские студенты сдают письменный тест

Письменные тесты это тесты, которые проводятся на бумаге или на компьютере (как eExam ). Тестируемый, который проходит письменный тест, может ответить на конкретные вопросы, написав или набрав текст в определенном месте теста или в отдельной форме или документе.

В некоторых тестах; где знание многих констант или технических терминов требуется для эффективного ответа на такие вопросы, как Химия или же Биология - разработчик теста может разрешить каждому участнику тестирования принести с собой шпаргалка.

Выбор разработчиком теста стиля или формата для использования при разработке письменного теста обычно является произвольным, учитывая отсутствие единого инвариантного стандарта для тестирования. Как бы то ни было, одни стили и формат тестов стали использоваться более широко, чем другие. Ниже приводится список тех форматов тестовых заданий, которые широко используются преподавателями и разработчиками тестов для создания бумажных или компьютерных тестов. В результате эти тесты могут состоять только из одного типа формата тестовых заданий (например, тест с множественным выбором, тест эссе) или могут иметь комбинацию разных форматов тестовых заданий (например, тест с заданиями с несколькими вариантами ответов и эссе). ).

Множественный выбор

В тесте, в котором элементы отформатированы как вопросы с несколькими вариантами ответов, кандидату будет предоставлено несколько заданных ответов на каждый вопрос, и кандидат должен выбрать, какой ответ или группа ответов верны. Есть две группы вопросов с несколькими вариантами ответов.[29] Первое семейство известно как вопрос «Верно / Неверно», и от экзаменуемого требуется выбрать все подходящие ответы. Вторая группа известна как вопрос с одним лучшим ответом, и для нее требуется, чтобы тестируемый ответил только на один из списка ответов.

Есть несколько причин для использования вопросов с несколькими вариантами ответов в тестах. С точки зрения администрирования, вопросы с несколькими вариантами ответов обычно требуют меньше времени для ответов тестируемого, их легко выставить и выставить оценки, они обеспечивают больший охват материала, допускают широкий диапазон трудностей и могут легко диагностировать трудности тестируемого с определенными концепции.[30] В качестве образовательного инструмента элементы с множественным выбором проверяют многие уровни обучения, а также способность тестируемого интегрировать информацию, и они предоставляют тестируемому обратную связь о том, почему отвлекающие факторы были неправы и почему правильные ответы были правильными. Тем не менее, есть трудности, связанные с использованием вопросов с несколькими вариантами ответов. С административной точки зрения, создание эффективных элементов с множественным выбором обычно занимает много времени.[30] В качестве образовательного инструмента задания с несколькими вариантами ответов не позволяют испытуемым демонстрировать знания, выходящие за рамки предоставленного выбора, и могут даже способствовать угадыванию или приближению из-за наличия хотя бы одного правильного ответа. Например, тестируемый может не понять, что , но зная, что , они выбрали бы ответ, близкий к 48. Более того, испытуемые могут неверно истолковать эти вопросы и в процессе посчитать их сложными или придирчивыми. Наконец, задания с несколькими вариантами ответов не проверяют отношение тестируемого к обучению, потому что правильные ответы легко подделать.

Альтернативный ответ

Вопросы «Верно / Неверно» предоставляют кандидатам двоичный выбор - утверждение либо верно, либо неверно. Этот метод создает проблемы, поскольку в зависимости от количества вопросов значительное количество кандидатов может получить 100% только наугад, а в среднем должно получить 50%.

Тип соответствия

Соответствующий элемент - это элемент, который предоставляет определенный термин и требует от тестируемого сопоставить идентифицирующие характеристики с правильным термином.[31]

Тип завершения

Задание с заполнением пропусков предоставляет тестируемому идентифицирующие характеристики и требует, чтобы тестируемый вспомнил правильный термин.[31] Есть два типа тестов с заполнением бланка. Более простая версия предоставляет банк возможных слов, которые заполнят пробелы. Для некоторых экзаменов все слова из банка слов используются только один раз. Если учитель хотел создать тест средней сложности, он предоставил бы тест с банком слов, но некоторые слова могут использоваться более одного раза, а другие - нет. Самая сложная разновидность такого теста - это тест с заполнением бланка, в котором вообще нет банка слов. Обычно это требует более высокого уровня понимания и памяти, чем тест с множественным выбором. Из-за этого студенты часто опасаются тестов с заполнением пропусков [без словарного запаса].

Сочинение

Такие элементы, как краткий ответ или эссе, обычно требуют, чтобы тестируемый написал ответ, чтобы выполнить требования элемента. С административной точки зрения, на создание эссе уходит меньше времени.[30] В качестве инструмента оценки эссе могут тестировать сложные учебные задачи, а также процессы, используемые для ответа на вопрос. Эти элементы также могут предоставить более реалистичную и обобщаемую задачу для тестирования. Наконец, эти задания мешают участникам теста угадывать правильные ответы и требуют от испытуемых продемонстрировать свои письменные навыки, а также правильное орфографию и грамматику.

Сложности с заданиями для сочинений носят в основном административный характер: например, тестируемым требуется достаточно времени, чтобы составить свои ответы.[30] Когда на эти вопросы даются ответы, сами ответы обычно написаны плохо, потому что у тестируемых может не быть времени на систематизацию и проверку своих ответов. В свою очередь, для того, чтобы выставить оценки или выставить оценки по этим предметам, требуется больше времени. Когда эти элементы оцениваются или оцениваются, сам процесс выставления оценок становится субъективным, поскольку информация, не связанная с тестированием, может влиять на процесс. Таким образом, требуются значительные усилия, чтобы минимизировать субъективность процесса выставления оценок. Наконец, как инструмент оценки, вопросы для сочинения потенциально могут оказаться ненадежными при оценке всего содержания предмета.

Инструкции для экзаменуемых основываются на использовании командные слова которые побуждают экзаменуемого реагировать определенным образом, например, путем описания или определения концепции, сравнения и сопоставления двух или более сценариев или событий. В Соединенном Королевстве, Ofqual ведет официальный список командных слов, объясняющих их значение.[32]

Викторины

А контрольный опрос это краткая оценка, которая может охватывать небольшой объем материала, который был дан в классе. Некоторые из них охватывают от двух до трех лекций, которые читались в течение определенного периода времени в виде раздела для чтения или определенного упражнения, в котором подводился итог наиболее важной части класса. Однако простой тест обычно не имеет большого значения, и инструкторы обычно проводят этот тип теста в качестве формирующей оценки, чтобы помочь определить, усваивает ли учащийся материал. Вдобавок, если инструктор соберет все, это может составить значительную часть итоговой оценки курса.[33]

Математические вопросы

Наиболее математика вопросы или расчетные вопросы из таких предметов, как химия, физика, или же экономика использовать стиль, который не попадает ни в одну из вышеперечисленных категорий, хотя некоторые статьи, особенно Математика документы в объединенное Королевство использовать множественный выбор. Вместо этого в большинстве вопросов по математике утверждается математическая проблема или же упражнение для этого ученик должен написать ответ от руки. Оценок ставится больше за предпринятые шаги, чем за правильный ответ. Если вопрос состоит из нескольких частей, в последующих частях могут использоваться ответы из предыдущих разделов, а оценки могут быть выставлены, если ранее использовался неправильный ответ, но был соблюден правильный метод, и был возвращен правильный ответ (с учетом неверного ввода).

Математические работы более высокого уровня могут включать варианты истинности / ложности, когда кандидату дают утверждение и просят проверить его достоверность прямым доказательством или заявлением контрпример.

Открытые тесты

Хотя тесты с закрытыми заметками не так популярны, как тесты с закрытыми записями, их популярность постепенно растет. Тест с открытой записью позволяет испытуемому вносить все свои записи и использовать их во время прохождения теста.[34] Вопросы, задаваемые на экзамене с открытой записью, обычно больше наводят на размышления и интеллектуальны, чем вопросы на экзамене с закрытой записью. Вместо того, чтобы проверять, какие факты вам известны, открытые экзамены заставляют вас применять факты к более широкому вопросу. Основное преимущество открытых тестов заключается в том, что они являются лучшей подготовкой к реальному миру, где вам не нужно запоминать и иметь все необходимое в своем распоряжении.[35]

Устные тесты

Устный тест - это тест, на который дается устный (устный) ответ. Учитель или оценщик устного теста устно задаст вопрос ученику, который затем ответит на него словами.

Тесты на физическую подготовку

Гвардеец Миннесоты выполняет отжимания во время теста на физическую подготовку.

А тест на физическую подготовку это тест, предназначенный для измерения физическая сила, ловкость, и выносливость. Обычно они работают в образовательных учреждениях в рамках физическая культура учебная программа по медицине как часть диагностического тестирования, а также в качестве квалификационных требований в областях, которые сосредоточены на физических способностях, таких как военный или же полиция. На протяжении ХХ века появлялись научные данные, демонстрирующие полезность силовые тренировки и упражнение аэробики в поддержании общего состояния здоровья, и все больше агентств начали включать стандартизированные фитнес-тесты. в Соединенные Штаты, то Президентский совет по молодежному фитнесу была создана в 1956 году как средство поощрения и контроля физической формы школьников.

Общие тесты[36][37][38] включить рассчитанный Бег или многоступенчатый фитнес-тест (широко известный как "звуковой сигнал") и количество отжимания, приседания /брюшные хрусты, и подтягивания что может выполнить человек. Для проверки способности выполнять определенную работу или роль могут использоваться более специализированные тесты. Многие тренажерные залы, частные организации и организаторы мероприятий проводят свои фитнес-тесты. Используя военные методы, разработанные британской армией, и современные тесты, такие как Illinois Agility Run и Cooper Test.[39]

Секундомер был нормой до тех пор, пока в последние годы не было доказано, что показ стрелок является неточным и непостоянным.[40] Электронный хронометраж - это новая норма, обеспечивающая точность и согласованность, а также уменьшение предвзятости.

Тесты производительности

Тест производительности - это оценка, которая требует от экзаменуемого фактически выполнить задание или действие, а не просто отвечать на вопросы, относящиеся к конкретным частям. Цель - обеспечить большее верность к тому, что тестируется.

Примером может служить тест на вождение за рулем для получения водительских прав. Вместо того, чтобы просто отвечать на простые вопросы с несколькими вариантами ответов относительно вождения автомобиля, ученик должен фактически водить его во время оценивания.

Тесты производительности обычно используются на рабочем месте и в профессиональных приложениях, таких как профессиональная сертификация и лицензирование. При использовании для отбора персонала тесты могут рассматриваться как образец работы. Примером лицензии может быть требование косметолога продемонстрировать стрижку или маникюр на живом человеке. В Групповой тест Бурдона является одним из многих психометрический тесты, которые должны пройти водители поездов-стажеров в Великобритании.[41]

Некоторые тесты производительности представляют собой моделирование. Например, оценка для получения сертификата офтальмолога включает два компонента: экзамен с несколькими вариантами ответов и компьютерное моделирование навыков. Экзаменуемый должен продемонстрировать способность выполнять семь задач, обычно выполняемых на рабочем месте, например: ретиноскопия, смоделированные на компьютере.

Препараты

С точки зрения разработчика тестов, время и усилия, необходимые для подготовки теста, сильно различаются. Аналогичным образом, с точки зрения тестируемого, существует большая вариативность в отношении времени и необходимого для получения желаемой оценки или баллов по любому заданному тесту. Когда разработчик теста создает тест, количество времени и усилий зависит от значимости самого теста, квалификации тестируемого, формата теста, размера класса, крайнего срока тестирования и опыта разработчика теста. .

Процесс построения теста был облегчен несколькими способами. Во-первых, многие разработчики тестов сами были студентами в свое время и поэтому могут изменять или напрямую использовать вопросы из своих предыдущих тестов. В некоторых странах книгоиздатели часто предоставляют учебные пакеты, включающие банки тестов, преподавателям университетов, которые принимают их опубликованные книги для своих курсов.[42] Эти банки тестов могут содержать до четырех тысяч тестовых вопросов, прошедших экспертную оценку и проверенных временем. Преподаватель, решивший использовать этот набор тестов, должен будет только выбрать фиксированное количество вопросов из этого набора тестов, чтобы составить тест.

Как и в случае с тестовыми конструкциями, время, необходимое тестируемому для подготовки к тесту, зависит от частоты тестирования, разработчика теста и значимости теста. Как правило, нестандартные тесты, которые являются короткими, частыми и не составляют основную часть общей оценки или баллов за курс экзаменуемого, не требуют от экзаменуемого тратить много времени на подготовку к тесту.[43] И наоборот, нестандартные тесты, которые являются длинными, нечастыми и действительно составляют основную часть общей оценки или баллов за курс экзаменуемого, обычно требуют, чтобы тестируемый тратил много времени на подготовку к тесту. Чтобы подготовиться к нестандартному тесту, испытуемые могут полагаться на свои справочники, конспекты лекций или занятий, Интернет и прошлый опыт. Тестируемые также могут использовать различные учебные пособия для подготовки к тестам, например: карточки и мнемоника.[44] Сдающиеся на экзамен могут даже нанять репетиторов, которые будут обучать их в процессе, чтобы повысить вероятность получения желаемой оценки или результата теста. В таких странах, как объединенное Королевство, спрос на частные уроки значительно вырос за последние годы.[45] Наконец, экзаменуемые могут полагаться на прошлые копии теста за предыдущие годы или семестры для подготовки к будущему тесту. Эти прошлые тесты могут быть предоставлены другом или группой, у которой есть копии предыдущих тестов, или инструкторами и их учреждениями, или поставщиком тестов (например, экзаменационная комиссия ) сам.[46][47]

В отличие от нестандартного теста, время, необходимое испытуемым для подготовки к стандартным тестам, менее вариабельно и обычно значительно. Это связано с тем, что стандартизированные тесты обычно едины по объему, формату и сложности и часто имеют важные последствия для будущего тестируемого, например, право тестируемого посещать определенную университетскую программу или поступать в желаемую профессию. Для тестируемых нет ничего необычного в том, чтобы подготовиться к стандартизированным тестам, полагаясь на коммерчески доступные книги, в которых подробно описывается стандартизованный тест или компиляции предыдущих тестов (например, десятилетняя серия в Сингапуре). Во многих странах участники тестирования даже записываются в центры подготовки к экзаменам или зубрить школы которые содержат подробные или дополнительные инструкции для тестируемых, чтобы помочь им лучше подготовиться к стандартному тесту. В Гонконге было высказано предположение, что преподаватели, управляющие такими центрами, сами по себе являются знаменитостями.[48] Это привело к тому, что частное обучение стало популярным выбором карьеры для новых выпускников в развитых странах.[49][50] Наконец, в некоторых странах преподаватели и их учреждения также сыграли важную роль в подготовке испытуемых к стандартному тесту.

Мошенничество

Наблюдатели может наблюдать за тестом, чтобы уменьшить методы обмана, такие как копирование

Мошенничество на тесте - это процесс использования несанкционированных средств или методов с целью получения желаемого результата теста или оценки. Это может варьироваться от внесения и использования заметок во время закрытого экзамена по книге, копирования ответа другого тестируемого или выбора ответов во время индивидуального теста, до отправки платного доверенности для прохождения теста.[51]

Для борьбы с мошенничеством использовалось несколько распространенных методов. Они включают использование нескольких наблюдателей или наблюдателей во время периода тестирования для наблюдения за участниками. Разработчики тестов могут создавать несколько вариантов одного и того же теста для одновременного проведения для разных испытуемых или писать тесты с несколькими вариантами выбора, основываясь на теории, согласно которой полностью проработанные ответы сложно имитировать.[52] В некоторых случаях инструкторы сами могут не проводить свои собственные тесты, но оставляют задачу другим инструкторам или наблюдателям, что может означать, что наблюдатели не знают кандидатов, и поэтому может потребоваться некоторая форма идентификации. Другой метод заключается в том, что если учащийся показал слишком много неудачных тестов с заданными уровнями цвета,[требуется разъяснение ] учащиеся должны снова начать работу с помощью дополнительных навыков, на этом уровне учащийся выбирает уровень цвета или получает недостающие предварительные навыки. Для этого, если ученик сдал необходимое количество тестов без уровня цвета, ученик раскрасит своим именем большую настенную таблицу, которая покажет статус всего класса.[53] Наконец, инструкторы или поставщики тестов могут сами сравнить ответы подозреваемых в мошенничестве, чтобы определить, действительно ли мошенничество имело место.

Другие типы тестов и другие связанные термины

  • обычный экзамен: экзамен по соответствующему курсу;
  • экзамен на достаточность или зачетный экзамен: экзамен, который следует сдавать как способ получения официальных зачетов от академического учреждения;
  • экзамен на повторную аттестацию или эквивалентный экзамен: оценка стоимости экзамена, ранее сданного в другом учреждении;
  • внеочередной экзамен: экзамен, который сдается после периода обычных экзаменов, соответствующих курсу.

Смотрите также

Международные экзамены

Рекомендации

  1. ^ «Определение теста». Мерриам-Вебстер.
  2. ^ Тиссен Д. и Вайнер Х. (2001). Подсчет очков. Махва, Нью-Джерси: Эрлбаум. Страница 1, предложение 1.
  3. ^ Экзамен продвинутого уровня, китайский язык и культура, работа 1A
  4. ^ Бодде, Д., Китайские идеи на Западе
  5. ^ Бодде, Дерке. «Китай: учебное пособие». Колумбийский университет.
  6. ^ (Бодде 2005)
  7. ^ Марк У. Хаддлстон, Уильям У. Бойер (1996). Высшая государственная служба в Соединенных Штатах: поиски реформы. Университет Питтсбурга Press. ISBN  9780822974734.
  8. ^ Казин, Эдвардс и Ротман (2010), 142.
  9. ^ Уокер, Дэвид (2003-07-09). "Честная игра". Хранитель. Лондон. Получено 2003-07-09.
  10. ^ Бодде, Д., Китайские идеи на Западе, стр.9
  11. ^ Дэвид Р. Рассел (2002). Письмо по академическим дисциплинам: история учебной программы. SIU Press. С. 158–159. ISBN  9780809324675.
  12. ^ Каплан, Р. М., & Саккуццо, Д. П. (2009) Психологическое тестирование Бельмонт, Калифорния: Уодсворт
  13. ^ Совет колледжа (2003). «Краткая история программы Advanced Placement» (PDF). Архивировано из оригинал (PDF) на 2009-02-05. Получено 2009-01-29.
  14. ^ «GCSE: официальное руководство по системе» (PDF). Архивировано из оригинал (PDF) на 2012-06-04.
  15. ^ «О SAT». 2016-11-28.
  16. ^ "О ACT: История". Архивировано из оригинал 8 октября 2006 г.. Получено 31 октября, 2006.Название изменено в 1996 году.
  17. ^ "Cambridge Pre-U".
  18. ^ «Международная квалификация - Оксфордский университет». Архивировано из оригинал на 22.08.2010.
  19. ^ "Прием в Гарвардский колледж".
  20. ^ "ПИЗА".
  21. ^ «Австралийское гражданство - тест на австралийское гражданство».
  22. ^ Шкифич, Саня (2012). «Языковая идеология и гражданство: сравнительный анализ языкового тестирования в процессах натурализации». Европейский журнал языковой политики. 4 (2): 217–236. Дои:10.3828 / ejlp.2012.13.
  23. ^ «Добро пожаловать в США по фигурному катанию». Архивировано из оригинал 27 июля 2010 г.
  24. ^ "Как мне присоединиться?". Mensa International.
  25. ^ Университет Карнеги Меллон
  26. ^ Схоластический
  27. ^ Эдутопия
  28. ^ Северо-Центральная региональная учебная лаборатория, NCREL.org В архиве 2008-03-05 на Wayback Machine
  29. ^ «Составление письменных тестовых вопросов для фундаментальных и клинических наук» (PDF).
  30. ^ а б c d «Типы форматов тестовых заданий».
  31. ^ а б «Тема C5 MFO: Разработка тестовых вопросов».
  32. ^ AQA, Командные слова, по состоянию на 27 декабря 2018 г.
  33. ^ Тобиас, S (1995). Преодоление математической тревожности. Нью-Йорк: W.W. Нортон и компания. п. 85 (Глава 4).
  34. ^ «Разные типы экзаменов - разные подходы». Время экзамена. 2012-02-21. Получено 2017-12-11.
  35. ^ Йоханнс, Бет; Динкенс, Эмбер; Мур, Джилл (2017-11-01). «Систематический обзор, сравнивающий экзамены по открытой и закрытой книге: оценка влияния на развитие навыков критического мышления». Обучение медсестер на практике. 27: 89–94. Дои:10.1016 / j.nepr.2017.08.018. ISSN  1471-5953. PMID  28881323.
  36. ^ «Армейские стандарты фитнеса».
  37. ^ «Фитнес-стандарты РАФ».
  38. ^ «Персональный фитнес-тест USMC (Глава 2 - Проведение PFT)» (PDF).
  39. ^ "Добро пожаловать". Fittest.live. Получено 2016-11-10.
  40. ^ Мэйхью, Джерри Л .; Хаузер, Джереми Дж .; Брайни, Бен Б.; Уильямс, Тайлер Б .; Piper, Fontaine C .; Бречу, Уильям Ф. (2010). «Сравнение ручного и электронного хронометража 40-ярдового рывка у футболистов колледжа». Журнал исследований силы и кондиционирования. 24 (2): 447–451. Дои:10.1519 / JSC.0b013e3181c08860. PMID  20072055. S2CID  35100936.
  41. ^ «Группа – инструмент Бурдона». Цифровая реальность. Архивировано из оригинал 3 января 2011 г.. Получено 2 марта 2011.
  42. ^ WEHMEIER, Николас. "Oxford University Press | Интернет-ресурсный центр | Узнайте о тестовых банках". global.oup.com. Получено 2016-12-09.
  43. ^ «Как подготовиться к викторинам и экзаменам по биохимии» (PDF). Архивировано из оригинал (PDF) 31 декабря 2010 г.
  44. ^ «Учебные стратегии». Архивировано из оригинал на 2011-10-07.
  45. ^ Уил, Салли (2016-09-07). «Резкий рост детей, получающих частные уроки». Хранитель. ISSN  0261-3077. Получено 2016-12-09.
  46. ^ "Прошедшие экзаменационные работы". Архивировано из оригинал 10 августа 2010 г.
  47. ^ «Прошлые бумаги и схемы отметок». www.aqa.org.uk. AQA. Архивировано из оригинал на 2016-12-21. Получено 2016-12-09.
  48. ^ Шарма, Йоджана (27 ноября 2012 г.). "Познакомьтесь с наставниками королей и королев'". Новости BBC. Получено 2016-12-09.
  49. ^ Ломакс, Роберт. «Как стать частным репетитором». Получено 2016-12-09.
  50. ^ Коэн, Дэниел Х. (2013-10-25). «Новый бум домашнего обучения - если вы можете платить 40 фунтов в час». Хранитель. ISSN  0261-3077. Получено 2016-12-09.
  51. ^ «Испытуемые по доверенности, сборщики предметов и читеры ... очень бойтесь». ccie-in-3-months.blogspot.co.uk. Получено 2016-12-09.
  52. ^ «Простые способы предотвратить мошенничество». TeachHUB. Получено 2016-12-09.
  53. ^ Как это сделать, Обнаружено, Предотвратить, Cizek, Gregory J. (1999). Обман на тесте. Лоуренс Эрлбаум Ассошиэйтс.CS1 maint: несколько имен: список авторов (связь)

дальнейшее чтение