До появления компьютеров вычислять коэффициент альфа вручную было утомительно, поэтому использовалась апроксимация. Вместо сложения всех заданий теста для получения общей оценки вычислялись две оценки: одна основывалась на всех нечетных заданиях теста, а другая — на всех четных. Полученные две оценки затем коррелировали между собой, и после применения формулы Спирмена—Брауна (поскольку набор четных или нечетных заданий — только половина объема полного теста) это давало надежность, полученную методом расцепления. В настоящее время, по-видимому, нет весомых оснований для ее использования.

Ретестовая надежность, иногда известная как временная стабильность, имеет совершенно другой смысл. Как следует из названия, она проверяет, в какой степени оценки черты остаются более или менее постоянными в течение времени. Большинство тестов разработано для измерения таких черт, как экстраверсия, способности к вычислениям или нейротицизм, а в определении черты подчеркивается, что это относительно устойчивая диспозиция. Последнее предполагает, что индивидуумы должны иметь похожие оценки, 'когда они тестируются в двух ситуациях (например, с интервалом в несколько недель) при условии, что:

• с ними не случилось ничего значительного в интервале между двумя тестированиями (например, не было эмоционального кризиса, изменений, обусловленных развитием, или значительного образовательного опыта, который мог бы повлиять на черту);

• тест хорошо измеряет черту.

Если при первом тестировании тест показывает, что ребенок гениален, а через месяц его интеллект оказывается на среднем уровне, то либо концепция интеллекта характеризует в большей степени состояние, а не черту, либо тест несостоятелен.

Оценка ретестовой надежности обычно включает двукратное тестирование одной и той же группы людей с интервалом по крайней мере в один месяц (чтобы минимизировать вероятность того, что испытуемые запомнят свои предыдущие ответы), но все же не слишком большим (иначе изменения, обусловленные развитием, обучением или другими жизненными событиями, могут изменить позиции индивидов по данной черте). Ретестовая надежность -это просто корреляция между двумя наборами оценок. Если она высока (означая тем самым, что индивидуумы имеют сходные уровни по черте g обоих случаях), то можно утверждать, что черта стабильна и тест, вероятно, является хорошим средством измерения черты.

Проблема, разумеется, заключается в том, что ретестовая надежность основывается на общей оценке, она ничего не говорит о том, как люди выполняют отдельные задания. В то время как коэффициент альфа показывает, измеряет ли набор заданий некоторую конкретную скрытую черту, прекрасную ретестовую надежность может иметь набор заданий, которые не имеют ничего общего между собой. Например, если вы попросили кого-то суммировать номер своего дома, размер обуви и год рождения в двух разных ситуациях, полученная статистическая характеристика будет обнаруживать впечатляющую ретестовую надежность, хотя эти три пункта не имеют между собой ничего общего.

Ради полноты картины теперь следует упомянуть надежность параллельных форм. Конструкторы тестов иногда создают из набоpa заданий несколько тестов. Чтобы создать две параллельные формы теста, задания предъявляются большой выборке испытуемых и подбираются пары заданий со сходным содержанием и уровнем трудности. Например, обе формы теста могут включать задание решить анаграмму из семи букв, и в обоих случаях ответом будут слова, одинаково часто встречающиеся в языке, и только около 25% выборки будут способны решить каждую из них. Одно задание будет затем включено в форму А теста, а другое — в форму Б. Эти два теста продаются отдельно, и (теоретически) несущественно, какой из них будет использоваться в определенных целях, поскольку обычно предпринимаются специальные усилия, гарантирующие, что эти две версии дают одинаковое распределение оценок (и благодаря этому позволяют использовать одни и те же таблицы норм для обеих форм теста). Если оба теста измеряют одну и ту же черту, следует ожидать высокой положительной корреляции между оценками индивидуумов по двум формам теста. Эта корреляция известна как надежность параллельных форм. Однако, поскольку параллельные формы имеют относительно немногие тесты, она используется редко.

Страницы: 1 2

Смотрите также

Использование корреляций
Принимая во внимание подводные камни интерпретации корреляций, а также тот факт, что желаемые выводы о причинах и следствиях могут быть сделаны только на основании настоящих экспериментов с управл ...

Проблема создания эквивалентных групп
Есть два основных способа создания эквивалентных групп для проведения меж-субъектных экспериментов. В идеальном случае используется случайное распределение, второй способ — уравнивание. ...

Многомерный анализ
Двумерный анализ направлен на исследование взаимосвязей .между любыми двумя переменными. С помощью многомерного анализа изучаются взаимосвязи более чем двух переменных (часто количество переменных ...