Другие подходы к измерению надежности

До появления компьютеров вычислять коэффициент альфа вручную было утомительно, поэтому использовалась апроксимация. Вместо сложения всех заданий теста для получения общей оценки вычислялись две оценки: одна основывалась на всех нечетных заданиях теста, а другая — на всех четных. Полученные две оценки затем коррелировали между собой, и после применения формулы Спирмена—Брауна (поскольку набор четных или нечетных заданий — только половина объема полного теста) это давало надежность, полученную методом расцепления. В настоящее время, по-видимому, нет весомых оснований для ее использования.

Ретестовая надежность, иногда известная как временная стабильность, имеет совершенно другой смысл. Как следует из названия, она проверяет, в какой степени оценки черты остаются более или менее постоянными в течение времени. Большинство тестов разработано для измерения таких черт, как экстраверсия, способности к вычислениям или нейротицизм, а в определении черты подчеркивается, что это относительно устойчивая диспозиция. Последнее предполагает, что индивидуумы должны иметь похожие оценки, 'когда они тестируются в двух ситуациях (например, с интервалом в несколько недель) при условии, что:

• с ними не случилось ничего значительного в интервале между двумя тестированиями (например, не было эмоционального кризиса, изменений, обусловленных развитием, или значительного образовательного опыта, который мог бы повлиять на черту);

• тест хорошо измеряет черту.

Если при первом тестировании тест показывает, что ребенок гениален, а через месяц его интеллект оказывается на среднем уровне, то либо концепция интеллекта характеризует в большей степени состояние, а не черту, либо тест несостоятелен.

Оценка ретестовой надежности обычно включает двукратное тестирование одной и той же группы людей с интервалом по крайней мере в один месяц (чтобы минимизировать вероятность того, что испытуемые запомнят свои предыдущие ответы), но все же не слишком большим (иначе изменения, обусловленные развитием, обучением или другими жизненными событиями, могут изменить позиции индивидов по данной черте). Ретестовая надежность -это просто корреляция между двумя наборами оценок. Если она высока (означая тем самым, что индивидуумы имеют сходные уровни по черте g обоих случаях), то можно утверждать, что черта стабильна и тест, вероятно, является хорошим средством измерения черты.

Проблема, разумеется, заключается в том, что ретестовая надежность основывается на общей оценке, она ничего не говорит о том, как люди выполняют отдельные задания. В то время как коэффициент альфа показывает, измеряет ли набор заданий некоторую конкретную скрытую черту, прекрасную ретестовую надежность может иметь набор заданий, которые не имеют ничего общего между собой. Например, если вы попросили кого-то суммировать номер своего дома, размер обуви и год рождения в двух разных ситуациях, полученная статистическая характеристика будет обнаруживать впечатляющую ретестовую надежность, хотя эти три пункта не имеют между собой ничего общего.

Ради полноты картины теперь следует упомянуть надежность параллельных форм. Конструкторы тестов иногда создают из набоpa заданий несколько тестов. Чтобы создать две параллельные формы теста, задания предъявляются большой выборке испытуемых и подбираются пары заданий со сходным содержанием и уровнем трудности. Например, обе формы теста могут включать задание решить анаграмму из семи букв, и в обоих случаях ответом будут слова, одинаково часто встречающиеся в языке, и только около 25% выборки будут способны решить каждую из них. Одно задание будет затем включено в форму А теста, а другое — в форму Б. Эти два теста продаются отдельно, и (теоретически) несущественно, какой из них будет использоваться в определенных целях, поскольку обычно предпринимаются специальные усилия, гарантирующие, что эти две версии дают одинаковое распределение оценок (и благодаря этому позволяют использовать одни и те же таблицы норм для обеих форм теста). Если оба теста измеряют одну и ту же черту, следует ожидать высокой положительной корреляции между оценками индивидуумов по двум формам теста. Эта корреляция известна как надежность параллельных форм. Однако, поскольку параллельные формы имеют относительно немногие тесты, она используется редко.

Страницы: 1 2

Смотрите также

Основные черты экспериментальных исследований
Со времен Вудвортса психологи рассматривают эксперимент как упорядоченное исследование, в ходе которого исследователь непосредственно изменяет некий фактор (или факторы), поддерживает остальные не ...

Особенности научного мышления в психологии
Способ мышления, характерный для ученых в целом и исследователей-психологов в частности, имеет определенные особенности. Во-первых, исследователи полагают, что явления действительности, в том числ ...

Психоаналитическая теория Фрейда
Теория Зигмунда Фрейда включена в эту книгу по нескольким причинам. Это была одна из самых первых четко сформулированных современных теорий личности, и она все еще сохраняет влияние в ряде дисциплин ...

PsyhologToday.Ru

Другие подходы к измерению надежности

Смотрите также

Разделы