Конструктная валидность

Один из полезных способов проверки того, действительно ли тест измеряет то, что он должен измерить, — проведение продуманных экспериментов. Представим себе, что тест предназначен для измерения тревожности студентов университетов Великобритании. Как можно проверить его валидность с помощью эксперимента?

Первый подход, иногда называемый «конвергентная валиди-зация», состоит в том, чтобы проверить, связаны ли тестовые оценки с другими показателями, как ожидается. Например, если в арсенале методик имеются другие широко используемые тесты тревоги, группе студентов могут быть предъявлены оба теста и полученные ряды оценок подвергнуты корреляционному анализу. Высокая положительная корреляция дала бы основание полагать, что новая шкала валидна.

С другой стороны, группе студентов, заявляющих о том, что у них есть фобия по отношению к паукам, можно было бы предъявить этот тест перед и после показа им тарантула. Если их оценки увеличатся, это может означать, что тест действительно измеряет тревогу. Основная цель таких приемов конвергентной валидизации состоит в том, чтобы определить, будут ли оценки теста варьировать в соответствии с теоретическими ожиданиями. К сожалению, неудачные попытки установить ожидаемые связи могут быть обусловлены некоторыми проблемами либо с самим тестом, либо с другими средствами измерения. Например, другой тест тревоги может быть не валиден или некоторые из индивидуумов, заявляющие, что они боятся пауков, на самом деле могут и не испытывать такого чувства. Однако если оценки теста действительно варьируют в соответствии с теорией, вывод о том, что тест валиден, представляется разумным.

Второй подход — исследование «дивергентной валидности» — устанавливает, что тест не измеряет никакой черты, с которой он теоретически не должен быть связан. Например, в литературе утверждается, что тревога не связана с интеллектом, социально-экономическим статусом, социальной желательностью и т.д. Поэтому если тест, направленный на измерение тревоги, на самом деле обнаружил высокую корреляцию с любой из этих переменных, должны возникнуть сомнения в том, действительно ли он измеряет тревогу в целом.

Прогностическая валидность

Психологические тесты очень часто используются для прогноза поведения, и их успех в этом известен как прогностическая валидность. Например, тест может быть дан подросткам с целью предсказать, кто из них будет страдать шизофренией в дальнейшей жизни, или психологический тест может быть использован для отбора наиболее перспективного кандидата на должность продавца — тест будет обладать прогностической валидностью, если с его помощью можно показать, что люди с более высокими тестовыми оценками будут иметь больший объем продаж. Этот процесс производит впечатление очень простой, прямолинейной процедуры, но на практике таковой не является.

Первая проблема заключается в природе критериев, по которым проводится оценка теста. Хотя постановка диагноза шизофрении или определение объема продаж достигается достаточно прямыми способами, для характеристики многих видов деятельности одного критерия недостаточно. Работа университетского преподавателя иллюстрирует это положение. Моя работа включает преподавание, администрирование и исследование, наблюдение за аспирантами, обеспечение неформальной помощи по вопросам статистики и программирования, поддержку и ободрение студентов и т.д. — перечень достаточно длинный. При этом совсем не ясно, как можно оценить большинство этих видов деятельности или определить их относительную важность. В других случаях (например, когда управляющие ранжируют работников) разные эксперты могут пользоваться абсолютно разными эталонами.

Вторая прблема известна как «ограничение диапазона». Система отбора обычно состоит из нескольких стадий: например, первичное психометрическое тестирование уменьшает число соискателей, доводя его до контролируемых пропорций, за ним следует собеседование и более детальная психологическая оценка индивидуумов, которые прошли через первую стадию. В конечном счете все соискатели, получающие назначение, будут иметь похожие (высокие) оценки по тестам отсеивания (иначе они были бы отвергнуты перед стадией собеседования), и, таким образом, диапазон оценок в группе отобранных индивидуумов окажется намного меньше, чем в общей популяции. Последнее создаст проблемы для любой попытки валидизировать скрининговый тест, поскольку этот ограниченный диапазон способностей будет уменьшать корреляцию между тестом и любым критерием. Имеются способы решения данной проблемы (см.: Dobson, 1988; он предлагает одно из лучших решений), но эти два примера показывают, насколько трудно установить прогностическую валидность теста.

Задание для самопроверки 133

Страницы: 1 2 3

Смотрите также

Этические принципы исследований с участием людей
В 1960-х гг. один из принципов первого кодекса был переработан в отдельный кодекс этики исследований с участием людей. Комитет РА, созданный по образцу комитета Хоббса и возглавляемый его бывшим у ...

Обзор литературы
Исследовательские проекты не разрабатываются в вакууме. Психологи, вовлеченные в программу исследований, прекрасно осведомлены не только о работе своей собственной лаборатории, но также и об анало ...

Планы с контрольными группами
Понятие об экспериментальных и контрольных группах, а также о различиях между ними было дано в главе 5. Экспериментальные группы подвергаются определенному воздействию, а контрольные — не подверга ...