Второй метод обнаружения внутренних смещений базируется на принципах теории сложности заданий, обсуждаемой в главе 16. Предположим, что параметры задания устанавливаются по каждому из них отдельно для испытуемых-мужчин и испытуемых-женщин и наносятся на график в виде характеристической кривой задания (ХКЗ). Если задание не обнаруживает смещений, устанавливаемые параметры способностей, дискриминации и угадывания должны быть в конечном счете идентичны для мужской и женской выборок. Другими словами, две характеристические кривые задания должны точно совпадать друг с другом. Очевидно, что совсем не тот случай изображен на рис. 17.2. Здесь задания, по-видимому, оказались значительно более легкими для женщин, чем для мужчин, особенно в случаях, когда способности индивидуумов находятся в интервале от —1 до 3. Чтобы количественно оценить смещение параметров задания, могут быть использованы такие статистики, как площадь между двумя характеристическими кривыми. Все это оказывается несколько более сложным, чем кажется вначале (поскольку целесообразно учитывать точность, с которой оцениваются параметры задания, т.к. от нее зависит надежность утверждений, что оно имеет смещение). Другая проблема возникает при использовании трехпараметрической модели. Величина параметра «с» (параметр «угадывание», или «псевдослучайность», определяющий значение, при котором график выравнивается в левой части) в действительности должна быть одинаковой в обеих группах, в противном случае площадь между двумя графиками становится неопределяемой (Raju, 1988). Преимущество исследования смещений таким способом состоит в том, что можно выделить весьма слабые эффекты.

Рис. 17.2. Характеристические кривые, демонстрирующие параметры одного и того же задания теста у мужчин и женщин.

Задание для самопроверки 17.3

Как бы вы интерпретировали вариант смещения, показанный на характеристической кривой задания, представленной на рис. 17.3?

Я считаю, что целесообразно рассматривать внутренние (присущие самому заданию) смещения во всех случаях разработки и использования теста. Представим себе, например, что тест, состоящий из 40 заданий, включал 20 заданий, которые были намного легче для женщин, чем для мужчин, и 20 заданий, которые были намного легче для мужчин, чем для женщин. Если просто искать значимые различия в общих оценках двух групп, вполне возможно, что ничего не будет обнаружено, поскольку задания, трудные для мужчин, являются легкими для женщин, и наоборот.

Рис. 17.3. Характеристическая кривая задания, демонстрирующая сравнительно более сложный вариант смешения.

Таким образом, тест вполне может быть насыщен заданиями, содержащими смещения, но анализ групповых различий или регрессионный анализ будет при этом оценивать шкалу в целом как вполне удовлетворительную (см. рис. 17.1). Только обращаясь к уровню отдельных заданий, можно действительно увидеть, что происходит, и выделить задания, которые, вероятно, было бы полезно удалить из шкалы.

Что бы ни говорили инструкции к тестам, люди делают весьма странные вещи при выполнении личностных тестов. Если бы вы взяли шкалы Айзенка и Уилсона, то могли бы получить подтверждение этому. Эти характеристики известны как «смещения ответа», или «установки на ответ», поскольку они описывают способы, которыми индивидуумы склонны решать оценочные задания. Например, хорошо известно, что люди с большей вероятностью склонны соглашаться с утверждениями, чем не соглашаться с ними, — это в полном объеме эксплуатируется недобросовестными исследователями рынка. Представим себе, что тщательно отобранной выборке из людей вы задали вопрос: «Намереваетесь ли вы голосовать за существующее правительство на следующих выборах?» — и обнаружили, что 55% ответили положительно. Затем другой выборке вы задали вопрос: «Намереваетесь ли вы голосовать за одну из оппозиционных партий на следующих выборах?» Вы можете наивно полагать на основе первого опроса, что около 100 — 55 = 45% людей дадут положительный ответ. В действительности пропорция, вероятно, будет значительно выше, просто потому, что люди более склонны говорить «да», чем «нет», независимо от того, какой вопрос им задан (Cronbach, 1946). Это называется установкой на молчаливое согласие.

Страницы: 1 2 3 4

Смотрите также

Причины использования планов с малым N
Несмотря на популярность в современной психологии планов с большим N, исследования с одним или несколькими испытуемыми внесли и продолжают вносить важный вклад в развитие знаний о поведении. Как в ...

Валидность экспериментальных исследований
В главе 4 было введено понятие валидности в применении к измерениям. Этот термин также применяется к эксперименту в целом. Так же как измерение считается валидным, если измеряется именно то, что п ...

Квазиэкспериментальные планы
Строго говоря, «настоящие» экспериментальные исследования проводятся с использованием управляемых независимых переменных и либо эквивалентных групп в случае межсубъектных планов, либо позиционного ...