В целом измерение характеристик поведения считается надежным, если его результаты повторяются при повторном измерении. Скорость реакции является хорошим примером — высокая надежность была одной из причин многолетней популярности таких измерений. Человек, при первой попытке реагирующий на красный сигнал через 0,18 секунды, наверняка покажет ту же скорость при следующих попытках, и практически все попытки будут давать результаты, близкие к 0,18 секунды. К примеру, оценки теста GRE {Graduate Record Exam) также относительно надежны. Человек, получивший 850 за общий тест GRE, во второй раз, скорее всего, получит сходную оценку, и очень маловероятно, что его балл будет 1350.

Из этих двух примеров можно понять, почему надежность измерений настолько важна. Без нее невозможно было бы определить, что означают оценки, полученные при конкретном измерении. Предположим, измеряя скорость реакции, вы хотите узнать, насколько быстро реагирует конкретный человек. Если это время станет сильно изменяться от попытки к попытке, то на данный вопрос ответить будет невозможно. Аналогично, если разница в оценках теста GREдля одного человека может составлять 400 или 500 баллов, вузы не смогут использовать результаты этого теста, так как по ним нельзя будет предположить действительный уровень знаний студента.

Надежность измерения характеристик поведения — это функция от количества ошибок измерения. Если ошибок много — надежность низкая, и наоборот. Ни одно подобное измерение не является абсолютно надежным, так как все они содержат некоторое количество ошибок. Это означает, что результат измерения представляет собой гипотетическую истинную оценку плюс ошибку измерения. В идеале ошибка измерения настолько мала, что полученная оценка близка к истинной.

Процедура измерения скорости реакции хорошо иллюстрирует, что такое ошибка измерения и как она влияет на надежность. Как и в предыдущем примере, предположим, что скорость реакции человека составила 0,18 секунды. Является ли это истинным значением измеренной скорости? Нет, как несложно заключить из следующих результатов, полученных при измерении скорости реакции у того же человека:

0,16с, 0,15 с, 0,19 с, 0,17 с, 0,19 с.

Результаты различаются, потому что каждая из попыток не обошлась без ошибки измерения. Эта ошибка вызвана различными факторами — некоторые из них действуют случайным образом от попытки к попытке. Например, при одной из попыток человек может реагировать быстрее, чем предполагает истинное значение, если будет ожидать появления стимула, или медленнее из-за кратковременного снижения внимания. Также может возникнуть систематическая ошибка, если, к примеру, перед тем, как предъявить стимул, экспериментатор дает участнику сигнал приготовиться, а время между этим сигналом и стимулом остается постоянным. В этом случае участник начнет предугадывать стимул и скорость реакции будет систематически выше, чем истинная оценка.

Несмотря на небольшую ошибку измерений, приведенные выше оценки неплохо соответствуют друг другу и измерение скорости реакции в этом случае будет считаться более надежным, чем при следующем наборе оценок, полученном вслед за результатом 0,18 секунды:

0,11с, 0,25 с, 0,19 с, 0,09 с, 0,31с.

При результатах, варьирующихся от одной десятой секунды до одной третьей, очень трудно установить действительную скорость реакции человека.

Если оценки надежны, то исследователь может в зависимости от их значений приписать им некоторый смысл. Надежность также позволяет исследователю делать более осмысленные сравнения одних оценок с другими. Например, сравнение первого набора оценок (0,16 с, 0,15 с и т. д.) с нижеследующим обнаруживает разницу в общей скорости реакции:

0,23 с, 0,26 с, 0,21с, 0,22 с, 0,24 с.

Очевидно, что второй испытуемый реагировал медленнее, чем первый.

Есть разные способы вычисления надежности, но в экспериментальных исследованиях это редко проделывают. Уверенность в надежности измерений вырабатывается со временем в результате процесса их повторения. Например, процедура вырабатывания привыкания и измерение скорости реакции проводились достаточно часто и приносили весьма непротиворечивые результаты, так что исследователи убедились в их надежности.

Надежность вычисляется более строго в исследова

Страницы: 1 2

Смотрите также

Спам раздражает
Спам раздражает. Спамеров ненавидят все интернет-пользователи, которым приходит в день по 20-80 писем с предложением купить пилюли, вызвать грузчиков или пройти курс английского языка. Про спамеров ...

Основные черты экспериментальных исследований
Со времен Вудвортса психологи рассматривают эксперимент как упорядоченное исследование, в ходе которого исследователь непосредственно изменяет некий фактор (или факторы), поддерживает остальные не ...

Причины использования планов с малым N
Несмотря на популярность в современной психологии планов с большим N, исследования с одним или несколькими испытуемыми внесли и продолжают вносить важный вклад в развитие знаний о поведении. Как в ...