Надёжность психологического теста

Типы валидности тестов. ВВЕДЕНИЕ

Достоверность психодиагностического измерения определяется валидностью (соответствием тестовых данных измеряемому свойству), надежностью и прогностичностью применяемых психологических методик.

Валидность теста — понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает. Характеристика психодиагностической методики как валидной свидетельствует о ее соответствии и пригодности для оценивания именно того психологического качества, для которого она предназначается.

Когда говорят о степени валидности, рассматривается то, насколько результаты исследования соответствуют поставленным задачам (однако при этом валидность не измеряется в каких-либо условных единицах).

Характеристика валидности методики включает в себя не только сведения о том, что данная методика на самом деле измеряет, но также информацию об условиях, о сфере ее применения.

Валидность считается фундаментальным понятием экспериментальной психологии и психодиагностики. Выражение валидности в общих терминах наименования принципиально невозможно, так как ни один тест нельзя охарактеризовать высоким или низким уровнем валидности абстрактно, не учитывая его конкретной целенаправленности. На деле между наименованием теста и его практическим назначением нередко существует несоответствие.

Валидность теста должна определяться только относительно его специального использования. Шнейдер Л.Б. Основы экспериментальной психологии. М.: Изда-тельство «МПСИ», 2011. — 376 с.

Так почему опасны психологические тесты?

Вернемся к тезису статьи. Я утверждал что тесты опасны. Да, это так

Как скальпель в руках специалиста — инструмент спасения жизни, так он же в руках неумехи — просто острый кусок железа, которым можно серьезно повредить что-нибудь жизненно важное

Назовем тест, результаты которого не заинтересуют ни одного нормального психодиагноста, плохим тестом. Это может значить что сам тест хороший, но применялся неправильно. Но для краткости — плохой.

Итак, результат плохого теста может быть воспринят субъективно как отрицательный. Например, он покажет что испытуемый — неудачник. Если испытуемый склонен сильно верить этому тесту, это может нанести психологический вред. Идентифицируя себя с неудачником (тест же показал!) человек может изменить свою жизнь в худшую сторону. Психолог знает что результат теста не говорит о том «хорошо все или плохо», он просто показывает. Как стрелка на спидометре. Когда психолога рядом нет, человек воспринимает показания теста как «хорошие» или «плохие». У этого есть негативные последствия.
Результат плохого теста может быть не воспринят как достоверный. Это, в общем, правильно. Человек получил плохой результат и отверг его. Но вместе с этим результатом он отправляет в мусорную корзину результаты грамотно проведенных тестов. И сами эти тесты. Теперь он не верит в психологические тесты вообще. И в психологию, кстати — тоже. Вред тут не очевиден, но это будет тормозящим фактором, который может помешать человеку обратиться к психологу тогда, когда это ему потребуется. Человек будет страдть, отвергая помощь.
Ну и последнее. Оно, вообще говоря, относится не только к плохим, но и к хорошим тестам в руках плохих психологов. Психологический тест всегда поставит человека в какие-то определенные рамки и даст ему характеристику, оценку. Он теперь не просто человек, а сангвиник, склонный к вербальному выражению агрессии и обладающий выраженной способностью к эмпатии. С одной стороны, это дает ему какие-то знания о себе (зачем они ему, кстати?), но с другой — делает пленником этих определений.

Он может теперь надеть личину сангвиника и вести себя как подобает сангвинику (а не Пете Иванову), он может использовать их как щит: «Я же склонен к вербальной агрессии, могу обзываться сколько хочу, такой уж я!». Заключения теста могут не давать человеку видеть изменений в себе. Он, может, уже закрылся, но все еще считает себя способным к эмпатии.

Надёжность психологического теста

Женский тест на отношения

1. Кого вы в первую очередь попросите помочь в хозяйственных делах?

Соседа или папу

Своего любимого

Я все сделаю сама

2. Вы можете рассчитывать на финансовую помощь от мужчины в трудную минуту?

Да

Сомневаюсь

Нет

3. Если попросите прибить полку или починить кран, то он…

Точно откажется

Обязательно поможет

Даст денег, чтобы оплатить работу мастера

4. Если в квартире потекла труба, мужчина…

Быстро приедет даже среди ночи

Подскажет, как устранить потоп, а починит, когда будет время

Посочувствует, но помочь не сможет

5. Как часто вам нужно напоминать любимому о данном обещании, прежде чем оно будет исполнено?

Максимум пару раз

Раз 10 минимум

Даже если постоянно напоминать не факт, что он сделает

6. Если вы в гостях или на вечеринке почувствуете себя плохо, то ваш спутник…

Сразу отвезет меня домой и будет заботиться, пока не станет лучше

Отправит меня домой, а сам останется

Сделает вид, что ничего не случилось и продолжит веселиться

7. Мужчина помнит все важные для вас даты?

Да

Большинство

Нет

8. Если парень дал обещание, а после этого вы слегка повздорили, то…

Он не будет делать то, что пообещал

Он все равно сделает все что собирался

Все зависит от обстоятельств

9. Как отреагирует мужчина, если ему расскажут пикантную историю из вашего прошлого?

Поддержит или успокоит

Потребует обещание, что такого не повторится

Обидится или даже расстанется со мной

10. Если мужчине кто-то скажет, что вы ему изменяете, то он…

Точно не поверит

Может поверить

Скорее всего поверит

Спонсор плагина: Тесты для девочек

Стандартизация и требования к использованию тестов

Надёжность психологического теста

Если перевести тест на другой язык — будет ли он работать так же хорошо? Ученые пробовали и однозначно отвечают — нет, не будет. Разница в языке и культуре очень значительна. Для того чтобы он заработал так же, как оригинал, нужно провести все те процедуры, что проводил Ученый, подгоняя надежность и валидность и бесконечно изменяя тест и проверяя его на больших выборках. То есть, фактически создать его заново.

Именно так. Просто переведя вопросы, вы превратите микроскоп в кучу мусора.

Пойдем дальше. Влияет ли бланк, на котором даются вопросы на точность теста? Ученые пробовали, изучали и точно отвечают — да, влияет. Влияет не только бланк с вопросами и ответами, но обстановка в комнате, процедура проведения теста. Проводится ли он один на один? Остается ли тестируемый в одиночестве с опросником? Может, тест дается группе респондентов? Читались ли психологом инструкции? Отвечал ли психолог на вопросы, возникающие у испытуемых? А как он отвечал?

Все это крайне важно и абсолютно точно — влияет на точность теста. Итак, тест — это мощный инструмент, но чтобы просто им пользоваться, нужно учиться

Причем долго. На западе нужно получать лицензию для использования каждого (!), теста. Отучившись год для использования опросника Кеттела, психолог будет использовать его везде. И подтрунивать над коллегами за то, что они не имеют права его использовать потому что не умеют. Более того, опросник Кеттела они нигде не достанут! Потому что продается он только в специальном магазине по лицензии. И стоит дорого

Итак, тест — это мощный инструмент, но чтобы просто им пользоваться, нужно учиться. Причем долго. На западе нужно получать лицензию для использования каждого (!), теста. Отучившись год для использования опросника Кеттела, психолог будет использовать его везде. И подтрунивать над коллегами за то, что они не имеют права его использовать потому что не умеют. Более того, опросник Кеттела они нигде не достанут! Потому что продается он только в специальном магазине по лицензии. И стоит дорого.

Тест — это не просто инструкция в два предложения и список вопросов с ключом. Это книга! В которой описано все. Зачем создавался тест? Что он измеряет? На ком его можно использовать? Когда? Какие редакции существуют? В чем отличия? Какова валидность теста (в процентах)?

Инструкция — это не просто несколько предложений. Там расписано все. В плоть до пауз между словами и уровня громкости произнесения некоторых фраз. Инструкция зачитывается с листа, либо заучивается наизусть! В противном случае данные теста будут настолько ненадежны, что проще их выбросить.

Эффект Барнума

Надёжность психологического теста Тейлор Барнум

Вот выдержка из википедии:

Вы только что ответили на кучу вопросов личного характера и подсчитали какие-то баллы. Практически, совершили научные манипуляции по инструкциям, созданным (как хочется думать) большими учеными. Ну конечно полученный результат характеризует исключительно вас! Эффект Барнума в действии.

Этот эффект будет работать для чего угодно. И это неоднократно проверено. Впервые это было доказано в эксперименте Форера.

«Женщины по имени Маша легки на подъем и просты в общении. Но могут постоять за себя когда нужно. Они любят доверять людям. Иногда они грустят, не прочь пожалеть себя-родимую, но в общем жизнерадостны и приветливы. Из них получаются хорошие жены.»

Здесь привязка к вам идет по имени и полу. Остальное — набор ничего не значащих общих характеристик, которые подходят практически кому угодно. Если вы — женщина и вас зовут Маша, вы будете более склонны определять данное описание как подходящее вам.

Но ведь тесты работают!

Воскликнете, возможно, вы. «А как вы это поняли?» — Спрошу я. Скорее всего, вы, получив результат теста и посмотрев его расшифровку в приложении, сопоставили ее с собой. Там написано что-нибудь, что характеризует вашу личность. Вы читаете это и понимаете что это про вас. Ну или почти про вас, но довольно точно. Ишь ты! Не соблюли все эти бюрократические процедуры, а тест-то работает!

Нет, не работает. Это просто ваша оценка себя.

Если бы каждый человек мог себя адекватно оценить (желательно в цифрах), то психологические тесты были бы не нужны.

Расскажу вам о еще одной забавной вещи. Она известна как Эффект Барнума. А в народе — эффект гороскопов.

Соотношение валидности и надежности. Валидность и надежность измерения

Проблема достоверности полученных эмпирических данных и выводов, истинности теории остро стоит в любой отрасли науки. Есть она и в социологии. Как отличить научную теорию от вымысла? Как построить программу исследования, чтобы его результаты можно было использовать в науке?

Самый эффективный инструмент — установить валидность и надежность своего измерительного инструмента и программы исследования в целом.

В социологии валидность понимают довольно широко — как достоверность, истинность, адекватность, правдоподобность, устойчивость данных измерения, но чаще всего — как обоснованность. К примеру, доказать валидность теории значит обосновать ее правдоподобность. Измерение (анкетный вопрос, серия вопросов, тест) считается валидным, если с его помощью было зафиксировано то понятие или свойство, которое запланировано к измерению.

Валидность. Мы нс так уж часто имеем возможность непосредственно измерить понятия, используемые в социологических теориях. Такие понятия, как власть, демократия и представительство, не так просто представить количественно, как понятия типа длины и веса. Нам приходится пользоваться показателями, лишь косвенно соответствующими понятиям, которые они представляют. А в таком случае всегда существует опасность, что выбранные показатели будут неадекватно отражать понятия, которые мы хотим с их помощью измерять. Для обозначения степени соответствия измерений понятиям, кото-

рые эти измерения должны отражать, используется термин валидность. Интересоваться валидностью измерения — то же самое, что интересоваться, действительно ли с помощью данного измерения мы измеряем то, что предполагали. Обеспечение валидности часто считается основной проблемой, связанной с измерением в социальных науках.

Чтобы быть валидным, измерение должно быть исчерпывающим и полным. Если, например, мы сравниваем качество коммунальных служб в разных городах, у нас может возникнуть искушение считать показателем качества системы образования количество преподавателей в школах. Это — неуместное измерение, поскольку количество работающих в системе школьного образования в значительной степени определяется количеством учащихся и размерами города и может иметь мало общего с качеством образования. Если за показатель качества системы образования принять отношение количества учащихся к количеству учителей, мы получим более уместное измерение, так что различия, вызванные размерами города, уменьшатся или вообще исчезнут. Тем не менее измерение все еще останется недостаточным. Образование — это не только преподаватели. Образование — это также школьные задания, фильмы, книги, учебные пособия и множество других факторов. Рассмотрение каждого из этих факторов в отрыве от остальных может создать неверное впечатление о качестве системы образования. Система школьного образования может иметь в высшей степени благоприятное соотношение учащихся и преподавателей, однако недостаточное количество средств обучения и учебных материалов. Было бы ошибкой утверждать, что эта система школьного образования не отличается от системы с таким же соотношением учащихся и преподавателей и прекрасными средствами обучения и учебными материалами. Если мы стремимся к валидности, мы должны попытаться выбрать такие измерения, которые были бы и уместными, и полными.

См. также

Помимо надежности тестов, есть также надежность наблюдения — межнаблюдательская надежность. МН — это процент совпадения результатов наблюдения экспертов друг с другом.
Анализ надёжности
Item Response Theory

Надежность и валидность

Надежность показывает, что результаты проводимого исследования близки к истине, а валидность показывает, что результаты действительно относятся к тому явлению, которое изучается исследователем. Валидное исследование автоматически является надежным, однако обратное следствие не обязательно. Надежное исследование может и не быть валидным.

Надежность валидность стандартизация тестов. Стандартизация, надежность и валидность теста

Рассмотрим понятия стандартизации, надежности и валидности теста с позиций классической эмпирико-статистической теории. В соответствии с этой теорией конструирование тестов для изменения психологических свойств и состояний основано на шкале интервалов. Измеряемое психическое свойство считается линейным и одномерным. Предполагается также, что распределение совокупности людей, обладающих данным свойством, описывается кривой нормального распределения. В основе психологического тестирования лежит классическая теория погрешности измерений. Считается, что тест – такой же измерительный прибор, как любой физический прибор, и результаты, которые он показывает, зависят от величины свойства у испытуемого, а также от самой процедуры измерения. Любое свойство психики имеет «истинный» показатель, а показания по тесту отклоняются от истинного на величину случайной погрешности. На показания теста влияет и «систематическая» погрешность, но она сводится к прибавлению (вычитанию) константы к «истинной» величине параметра, что для интервальной шкалы значения не имеет. Надежность теста. Если тест проводить много раз, то среднее значение будет характеристикой «истинной» величины параметра. Под надежностью теста принято понимать устойчивость результатов к воздействию случайных факторов, внешних и внутренних. Наиболее часто проводится оценка ретестовой надежности. Чем теснее коррелируют результаты начального и повторного (обычно отсроченного на несколько месяцев) проведения теста, тем он надежнее. Предполагается, что существует неограниченное количество заданий, которые могут «работать» на измеряемое свойство. Тест есть лишь выборка заданий из их генеральной совокупности. В идеале можно создать сколько угодно эквивалентных форм теста, поэтому определение надежности теста можно провести путем корреляции параллельных форм или эквивалентных равных частей, полученных путем расщепления тестового задания на две части. Поскольку в реальном тесте число заданий ограничено (не более 100), то оценка надежности теста всегда приблизительна. Тест считается надежным, если коэффициент корреляции результатов составляет не менее 0,75. Валидность теста. Проблеме валидности в классической теории теста уделяется много внимания, однако теоретически она никак не решается. Валидность означает пригодность теста измерять то свойство, для измерения которого он предназначен. Следовательно, чем больше на результат выполнения теста или отдельного задания влияет измеряемое свойство и чем меньше другие переменные (в том числе внешние), тем тест валиднее. Тест валиден (и надежен), если на его результаты влияет лишь измеряемое свойство. Тест невалиден (и ненадежен), если результаты тестирования определяются влиянием нерелевантных переменных. Существуют следующие виды валидности теста. Очевидная валидность. Тест считается валидным, если у испытуемого складывается впечатление, что он измеряет то, что должен измерять. Конкретная валидность (конвергентная – дивергентная валидность). Тест должен хорошо коррелировать с тестами, измеряющими конкретное свойство либо близкое ему по содержанию, и иметь низкие корреляции с тестами, измеряющими заведомо иные свойства. Прогностическая валидность. Тест должен коррелировать с отдаленными по времени внешними критериями. Содержательная валидность. Тест должен охватывать всю область изучаемого поведения. Конструктная валидность. Предполагает полное описание измеряемой переменной, выдвижение системы гипотез о связях ее с другими переменными, эмпирическое подтверждение (неопровержение) этих гипотез. С теоретической точки зрения единственным способом установления «внутренней» валидности теста и отдельных заданий является метод факторного анализа (и аналогичные), который позволяет: а) выявлять латентные (скрытые) свойства и вычислять значение «факторных нагрузок» – коэффициенты детерминации свойств тех или иных поведенческих признаков; б) определять меру влияния каждого латентного свойства на результаты тестирования. Стандартизация теста заключается в приведении процедуры оценок к общепринятым нормативам. Стандартизация предполагает преобразование нормальной или искусственно нормализованной шкалы первичных оценок в шкальные оценки (подробнее об этом см. 5.2). Тестовые нормы, полученные в ходе стандартизации, представляют собой систему шкал с характеристиками распределения тестового балла для различных выборок. Они не являются «внутренними» свойствами теста, а лишь облегчают его практическое применение.

Как создаются психологические тесты

Уильям Штерн

Знакомьтесь, это — Ученый. Прямо сейчас он, специально для вас, создаст тест и позволит вам понаблюдать за этим процессом.

Для начала, Ученый выбирает что хочет измерять. Допустим, это будет уровень агрессии. У Ученого нет отдельной теории, которая структурирует агрессию или разбивает ее на составляющие. Он хочет мерить просто агрессию. В общем и целом.

Для начала, он составляет список из того, что, по его мнению, характеризует агрессивных людей. Ну какие они? Что они делают? Они часто кричат, комфортно чувствуют себя в споре, считают что лучшая защита — это нападение и конечно любили драться в детстве. «Ах да!» — вспоминает Ученый о Фрейде — «у них наверняка был властный отец!».

Из списка утверждений Ученый делает список вопросов: «Легко ли вы переходите на крик? Вы комфортно чувствуете себя в споре? Ваш отец часто заставлял вас выполнять работу по дому силой?»

Затем Ученому нужно проверить как работает его опросник. Для этого ему нужно много людей. Он собирает 1000 людей и нарекает их выборкой. Ученый заставляет несчастных людей заполнить его опросник. Теперь настало время Ученому быть несчастным.

Он обрабатывает полученные данные. Он смотрит на то, какие ответы давали люди на вопросы. Используя математические и статистические методы, Ученый выявляет неэффективные вопросы и выкидывает их. Другие аспекты исследования он усиливает дополнительными вопросами. Прибегает к ухищрениям чтобы минимизировать разные эффекты, искажающие результаты. Ученый наверняка проведет еще несколько проверочных исследований.

Затем Ученый определяет надежность. Это важный показатель, который говорит нам что тест дает достоверные данные. Для определения надежности, Ученый дает тот один и тот же вариант теста одним и тем же людям, но с паузой между подходами. Если для каждого человека тест дает примерно один и тот же результат — он надежный. Ученый подгоняет тест под определенные требования к погрешностям. Для этого, возможно, придется вернуться на несколько шагов назад.

Валидность — еще один важный показатель. Он говорит нам что тест измеряет действительно то что должен. Чтобы не получилось так что мы хотели померить агрессию, а померили уровень открытости или длину большого пальца правой руки. Ее тоже сложными методами проверяют и доводят до высокого уровня.

В результате нескольких лет(!) упорной работы в горах анкет, людей, столов и цифр, на свет рождается тест. Он измеряет всего-лишь одну шкалу — шкалу агрессивности. Ученый устал, Ученый уходит на пенсию со спокойной душой. Он обогатил мировую коллекцию психологических тестов еще одним.

Мировую ли? Как выясняется — нет, только локальную.

Валидность теста надежность теста. Надежность психологических тестов

В обычной жизни надежность человека или какого-либо предмета означает уверенность в том, что на него можно положиться. Как же проверяют, что на психологический тест можно положиться?

Первый способ проверки надежности психологического теста – анализ устойчивости результатов теста. Действительно, если результаты использования теста на одной и той же выборке существенно не меняются при нескольких тестированиях, то это может служить критерием его надежности.

Повторное тестирование называется ретест. Его проводят с интервалом от недели до года. Затем анализируют корреляции нескольких замеров. Если корреляции между результатами ретестов не ниже 0,76, то такой тест считается надежным.

Недостатки ретестовой проверки надежности психологического теста.

1. Некоторые психологические показатели неустойчивы и изменчивы. Например, измеряя настроение, самочувствие в разное время дня или в разные дни, можно получить разные результаты, и это не будет следствием ненадежности теста.

2. При неоднократном заполнении одного и того же теста испытуемые к нему «привыкают». Они могут помнить свои ответы и отвечать так же. Могут, наоборот, менять ответы в сторону социальной желательности. Таким образом, ретестовая надежность не будет в полной мере отражать надежность теста.

Второй способ проверки надежности психологического теста – анализ согласованности различных частей теста. Например, в тесте один показатель, который диагностируется 10-ю вопросами. Согласованность данного теста определяется высокой корреляцией ответов на каждый вопрос с общим результатом по шкале.

Часто для определения согласованности психологического теста его расщепляют на две части. Можно это сделать, отбирая вопросы через один. Можно разделить первую и вторую половину теста. Далее анализируют корреляции ответов двух расщепленных частей теста. Чем выше корреляция, тем выше согласованность теста и его надежность.

Итак, надежность психологического теста – это характеристика его формальной пригодности для диагностики психологических показателей. Например, если тест диагностики тревожности надежен, то это значит, что при его использовании на разных выборках, в разное время вы будете получать схожие результаты. Но будут ли эти результаты характеризовать именно тревожность испытуемых? Надежность психологического теста этого не гарантирует. За это отвечает другой показатель – валидность психологического теста.

Психологические тесты в интернете

Вы прочитали все что выше и теперь знаете о психологических тестах много. Куда больше чем средний человек, не имеющий отношения к психологии. Но вы наверняка смущены. Ведь вы видели огромное количество тестов. Даже на специальных психологических сайтах. И нигде не было ничего подобного.

Вот именно. И теперь вы понимаете какова цена всех этих тестов и их результатов.

Даже отличный валидный и надежный тест, переведенный в электронный вариант, меняет свои показатели. Достоверно известно, что существуют специальные эффекты для тестов, которые проводятся при помощи компьютера. Например, люди склонны отвечать что-то неопределенное или среднее (например при выборе из трех вариантов да-возможно-нет) при проведении компьютерного варианта. Разумеется это сказывается на работе теста.

Методы оценки надежности теста;. Методы оценки надежности теста

До включения в тест задача должна быть оценена с точки зрения объективности, надёжности, валидности, трудности и дискриминативности. Объективной задача может быть признана тогда, когда она несколькими (не менее трёх) независимыми экспертами-психологами оценивается как соответствующая признаку, который подлежит измерению. Надёжной задача является, если при её повторном предъявлении она вызывает у испытуемого эквивалентную первому предъявлению реакцию. Валидной задача считается тогда, когда в соответствии с критерием она чаще всего правильно решается теми испытуемыми, у которых измеряемый признак более выражен, чем у других испытуемых. (Например, в интеллектуальном тесте валидными будут те задачи, которые правильно решают испытуемые с более высоким интеллектом, чем с более низким). Трудность задачи рассчитывается из соотношения процента правильных ответов на данную задачу с учётом объёма репрезентативной выборки испытуемых. Оптимальными для теста являются задачи, индекс трудности которых равен 50 %. Коэффициент дискриминативности, или согласованности, отдельной задачи с тестом позволяет оценить, насколько точно задача дифференцирует испытуемых по измеряемому признаку. Он равен коэффициенту корреляции между средним результатом анализируемой задачи (по принципу: правильный — неправильный ответ) и средним первичным результатом по всем задачам теста.Психологический диагноз предполагает использование и анализ результатов исследования, полученных с помощью различных методик. Причём все данные должны быть представлены в единой шкале, то есть все первичные результаты тестовых исследований необходимо преобразовать таким образом, чтобы они оказались сопоставимыми — стандартизация шкал теста.Под надёжностью теста понимается степень точности, с которой тест измеряет определённое свойство или способ поведения личности. Надёжность теста – это характеристика точности его как измерительного инструмента, его устойчивости к действию помех (как внешних, так и внутренних). Эмпирическое определение надёжности теста является обязательным условием его допуска для использования в практической деятельности психолога.В психометрике обоснование получили три метода оценки надёжности тестов:1) метод повторного тестирования (метод тест-ретест);2) метод тестирования параллельной, или эквивалентной, формой теста;3) метод деления, или расщепления теста на части. Оценка надёжности по методу повторного тестирования требует, чтобы тест дважды предъявлялся одной и той же выборке испытуемых через какое-то время. Длительность временного промежутка определяется содержанием и характером задач теста.Второй метод оценки надёжности теста требует наличия параллельной, то есть эквивалентной, формы теста, например формы «А» и «Б». Репрезентативную выборку испытуемых, на которой проверяется надёжность теста, случайным образом делят на две примерно равночисленные группы. Затем первой группе предъявляются задачи формы «А», а второй группе – задачи формы «Б». Через некоторое время (не более одной недели) задачи формы «Б» решает первая группа, а формы «А» — вторая. После этого для всей репрезентативной выборки испытуемых отдельно вычисляются первичные результаты для форм «А» и «Б», которые затем подвергаются корреляции.Общим недостатком первых двух методов оценки надёжности теста является то, что они зачастую дают заниженные или завышенные коэффициенты надёжности. Дело в том, что дисперсия результатов, на основе которой рассчитывается коэффициент корреляции, неоднородна по своему составу. Наряду с дисперсией действительных индивидуальных различий в неё входят частные дисперсии, обусловленные влиянием как внутренних, психологических, причин (колебания внимания, усталость и др.), так и внешних (уличный шум, поведение и высказывания исследователя и т. п.). При этом сила и сочетание этих причин в первом и во втором тестировании могут быть различными, и оценить их влияние или полностью их нейтрализовать оказывается невозможным.Поэтому, особенно при проверке надёжности тестов мощности (например, интеллектуальных тестов) и достижений, предпочтение следует отдавать третьему методу, поскольку он предполагает лишь однократное тестирование. Третий метод оценки надёжности включает два различных приёма расчёта: разделение тестовых задач на две части, например по принципу «чётные и нечётные», и расчёт коэффициента консистентности задач теста.

Дополнительные тесты

Вместе с выполнением этих тестов на психологическое состояние, рекомендует вам пройти следующие задания.

Тест на психопатию. С его помощью вы сможете заподозрить ряд отклонений, которые свидетельствуют о психическом заболевании.
Выбери картинку и узнай, какая ты личность. В зависимости от выбранного вами изображения вы сможете лучше разобраться в индивидуальных особенностях своего характера.
Тест на зависимость от общественного мнения. С помощью этого опросника можно определить насколько для вас важна точка зрения окружающих людей и умеете ли вы принимать решения самостоятельно.

comments powered by HyperComments

Валидность и надежность теста. Тесты психологические. Тестирование персонала

Тест (англ. test — проба, испытание, исследование)
— стандартизированное задание, результат выполнения которого позволяет измерить
психофизиологические и личностные характеристики, а также знания, умения и
навыки испытуемого.

При тестировании персонала применяемая батарея тестов (в том числе компьютерная)
должна отвечать базовым требованиям валидности и надежности .

Валидность
теста — это критерий степени достоверности измерения психического свойства
(качества, явления), которое хотят измерить с помощью данного теста. По сути,
валидность теста — это показатель степени его эффективности и пригодности для
измерения нужной нам характеристики.

Различают несколько видов валидности:

конструктивную валидность;
валидность
по критерию;
валидность
по содержанию;
прогностическую валидность.

Валидность
лучших тестов не превышает 80%. Следует учитывать, что валидность меняется в
зависимости от контингента людей, которые подвергаются тестированию, а также
характера их будущей деятельности. В результате один и тот же тест может быть
высоковалидным для одной ситуации, и совершенно невалидным для другой.

Основные виды валидности тестов

Конструктивная валидность — это критерий качества теста, используемый при
измерении какого-либо сложного психического феномена, имеющего иерархическую
структуру, измерить который из-за этого одним актом тестирования невозможно. К
примеру, психодиагностика интеллекта невозможна без предварительного
определения понятия «интеллект» и его структуры. В данном случае степень
соответствия структуры интеллекта структуре теста и будет составлять
конструктивную валидность теста. В общем она нацелена на определение точности
измерения сложных, устойчивых типов поведения, качеств личности, психических
явлений.

Валидность
по критерию — это критерий качества теста, с помощью которого можно
судить об интересующем аспекте психики конкретной личности в настоящем и
будущем. Для его определения сопоставляются результаты тестирования с уровнем
развития измеряемого признака, качества личности на практике. Так, для теста на
технические способности основным критерием их определения будет выступать
техническая деятельность конкретных специалистов, оценка их технических
способностей с помощью экспертов, хорошо знающих испытуемых в интересующем
аспекте на протяжении достаточно продолжительного времени. Оценка при этом
дается по шкале порядковой, интервальной или отношений. В целом, применение
теста считается оправданным, если валидность по критерию составляет минимум
0,2-0,25.

Валидность
по содержанию — критерий качества теста, используемый при выяснении
соответствия его области измеряемых психических явлений. Показывает, насколько
полно тест охватывает исследуемое множество измеряемых параметров.

Прогностическая
валидность — критерий качества теста, предсказывающий характер развития
измеряемого параметра в будущем. Данный вид валидности особенно ценен с
практической точки зрения. Однако существенным недостатком критерия является
то, что он не учитывает неравномерность развития измеряемого параметра у
различных людей в будущем.