Психология от а до я: словарь-справочник — валидность

Клуб Здорового Сознания

Психология от а до я: словарь-справочник - валидностьПсихология от а до я: словарь-справочник - валидность

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки.

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности.

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение.

Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на

  • другие популяции,
  • другие условия,
  • другое время.

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно генерализовал свою модель на представителей обоих полов.

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности», однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

Валидность это в психологии

В психологии понятие валидности обозначает уверенность экспериментатора в том, что он измерял именно то, что хотел с помощью определенной методики, показывает меру соответствия результатов и самой методики относительно поставленных задач. Валидное измерение – это то значение, которое измеряет именно то, для чего было создано. Например, методика, направлена на определение темперамента, должна измерять именно темперамент, а не нечто другое.

Валидность в экспериментальной психологии очень важный аспект, является важным показателем, который обеспечивает достоверность результатов, и с ним иногда больше всего возникает проблем. Совершенный эксперимент должен обладать безупречной валидностью, то есть он должен демонстрировать, что экспериментальный эффект вызван модификациями независимой переменной и полностью соответствовать действительности. Полученные результаты без ограничений можно обобщать. Если речь идет о степени данного критерия, то предполагается, что результаты будут соответствовать поставленным задачам.

Проверка на валидность осуществляется тремя способами.

Оценивание содержательной валидности, проводится, чтобы узнать уровень соответствия использованной методики и реальной действительности, в которой выражается исследуемое свойство в методике. Существует здесь также такой компонент, как очевидная, еще ее называют лицевая валидность, она характеризует степень соответствия теста к ожиданиям оцениваемых. В большинстве методик считается очень важным, чтобы участник оценки видел очевидную связь содержания процедуры оценки и действительности того объекта оценки.

Оценивание конструктной валидности исполняется для получения степени обоснованности, что тест реально вычисляет те конструкты, которые заданные и научно обоснованные.

В конструктной валидности имеются два направления. Первый называется конвергентной валидизацией, с его помощью проверяется ожидаемая связь результатов методики с характеристиками из других методик, которые измеряют исходные свойства. Если для измерения какой-то характеристики необходимо несколько методик, то рациональным решением было бы проведение экспериментов минимум двух методик, чтобы при сопоставлении результатов обнаружив высокую положительную корреляцию, можно было утверждать о валидном критерии.

Конвергентная валидизация определяет вероятность вариации оценки теста с ожиданиями. Второй подход, называется дискриминантная валидизация, в ней заключается, что методика не должна измерять никаких характеристик, с которой теоретически не должно быть корреляции.

Проверка на валидность, также бывает критериальной, она, руководствуясь статистическими методами, определяет степень соответствия результатов к заранее определенным внешним критериям. Такими критериями могут быть: непосредственные меры, независимые от результатов методики или значение социально-организационных значимых показателей деятельности. В критериальной валидности также выделяют прогностическую, она применяется при потребности прогнозирования поведения. И если получается, что этот прогноз осуществляется со временем, значит методика прогностически валидна.

Что такое валидность?

Валидность – это свойство или качество, которое должно указывать на то, что используемая методика, тест, человек, предмет или явление достоверно или пригодно для рассмотрения конкретной характеристики. Другими словами, внешний предмет или человек должен быть ориентирован на то, ради чего его применяют. Он должен наилучшим образом позволять человеку достигать поставленной цели или решать задачу.

К примеру, в применении валидности к тестам, то они должны максимально раскрывать  и рассматривать ту характеристику, которую специалисты хотят изучить. Естественно, что методика, тест и прочее подвергаются постоянному изменению с целью улучшения их валидности, особенно если в процессе их использования наблюдаются различные недочеты и отклонения.

Валидность определяется следующим образом:

  1. Сначала разрабатывается методика, тест, предмет или качества человека, которые должны помогать в решении поставленной задачи.
  2. Затем используется «разработка» на практике, чтобы посмотреть, насколько она пригодна для достижения желаемой цели.

То, что использует человек для решения поставленной цели, должно быть не только валидным, но и надежным, то есть практически в любых ситуациях и отклонениях, форс-мажорных событиях показывать или выдавать правильный результат. Человек должен быть уверен в том, что предмет или качество, методика или явление, которое он использует для решения какой-то задачи, обязательно даст желаемый результат.

Валидность – это результат, которого человек хотел достичь в определенной ситуации, что помогает в решении поставленной задачи.

Если применить валидность к обычной жизни, тогда можно рассмотреть вопрос того, достоин ли человек иметь то, что уже имеет. «Этот человек не достоин того, что у него есть?». А кто судить этого человека? Скорее всего, тот, кто ему завидует и сам хотел бы иметь такой же успех. Более того, в материальном мире ничего нельзя получить просто так. Человеку приходится что-то делать, чтобы иметь тот успех, которым он потом обладает. Поэтому человек достоин того успеха, который имеет.

Вопрос заключается в другом: моральными или аморальными поступками человек достиг успеха? Но это выбор каждого отдельного человека. Если мир дал человеку успех за те аморальные поступки, которые он совершил, значит, он все сделал правильно. Это вам кажутся поступки аморальными. Но мир не по моральности оценивает поступки каждого человека, а по тому, совершаются ли они и к каким последствиям приводят в тех или иных условиях.

Вы можете поступать морально, если хотите. Но порой важны не методы вашего достижения, а сами достижения. Если вы поступаете морально, но не имеете успеха, тогда вы – неудачник по сравнению с тем, кто поступал аморально и достиг успеха. Для мира не важна моральность. Мир понимает только поступки, которые совершает человек, условия, в пределах которых они совершаются, и те последствия, которые достигаются в результате сочетания поступков и условий.

Окружающие люди сперва вас судят по тем достижениям, которые у вас имеются, чтобы определить для себя, общаться с вами дальше или нет. Они на стадии знакомства не интересуются тем, насколько вы моральный человек. Людей интересуют успехи. А как вы их достигли, людей не интересует до тех пор, пока вы не задеваете их собственные интересы. Вы даже можете дружить с людьми и вести себя аморально. Они могут вас уважать, потому что вы достигаете своих целей. Но так происходит до тех пор, пока вы не задеваете их личную территорию, интересы и личность. Вас будут уважать, даже если вы совершаете аморальные поступки, но при этом никого не задеваете и достигаете успехов. Так, кто достоин того, что у него есть?

Все люди имеют то, что заслужили. Если вы бедны, то сами заслужили это. Если вы богаты, то заслужили это. Мир дал вам то, к чему вы приложили свои силы, причем сделали это в правильном месте и в правильное время, то есть в условиях, которые согласовались с вашими поступками. И здесь уже не имеет значения, насколько моральными были поступки. Когда человек достигает успеха, важна не мораль, а достижения. И окружающие люди чаще ценят достижения, а не то, насколько вы моральны. Ведь можно быть моральным человеком, но жить бедно, в болезнях, впроголодь и без семьи.

«Прогностическая» валидность.

«Прогностическая» валидность определяется также по достаточно надежному внешнему критерию, но информация по нему собирается некоторое время спустя после испытания. Внешним критерием обычно бывает выраженная в каких-нибудь оценках способность человека к тому виду деятельности, для которой он отбирался по результатам диагностических испытаний. Хотя этот прием наиболее соответствует задаче диагностических методик — предсказанию будущей успешности, применять его очень трудно. Точность прогноза находится в обратной зависимости от времени, заданного для такого прогнозирования. Чем больше проходит времени после измерения, тем большее количество факторов требуется учитывать при оценке прогностической значимости методики. Однако учесть все факторы, влияющие на предсказание, практически невозможно.

Валидность теста это

Тест – это стандартизованное задание в результате применения, которого получаются данные о психофизиологическом состоянии человека и его личностные свойства, его знания, способности и навыки.

Валидность и надежность тестов – это два показателя, которые определяют их качество.

Валидность теста определяет степень соответствия исследуемого качества, характеристики, психологического свойства к тесту, с помощью которого они определяются.

Валидность теста является показателем его эффективности и применяемости к измерению необходимой характеристики. Самые качественные тесты имеют 80% валидности. При валидизации следует учитывать, что от контингента испытуемых и их характеристик, будет зависеть качество результатов. Получается, что один тест может быть как высоко достоверным, так и совсем невалидным.

Существует несколько подходов к определению валидности теста.

При измерении сложного психологического явления, которое имеет иерархическую структуру и его невозможно исследовать, применяя всего один тест, применяют конструктивную валидность. Она определяет точность исследования сложных, структурированных психологических явлений, качеств личности, измеряемых с помощью тестирования.

Валидность за критерием – это такой критерий теста, за которым определяется исследуемое психологическое явление в настоящий момент и прогнозирование особенностей этого явления в будущем. Для этого результаты, полученные при тестировании соотносятся со степенью развития измеряемого качества на практике, оценка специфических способностей в определенной деятельности. Если валидность теста имеет значение минимум 0,2 то применение такого теста является оправданным.

Содержательная валидность – это критерий теста, который применяется для определения соответствия области его измеряемых психологических конструктов, демонстрирует все полноту множества измеряемых показателей.

Прогностическая валидность – критерий, за которым можно предсказать характер развития исследуемого качества в будущем. Такой критерий качества теста очень ценный, если смотреть с практической стороны, но могут быть сложности, поскольку исключается неравномерность развития данного качества в разных людей.

Надежность теста – это критерий теста, который измеряет уровень стабильности результатов, полученных после тестирования, при повторном исследовании. Определяется путем вторичного тестирования спустя определенное количество времени и расчета корреляционного коэффициента результатов, полученных после первого и после второго тестирования

Также важно, учитывать особенности самой процедуры проведения тестов и социально-психологической структуры выборки. Один и тот же тест может иметь разную надежность, зависимо от пола, возраста, социального статуса исследуемых

Поэтому надежность может иногда иметь неточности, ошибки, которые истекают из самого процесса исследования, поэтому ищутся пути, как уменьшить влияние определенных факторов на тестирование. Можно утверждать о надежности теста, если она составляет значение 0,8-0,9.

Валидность и надежность тестов очень важны, потому что определяют тест, как измерительный инструмент. Когда надежность и валидность неизвестны, тест считается неприменяемым для применения.

В измерении надежности и валидность имеет место также этический контекст

Это особенно важно, когда результаты тестирования имеют значимость в использовании их для принятия жизненно важных решений людей. Одних людей принимают на работу, других отсеивают, одни студенты проходят в учебные заведения, а другие должны еще доучиться сначала, кому-то определяется психиатрический диагноз и лечение, а кто-то здоров – это все говорит о том, что подобные решения принимаются на основании изучения оценки поведения или специальных способностей

Например, человек ищущий работу, должен пройти тестирование, и его оценки есть решающими показателями при приеме на работу, узнает, что тест был не в меру валидным и надежным, он очень разочаруется.

Валидность теста и методики

Тесты являются популярными методиками измерения конкретных качеств клиентов при проведении практической работы. Здесь надежность и валидность тестов должна быть стопроцентной. По факту оказывается, что тесты обладают 80% валидностью, что также считается нормальными показателями, поскольку во многом результаты зависят от честности и сознательности самих клиентов, которые проходят тесты.

Нередко нужно использовать несколько тестов, поскольку рассматриваемое качество может проходить в связке с другим качеством, которое уже измеряется другим тестом. Существуют прогностические тесты, которые должны рассматривать, как качество, которым обладает человек, будет проявляться в будущем.

Валидность методики заключается в том, насколько конкретная методика выявляет и измеряет ту характеристику, на которую она направлена. Валидной методика является, когда она реализовывает все возложенные на нее задачи.

Многое при проведении тестов и методик зависит от самих испытуемых, которые дают ответы на поставленные вопросы. Здесь все зависит от того, как сам испытуемый себя воспринимает и оценивает, что будет влиять на его ответы и, соответственно, результаты, которые могут на самом деле немного отличаться от действительности, поскольку базируются на искаженном восприятии человеком самого себя.

Виды валидности

В различных источниках упоминаются разные названия, что может создавать определенную путаницу. В экспериментальной психологии ключевыми понятиями являются

  • Внешняя валидность
    • Операциональная валидность
    • Конструктная валидность
  • Внутренняя валидность
  • Дифференциальная валидность
  • Инкрементная валидность
  • Экологическая валидность

Для психодиагностики и организационной психологии более традиционной является классификация из трех основных видов валидности:

  • Конструктная валидность
    • Конвергентная валидность
    • Дивергентная валидность
  • Критериальная валидность (Эмпирическая валидность)
    • Текущая валидность
    • Ретроспективная валидность
    • Прогностическая валидность
  • Содержательная валидность

    Очевидная валидность

Валидность методики это

Валидность методики определяет соответствие того, что изучается данной методикой, тому для изучения чего именно она предназначена.

Например, если психологическая методика, которая основана на осведомленном самоотчете, назначена для исследования некого качества личности, такого качества, которое не может быть верно, оцененным самим человеком, то такая методика не будет валидной.

В большинстве случаев ответы, которые дает испытуемый на вопросы о наличии или отсутствии развитости в нем этого качества, может выражать то, как сам испытуемый воспринимает себя, или каким бы ему хотелось быть в глазах других людей.

Валидность также является основным требованием к психологической методике изучения психологических конструктов. Существует масса разных видов данного критерия, и нет пока единственного мнения о том, как правильно назвать эти виды и неизвестно каким именно видам методика обязана соответствовать. Если же методика оказывается невалидной внешне или внутренне, не рекомендуется ее использовать. Существуют два подхода к валидизации методики.

Теоретический подход выявляется в том, чтобы показать насколько действительно методика измеряет именно то качество, которое, как придумал исследователь, и обязана измерять. Это доказывается через составление с родственными показателями и теми, где связей не могло бы быть. Поэтому для подтверждения теоретического валидного критерия нужно определить степень связей с родственной методикой, имеется в виду конвергентный критерий и отсутствие такой связи с методиками, которые имеют иную теоретическую базу (дискриминантная валидность).

Оценивание валидности методики может быть количественной или качественной. За прагматическим подходом оценивается эффективность и практическая значимость методики, и для ее проведения используется независимый критерий извне, как показатель встречаемости данного качества в повседневной жизни. Таким критерием, например, может быть успеваемость (для методик на достижения, тестов на интеллект), субъективные оценки (для личностных методик), специфические способности, рисование, моделирование (для методик специальных особенностей).

Для доказательства валидности внешних критериев, выделяется четыре типа: критерии исполнения – это критерии такие, как количество выполненных заданий, время, потраченное на обучение; субъективные критерии получают вместе с опросниками, интервью или анкетами; физиологические – частота пульса, давление, физические симптомы; критерии случайности – используются, когда к цели имеет касательство или влияние определенного случая или обстоятельств.

При выборе методики исследования имеет теоретическое и практическое значение определение охвата изучаемых характеристик, как важной составляющей валидности. Информация, которая содержится в названии методики практически всегда не является достаточной для суждения об области ее применения

Это просто имя методики, но под ним всегда кроется еще много чего. Хорошим примером будет методика корректурной пробы. Здесь в сферу изучаемых свойств включаются концентрация внимания, устойчивость и психомоторная скорость процессов. Такая методика дает оценку выраженности этих качеств в личности, хорошо соотноситься со значениями, полученными из других методов и обладает хорошей валидностью. Вместе с тем полученные в результате проведения корректурной пробы значения подвержены большему влиянию других факторов, относительно которых методика будет неспецифичной. Если применить корректурную пробу, чтобы измерить их, то валидность будет невысокая. Выходит,что определяя область применения методики, валидный критерий отображает уровень обоснованности результатов исследования. При небольшом количестве сопровождающих факторов, которые имеют влияние на результаты, достоверность оценок, полученных в методике будет выше. Еще достоверность результатов определяется с помощью набора измеряемых свойств, их важностью при осуществлении диагностики сложной деятельности, существенностью отображения в материале методики предмета измерения. Например, для удовлетворения требований достоверности и надежности, методика, назначенная на профотбор, должна иметь анализ большого круга различных показателей, которые наиболее важные при достижении успеха в профессии.

Конвергентная и дискриминантная валидность.

От того, как психолог определяет диагностический конструкт, зависит стратегия включения в тест определенных пунктов. Если Айзенк определяет свойство «нейротизм» как независимое от экстраверсии-интроверсии, то это означает, что в его опроснике примерно поровну должны быть представлены пункты, с которыми будут соглашаться невротичные интроверты и невротичные экстраверты. Если же на практике окажется, что в тесте будут преобладать пункты из квадранта «Нейротизм-Интроверсия», то, с точки зрения теории Айзенка, это означает, что фактор «нейротизм» оказывается нагруженным иррелевантным фактором — «интроверсией». (Точно такой же эффект возникает, если появится перекос в выборке — если в ней будет больше невротичных интровертов, чем невротичных экстравертов.)

Для того чтобы не сталкиваться с такими сложностями, психологи хотели бы иметь дело с такими эмпирическими показателями (пунктами), которые однозначно информируют только об одном факторе. Но это требование реально никогда не выполняется: всякий эмпирический показатель оказывается детерминированным не только тем фактором, который нам нужен, но и другими — иррелевантными задаче измерения.

Таким образом, по отношению к факторам, которые концептуально определяются как ортогональные к измеряемому (встречающиеся с ним во всех комбинациях), составитель теста должен при отборе пунктов применить стратегию искусственного балансирования.

Соответствие пунктов измеряемому фактору обеспечивает конвергентную валидность теста. Сбалансированность пунктов относительно иррелевантных факторов обеспечивает дискриминантную валидностъ. Эмпирически она выражается в отсутствии значимой корреляции с тестом, измеряющим концептуально независимое свойство.