Основы социально-педагогической диагностики

p align="left">Здесь уместен вопрос:" Хорошо, но что дальше? Почему эти различия так важны?". Существует, по крайней мере, две причины, по которым вы должны получить элементарное понимание разницы между этими четырьмя методами первичной оценки информации. Соотносительная шкала представляет больше информации, чем интервальная, которая предоставляет больше информации, чем ординальная, ну а ординальная -больше, чем номинальная. Из этого следует, что, по возможности, исследователи должны использовать тот тип измерений, который предоставит максимум сведений для ответа на изучаемые вопросы. Вторая причина в том, что некоторые виды статистических процедур не подходят для разных шкал. Способ, по которому данные в исследованиях организуются, диктует определенный единственный тип статистического анализа (более подробно см. в главе, посвященной описательной статистике).

Иногда исследователи имеют свободу выбора. Они могут рассмотреть данные как в ординальной, так и в интервальной шкалах. Например, исследователь использует самостоятельно заполняемую анкету для измерения самооценки. Обработанная по количеству отмеченных пунктов (да/нет) анкета показывает высокую самооценку. Для данной модели 60, исследователь обнаружил колебание результатов от 30 до 75. Можно обработать данные по интервальной шкале, при этом необходимо принять, что равные интервалы в результатах (30-34,35-39,40-44) представляют равные различия в самооценке. Заметим, что исследователь не может использовать соотносительную шкалу, так как результат 0 не может быть принят в качестве нулевой самооценки. Если работать с этим допущением неудобно, то можно использовать результаты для выстраивания их в модели от самого высокого (категория №1) до самого низкого (категория №60). Если в последующем анализе пользоваться только этими категориями, то предполагается, что эта методика включает только ординальную шкалу.

К счастью, исследователи могут избежать этого выбора. У них есть право работать с данными, отдельно обращаясь к обоим шкалам. Важной для понимания вещью является то, что исследователь должен быть готов доказать те положения, которые лежали в основе выбора той или иной шкалы измерений для сбора и организации данных.

Валидность исследования

“Лишь в истине - и цель,и красота”

И.Бунин

Валидность исследования была определена Куком (Cook) и Кэмпбеллом (Campbell) в 1979 году как наилучшая из имеющихся апроксимаций истинных высказываний, включая высказывания затрагивающие причинно-следственные связи. Данное определение относится к установлению точности выводов исследования и подчеркивает относительный характер истины, которой возможно достичь в социальных науках. В любом научном исследовании нужно уметь ответить на следующие вопросы:

существует ли зависимость между двумя переменными;

носит ли эта зависимость причинный характер;

является ли данная зависимость значимой;

действительно ли процедуры измерения и наблюдения относятся к исследуемым конструктам;

могут ли быть обобщены причинные зависимости, выявленные в ходе исследования.

Поэтому выделим следующие типы валидности, относящиеся к этим вопросам.

Валидность статистических выводов

“Блажен, кто менее зависит

от людей”.

Г.Державин

Этот тип валидности соответствует проверке статистической значимости зависимости между двумя переменными. Такие выводы всегда являются вероятностными. Действительно, можно совершить два типа ошибок: решить, что зависимость является значимой, в то время, когда это не так, или решить, что значимая зависимость между переменными отсутствует, когда, напротив, она имеется.

Существуют некоторые факторы, которые могут снижать валидность статистических выводов:

слабая чувствительность исследований, которая проявляется при недостаточной по численности выборке или при большой изменчивости в сравниваемых группах, то есть испытуемые являются слишком разными и сильно отличаются друг от друга относительно некоторых переменных;

низкая надежность методик измерения или процедур манипулирования переменными, которые используются в исследовании;

факторы помех, присутствующие в условиях эксперимента;

нарушение принятых правил проведения и обработки, которые установлены для различных статистических методов.

Стратегия повышения валидности статистических выводов состоит в уменьшении вариативности ошибки путем применения, например, схемы исследования с повторными пробами или использования однородных групп. Статистическая состоятельность исследования может диагностироваться как на стадии проектирования исследования (например, проверка расчета величины выборки), так и после исследования для оценки его результатов.

Внутренняя валидность

“От слов своих бывал я огорченным.

Бывал я рад словам неизреченным”.

Рудаки

Внутренняя валидность - один из самых важных типов валидности, который действительно касается отношений между зависимыми и независимыми переменными. Эта валидность связана с особым процедурами, которые позволяют определить, насколько выводы, сделанные в данном исследовании, достоверны. После того, как установлено существование зависимости между переменной X и переменной Y, необходимо решить, какая из переменных является причиной, а какая следствием, то есть определить направление данной взаимосвязи. Если Y наблюдается после X, то можно сказать, что X является причиной Y.

Однако может оказаться, что отношение зависимости между X и Y вызвано третьей переменной С. Для установления внутренней валидности необходимо рассмотреть все возможности влияния третьей переменной С на переменные X и Y и исключить их. Считается, что исследование обладает внутренней валидностью, если доказано, что существует зависимость причинно-следственного типа между зависимыми и независимыми переменными.

Причины снижения внутренней валидности исследования:

1. Смешение переменных. Это одна из наибольших опасностей для валидности эксперимента. Если в ходе эксперимента какой-либо случайный фактор (неэкспериментальная переменная) взаимодействует с зависимой переменной, и это взаимодействие не может быть измерено отдельно от взаимодействия зависимой и независимой переменных, то влияние случайной и независимой переменных неразличимо. Проблема смешения переменных является особенно острой в тех исследованиях, где экспериментатор не может контролировать независимую переменную.

2. Изменения, связанные с испытуемыми. При проверке зависимых переменных изменения, произошедшие между двумя моментами наблюдения, могут быть вызваны не независимыми переменными, а изменениями, произошедшими с самими испытуемыми (например, событиями личной жизни, изменением тех или иных свойств личности и т. д.), то есть факторами "зрелости" и "истории".

Под "зрелостью" понимаются изменения, которые произошли с испытуемым между моментом пред-теста и моментом пост-теста и которые не были связаны с влиянием независимых переменных. Например, в экспериментах по моторной координации у испытуемых может наблюдаться ее улучшение за счет тренировок в период между экспериментами. Данное влияние нельзя смешивать с влиянием независимой переменной. Под фактором "истории" подразумеваются события, которые произошли с испытуемыми и которые повлияли на результаты эксперимента.

3. Влияние пред-теста. Пред-тест вызывает изменения испытуемых, и, следовательно, результаты эксперимента в некоторых случаях могут в основном зависеть от пред-теста, а не от зависимой переменной.

4. Изменение навыков исследователя. Например, исследователь, спустя некоторое время, может стать более опытным в наблюдениях и, следовательно, по-другому интерпретировать поведение испытуемых. Кроме того, на исследователя могут влиять такие факторы, как усталость, что может привести к ошибкам в экспериментах.

Регрессия к среднему. Это явление наблюдается тогда, когда индивиды подвергаются повторным испытаниям относительно одной и той же переменной. Установлено, что, если испытуемые получили в первом испытании результаты, по величине близкие к высшим показателям шкалы, то при повторном эксперименте их результаты снижаются и становятся ближе к средним показателям, в то время как испытуемые, получившие в первом испытании результаты, близкие к низшим, при повторном измерении достигают лучших показателей. Регрессия к среднему наблюдается также в случае ошибок, связанных с изменением переменной.

6. Отсев. Известно, что в ходе исследования некоторые испытуемые покидают группу. Оставшиеся испытуемые, естественно, отличаются от выбывших.

Предположим, что исследуется два метода модификации поведения для контроля за весом тела. Группе 1 предписана диета. Причем, испытуемые первой группы должны ежедневно записывать в дневник все, что они едят, точно взвешивать все блюда и подсчитывать калорийность пищи. Группе 2 была просто предписана диета. Очевидно, что некоторые испытуемые группы с более обременительным заданием выйдут из эксперимента. В конце эксперимента процент испытуемых с высокой мотивацией в этой группе будет больше.

У испытуемых с более высокой мотивацией больше вероятность похудения. Поэтому исследователь может прийти к ошибочному выводу о том, что условия в первой группе более эффективны для похудения.

Некоторые авторы говорят также о конструктной валидности. Конструктная валидность подобна внутренней валидности и подразумевает соответствие между полученными результатами и теорией, которая лежит в основе исследования. Для того, чтобы оценить конструктную валидность, необходимо исключить другие возможные теоретические объяснения результатов. Если есть сомнения в том, насколько экспериментальные результаты соотносятся с теоретическими, необходимо спланировать новый эксперимент, который позволит выбрать одно из нескольких теоретических объяснений результатов. Этот тип валидности наиболее трудно получить, потому что имеются многочисленные теории, с помощью которых можно объяснить соотношение переменных, полученное в эксперименте.

Рассмотрим две причины снижения конструктной валидности. Первая - слабая связь между теорией и экспериментом. Действительно, во многих психологических исследованиях даются нечеткие операционные определения теоретических понятий. Вторая причина определяется, во_первых, тем, что испытуемые очень часто начинают играть роль "хорошего" объекта исследования и ведут себя таким образом, чтобы доставить удовольствие экспериментатору, и во-вторых, тем, что у испытуемых, особенно в экспериментах, замеряющих их умственные способности или эмоциональную стабильность, развивается высокая тревожность относительно ожидаемой оценки.

Валидность процедур

Третий тип валидности - это валидность процедур, которые позволяют варьировать и измерять переменные. Даже необходимость определить в операциональных терминах концептуальные переменные, значимые для исследования, уже является источником риска. Действительно, "перевод" понятия на уровень конкретных операций может неадекватно отразить теоретические положения исследования.

Существуют, так называемые, "переменные-паразиты", которые могут активизировать изменения переменных. "Переменные-паразиты" бывают двух типов:

"Переменные-паразиты" особого типа, то есть переменные, связанные только с определенными операциями, производимыми в данном исследовании.

"Переменные-паразиты" общего типа, то есть переменные, связанные с экспериментальными условиями косвенно, например, с ожиданиями исследователя.

Часто исследователь неосознанно стимулирует ответ, который он ожидает получить. Избежать этого можно, используя стратегии невмешательства в исследования и соответствующие методы измерения. При этом испытуемые не должны знать, что за ними наблюдают, что позволяет снять нежелательную мотивировку по отношению к эксперименту.

Внешняя валидность

“Взойдите на вершину и взгляните,

Как ваши разногласия малы!”

Н.Старшинов

Под внешней валидностью понимается возможность обобщать результаты исследования, то есть распространять выводы, полученные на экспериментальной выборке, на всю генеральную совокупность. Внешняя валидность существенно зависит от способа формирования выборки. Существует три основных типа выборки:

1. Случайная выборка. Например, результаты исследования группы подростков, сформированной случайным способом, будут справедливы с некоторой степенью вероятности для всех подростков. Однако такое исследование может оказаться очень сложным и дорогостоящим, так как выборка должна быть многочисленной и однородной.

2. Гетерогенная (неоднородная) выборка. В соответствии с целями исследования выделяются различные группы населения, на которых предполагается получить результаты исследования. Затем анализируется случайная выборка с тем, чтобы убедиться, что она содержит достаточное количество представителей каждой группы.

3. Выборка типичного случая. Например, дается определение среднего молодого человека. Для исследования используется выборка, состоящая из индивидов, удовлетворяющих этому определению. Тогда, если проводится эксперимент со студентами университета, например, на способность к ведению переговоров, то нельзя рассчитывать на то, что полученные выводы будут применимы для глав государств.

Внешнюю валидность снижает также несоответствие между явлениями, наблюдаемыми в лаборатории, и явлениями в естественных условиях. Трудно определить, имеет ли место выявленная зависимость только в лаборатории или она наблюдается и вне лаборатории. Внешняя валидность обеспечивается неоднократным проведением эксперимента в гетерогенных условиях.

Необходимо решить, какой тип валидности является главным для данного исследования. Действительно, процедуры, используемые для повышения одного типа валидности, могут снижать другие типы валидности.

Например, для повышения валидности статистических выводов исследователь должен использовать максимально разнородные объекты, снижая таким образом возможность ошибки. При этом внешняя валидность уменьшается.

Тип приоритетной валидности зависит от типа проводимого исследования. Например, если в экспериментальном исследовании устанавливается причинно-следственная зависимость между переменными, то в этом случае внутренняя валидность является основной. Напротив, при вычислении корреляционных связей между переменными невозможно установить направление причинно-следственных отношений, поэтому в данном случае внутренняя валидность не представляет интереса по сравнению с другими типами валидности.

С понятием валидности связано понятие контроля. Под контролем понимается любое средство, используемое для исключения возможности снижения валидности исследования. На практике исследователь проверяет, какие факторы могут снизить валидность исследования и какие методы могут быть использованы для нейтрализации этих факторов.

Различают шесть основных методов контроля.

1. Одним из наиболее часто используемых методов контроля является проведение эксперимента с группой испытуемых, которые не подвержены влиянию исследуемой переменной и которые сравниваются с испытуемыми, подверженными этому влиянию. Например, исследуется две группы относительно независимой переменной. Группа 1 получает воздействие и называется экспериментальной. Группа 2 не получает воздействия и называется контрольной. Результаты экспериментальной группы сравниваются с результатами контрольной группы. Если две группы были одинаковыми до экспериментального воздействия, то любое различие между ними, зафиксированное после эксперимента, может быть отнесено за счет этого воздействия.

Таблица 2

	Пред-тест	Экспериментальное воздействие	Пост-тест
Группа 1 (экспериментальная)	Да	Да	Да
Группа 2 (контрольная)	Да	Нет	Да

В данной таблице представлена экспериментальная группа 1, в которой проводился пред-тест, то есть предварительное измерение. Затем осуществлялось экспериментальное воздействие и, наконец, проводился пост-тест. Контрольная группа 2 подвергалась только пред-тесту и пост-тесту и не получала экспериментального воздействия.

Однако для некоторых измерений данная процедура не имеет смысла. Например, при исследовании двух методов преподавания можно использовать группу, которая посещает только лекции, и группу, которая посещает лекции и семинары. Это дает возможность определить, какой метод обучения лучше, не используя группу, которая никогда не посещала лекций.

2. При втором методе контроля контрольная группа не используется, но имеются две группы испытуемых, которые подвергаются воздействиям, различным по форме или интенсивности. Таким образом, каждая группа используется в качестве контрольной для другой. Вместо того, чтобы группу 1 подвергать воздействию, а группу 2 использовать в качестве контрольной, обе группы подвергаются воздействиям, различным по форме и интенсивности, например, в них используются два различных метода преподавания (см. Табл. 2).

Таблица 3

	Пред-тест	Экспериментальное воздействие	Пост-тест
Группа 1 (экспериментальная)	Да	1	Да
Группа 2 (контрольная)	Да	2	Да

3. Третий метод контроля - каждый испытуемый подвергается всем экспериментальным воздействиям. В данном случае вместо контрольной группы имеется только контрольное воздействие, то есть испытуемые служат для контроля самих себя. Данные эксперименты проводятся на одном испытуемом. Третий тип контроля используется в некоторых областях психологии, например, в исследованиях ощущений и восприятия.

4. Четвертый тип контроля - преобразование помех. Если факторы, которые мешают в эксперименте и влияют на результаты, являются трудно устранимыми, то они могут рассматриваться экспериментатором как независимые переменные.

Например, при сравнении студентов-психологов отделений дневного и вечернего обучения факторы, которые определяют разницу между этими группами (студенты вечернего отделения старше, устают и т. д.), могут рассматриваться как помехи. Однако эти факторы могут быть преобразованы экспериментатором в независимые переменные.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10

В соцсетях