Алексей Сергеевич Лучинин
Психодиагностика: конспект лекций
«Психодиагностика. Конспект лекций »: Эксмо; Москва; 2008
Аннотация
Данная книга предназначена длястудентов-психологов и представляет собой конспект лекций по психодиагностике. Подробное изложение материала делает доступным понимание данной дисциплины. Книга станет незаменимым помощником для тех, кто желает быстро подготовиться к экзамену и успешно его сдать.
Оглавление
ЛЕКЦИЯ № 1. Истоки психодиагностики
1. Экспериментальная психология. Работы В. Вундта, Ф. Гальтона, Г. Эббингауза, Д. Кеттелла
2. Дифференциальная психология. Возникновение тестирования как результат практических запросов медицины, педагогики и индустриализации производства
ЛЕКЦИЯ № 2. Метод тестов
1. Бихевиоризм как теоретическая основа тестирования. Поведение как совокупность реакций организма на стимулы. Работы Дж. М. Кеттела, А. Бине
2. Шкала Бине – Симона. Понятие «умственный возраст». Шкала Стэнфорд – Бине
3. Понятие об интеллектуальном коэффициенте (IQ). Работы В. Штерна
ЛЕКЦИЯ № 3. Возникновение группового тестирования
1. Требования практики (массовое обследование больших групп испытуемых)
2. Работы А. С. Отиса. Появление армейских тестов «Альфа» и «Бета»
3. Недостатки и ограничения тестов общих способностей
ЛЕКЦИЯ № 4. Тесты специальных способностей и достижений
1. Факторный анализ как теоретическая основа построения комплексных батарей тестов способностей
2. Двухфакторная теория способностей Ч. Спирмена
3. Многофакторная теория способностей Т. Л. Килли и Л. Л. Терстона
4. Тесты достижений
ЛЕКЦИЯ № 5. Основные виды диагностических методик
1. Опросники. Интроспекционизм как теоретическая основа метода. Работы Ф. Гальтона, А. Бине, Р. Вудвортса
2. Проективные техники. Ассоцианизм. Метод свободных словесных ассоциаций Ф. Гальтона. Психоанализ как теоретическая основа развития проективных методик. Работы Г. Роршаха (пятна Роршаха), X. Моргана и Г. Мюррея (ТАТ)
ЛЕКЦИЯ № 6. Отечественные работы в области психологической диагностики
1. Материалистическая основа в русской экспериментальной психологии. Труды И. М. Сеченова и И. П. Павлова. «Рефлексология» В. М. Бехтерева
2. Первые в России лаборатории экспериментальной психологии. Работа Г. И. Россолимо «Психологический профиль личности». «Научная характерология» А. Ф. Лазурского
3. Развитие психодиагностики и психотехники в советский период (20-30-е гг. ХХ в). «Измерительная шкала ума» А. П. Болтунова. Работы М. Ю. Сыркина. Педология. Постановление ЦК ВКП(б) «О педологических извращениях в системе наркомпросов»
ЛЕКЦИЯ № 7. Методы психодиагностики, их классификация
1. Операционализация и верификация – основные требования, предъявляемые к понятиям и методам психодиагностики
2. Бланковые, опросные, рисуночные и проективные психодиагностические методики. Сущность и частота встречаемости. Понятие об объективно-манипуляционных методиках
3. Общие критерии классификации психодиагностических методик. Понятие о научных и практических методиках
4. Ограничения, достоинства и недостатки различных типов психодиагностических методик
ЛЕКЦИЯ № 8. Метод тестов: достоинства и недостатки
1. Достоинства метода тестов
2. Недостатки метода тестов
ЛЕКЦИЯ № 9. Надежность психодиагностических методик
1. Определение. Факторы, влияющие на надежность методики. Стандартная ошибка измерения. Надежность измерения. Понятие о методе измерения ретестовой надежности
2. Стандартизация процедуры обследования. Взаимосвязь надежности и валидности
3. Надежность параллельных форм. Сущность, достоинства и недостатки
4. Надежность частей теста, ее определение методом расщепления. Уравнение Спирмена – Брауна. Определение коэффициента надежности с помощью формул Дж. Фланагана и Рюлона
ЛЕКЦИЯ № 10. Сущность валидности
1. Определения валидности
2. Важнейшие составляющие валидности
3. Основные типы валидности (диагностическая, прогностическая, эмпирическая, критериальная, конструктная, содержательная). Классификация типов валидности
4. Относительность деления валидности на типы. Понятие комплекса валидности. Обоснование необходимости периодической валидизации психодиагностических методик
ЛЕКЦИЯ № 11. Конструктная валидность
1. Сущность, методы характеристики конструктной валидности
2. Конвергентная и дискриминантная валидности
3. Факторная валидность
4. Дифференциальная валидность
5. Валидность по возрастной дифференциации
ЛЕКЦИЯ № 12. Содержательная валидность
1. Сущность, область применения. Этапы валидизации
2. Очевидная валидность
ЛЕКЦИЯ № 13. Критерий валидности
1. Определение. Основное психометрическое неравенство
2. Типы критериев валидности
3. Математическое выражение критерия валидности (коэффициент Гилфорда)
4. Основные схемы валидизации психодиагностических методик
ЛЕКЦИЯ № 14. Стандартизация тестов
1. Тестовые нормы
2. Корреляция качественных признаков
3. Ранговая корреляция
ЛЕКЦИЯ № 15. Измерительные шкалы
1. Номинативные шкалы
2. Порядковые шкалы
3. Метрические шкалы
ЛЕКЦИЯ № 16. Типы тестирования
1. Тестовая батарея
2. Миннесотский многоаспектный личностный опросник
3. Опросник «Шестнадцать личностных факторов»
4. Факторный анализ
5. Шкала «Проявления тревожности»
6. Личностные опросники Айзенка
7. Опросник самоотношения
8. Опросник уровня субъективного контроля
9. «Несуществующее животное»
10. «Нарисуй человека»
11. Тест тематической апперцепции
12. Тест Роршаха
13. Шкалы измерения интеллекта Векслера
14. Шкала памяти Векслера
15. Кубики Коса
16. Компьютерные тесты
17. Контрольные шкалы
18. «Завершение предложения»
19. Критериально-ориентированные тесты
ЛЕКЦИЯ № 17. Профессионально-этические принципы в психодиагностике
1. Принцип специальной подготовки и аттестации лиц, использующих психодиагностические методики
2. Принцип личной ответственности
3. Принцип ограниченного распространения психодиагностических методик (принцип профессиональной тайны)
4. Принцип обеспечения суверенных прав личности
5. Принцип объективности
6. Принцип конфиденциальности
7. Принцип психопрофилактического изложения результатов
ЛЕКЦИЯ № 18. Психологический диагноз
1. Кодирование тестовых оценок
2. Шкальные оценки
3. Заключение
ЛЕКЦИЯ № 1. Истоки психодиагностики
1. Экспериментальная психология. Работы В. Вундта, Ф. Гальтона, Г. Эббингауза, Д. Кеттелла
Психодиагностика
как особая научная дисциплина прошла значительный путь развития и становления. Рассмотрим основные этапы этого пути.
Психологическая диагностика выделилась из психологии и начала складываться на рубеже XX в. под воздействием требований практики. Ее возникновение было подготовлено несколькими направлениями в развитии психологии.
Первым ее источником стала экспериментальная психология, поскольку экспериментальный метод лежит в основе психодиагностических методик, разработка которых и составляет сущность психодиагностики. Психодиагностика выросла из экспериментальной психологии, а ее возникновение в 1850-1870-е гг. связано с возросшим влиянием естествознания на область психических явлений, с процессом «физиологизации» психологии, заключавшемся в переводе изучения особенностей человеческой психики в русло эксперимента и точных методов естественных наук. Первыми экспериментальными методами психологию снабдили другие науки, главным образом физиология.
Началом возникновения экспериментальной психологии условно считается 1878 г., так как именно в этом году Вильгельм Вундт
(1832–1920)
основал в Германии первую лабораторию экспериментальной психологии. В. Вундт, намечая перспективы построения психологии как цельной науки, предполагал разработку в ней двух непересекающихся направлений: естественно-научного, опирающегося на эксперимент, и культурно-исторического, в котором главную роль призваны играть психологические методы изучения культуры (психологии народов). По его теории, естественно-научные экспериментальные методы можно было применять только к элементарному, низшему уровню психики. Экспериментальному исследованию подлежат не сама душа, а только ее внешние проявления. Поэтому в его лаборатории изучались в основном ощущения и вызываемые ими двигательные акты – реакции, а также периферическое и бинокулярное зрение, цветоощущение и пр.
По образцу лаборатории В. Вундта создаются подобные экспериментальные лаборатории и кабинеты не только в Германии, но и в других странах (Франции, Голландии, Англии, Швеции, Америке).
Развивающаяся экспериментальная психология вплотную подошла к изучению более сложных психических процессов, таких как речевые ассоциации (метод свободных словесных ассоциаций Гальтона)
. Сразу же после публикации Ф. Гальтона в 1897 г. В. Вундт использовал ассоциативную методику в своей лаборатории, хотя и считал высшие функции не подлежащими эксперименту. Получаемые в опытах индивидуальные различия во времени реакции объяснялись характером ассоциаций, а не индивидуальными особенностями испытуемых.
Однако автором, создавшим первый, собственно психологический экспериментальный метод, был Герман Эббингауз
(1850–1909)
, который изучал законы памяти, используя для этого наборы бессмысленных слогов (искусственных сенсомоторных элементов речи, не имеющих конкретного значения). Он полагал, что полученные им результаты не зависели от сознания испытуемого, интроспекции (наблюдения индивида за тем, что происходит в его психике) и, следовательно, в большей степени удовлетворяли требованию объективности. Этим методом Эббингауз открыл путь экспериментальному изучению навыков.
Американский психолог Джеймс Кеттелл
(1860–1944)
исследовал объем внимания и навыки чтения. С помощью тахистоскопа (прибора, позволяющего предъявлять испытуемому зрительные стимулы на краткие отрезки времени) он определял время, необходимое для того, чтобы воспринять и назвать различные объекты – формы, буквы, слова и т. д. Объем внимания в его опытах составлял величину порядка пяти объектов. Проводя эксперименты с чтением букв и слов на вращающемся барабане, Кеттелл зафиксировал феномен антиципации («забегания» восприятия вперед).
Так, на рубеже XX в. в психологии утвердился объективный экспериментальный метод, который начал определять характер психологической науки в целом. С внедрением в психологию эксперимента и появлением благодаря этому новых критериев научности ее представлений создались предпосылки для зарождения знаний об индивидуальных различиях между людьми.
2. Дифференциальная психология. Возникновение тестирования как результат практических запросов медицины, педагогики и индустриализации производства
Дифференциальная психология стала еще одним источником развития психодиагностики. Вне представлений об индивидуально-психологических особенностях, которые являются предметом дифференциальной психологии, невозможно было бы возникновение психодиагностики как науки о методах их измерения.
Но дифференциально-психологическое изучение человека не было простым логическим развитием экспериментально-психологического. Оно складывалось под воздействием запросов практики, сначала медицинской и педагогической, а тем и индустриальной. Одной из основных причин, обусловивших зарождение психодиагностики, нужно считать выдвинутую врачебной практикой потребность в диагностике и лечении умственно отсталых и душевнобольных людей.
Одна из ранних публикаций, посвященных вопросам умственной отсталости, принадлежит французскому врачу Ж. Е. Д. Эскиролю
, стремившемуся дифференцировать разные степени умственной отсталости. Другой французский врач Э. Сеген
первым уделил внимание обучению умственно отсталых детей с помощью особых методик. Их работы внесли определенный вклад в разработку методов, помогавших определить умственную отсталость.
Между теоретическими положениями, развиваемыми в рамках общей психологии, и основами психодиагностики прослеживается тесная внутренняя взаимосвязь. Представления о закономерностях развития и функционирования психики являются отправным пунктом при выборе психодиагностической методологии, конструировании психодиагностических методик, их использовании в практике.
История психодиагностики – это и история появления основных психодиагностических методик, и развитие подходов к их созданию на основе эволюционирования взглядов о природе и функционировании психического.
В этой связи интересно проследить, как формировались некоторые важные психодиагностические методы в рамках основных школ психологии.
ЛЕКЦИЯ № 2. Метод тестов
1. Бихевиоризм как теоретическая основа тестирования. Поведение как совокупность реакций организма на стимулы. Работы Дж. М. Кеттела, А. Бине
Тестовые методы принято связывать с бихевиоризмом
. Методологическая концепция бихевиоризма основывалась на том, что между организмом и средой существуют детерминационные отношения. Организм, реагируя на стимулы внешней среды, стремится изменить ситуацию в благоприятную для себя сторону и приспосабливается к ней. Бихевиоризм ввел в психологию в качестве ведущей категорию поведения, понимая его как совокупность доступных объективному наблюдению реакций на стимулы. Поведение согласно бихевиористской концепции является единственным объектом изучения психологии, а все внутренние психические процессы должны быть интерпретированы по объективно наблюдаемым поведенческим реакциям. В соответствии с этими представлениями цель диагностики сводилась первоначально к фиксации поведения. Именно этим занимались первые психодиагносты, разработавшие метод тестов
(термин введен Ф. Гальтоном
).
Первым исследователем, употребившим в психологической литературе термин «интеллектуальный тест»
, был Дж . М. Кеттелл
. Этот термин после статьи Кеттелла «Интеллектуальные тесты и измерения», опубликованной в 1890 г. в журнале «Mind», приобрел широкую известность. В статье Кеттелл писал о том, что применение серии тестов к большому числу индивидов позволит открыть закономерности психических процессов и тем самым приведет к преобразованию психологии в точную науку. Вместе с тем он высказал мысль о том, что научная и практическая ценность тестов возрастет, если условия их проведения будут одинаковыми. Так впервые была провозглашена необходимость стандартизации
тестов, для того чтобы стало возможным сравнение их результатов, полученных разными исследователями на разных испытуемых. Дж. Кеттелл предложил в качестве образца 50 тестов, включавших различного рода измерения чувствительности, времени реакции, времени, затрачиваемого на называние цветов, количества звуков, воспроизводимых после однократного прослушивания, и др. Вернувшись в Америку после работы в лаборатории В. Вундта и чтения лекций в Кембридже, он немедленно стал применять тесты в устроенной им при Колумбийском университете лаборатории (1891). Вслед за Кеттеллом и другие американские лаборатории начали применять метод тестов. Возникла необходимость организовать специальные координационные центры по использованию этого метода. В 1895–1896 гг. в США были созданы два национальных комитета, призванных объединить усилия тестологов и придать общее направление тестологическим работам.
Первоначально в качестве тестов использовались обычные экспериментально-психологические испытания. По форме они походили на приемы лабораторного исследования, но смысл их применения был принципиально иным, ведь задачей психологического эксперимента является выяснение зависимости психического акта от внешних и внутренних факторов, например характера восприятия – от внешних раздражителей, запоминания – от частоты и распределения во времени повторений и т. д.
При тестировании психолог регистрирует индивидуальные различия психических актов, оценивая полученные результаты при помощи некоторого критерия и ни в коем случае не изменяя условий осуществления этих психических актов.
Метод тестов получил широкое распространение. Новый шаг в его развитии был сделан французским врачом и психологом А. Бине
(1857–1911)
, создателем самой популярной серии тестов.
До Бине определялись, как правило, различия в сенсомоторных качествах – чувствительности, быстроте реакции и т. д. Но практика требовала информации о высших психических функциях, обозначаемых обычно понятиями «ум», «интеллект». Именно эти функции обеспечивают приобретение знаний и успешное выполнение сложной приспособительной деятельности.
В 1904 г. министерство образования поручило Бине заняться разработкой методик, с помощью которых можно было бы отделить детей, способных к учению, но ленивых и не желающих учиться, от страдающих врожденными дефектами и не способных учиться в нормальной школе. Нужда в этом возникла в связи с введением всеобщего образования. Одновременно потребовалось создание специальных школ для умственно неполноценных детей. Бине в сотрудничестве с Анри Симоном
провел серию экспериментов по изучению внимания, памяти, мышления у детей разного возраста (начиная с 3 лет). Проведенные на многих испытуемых экспериментальные задания были проверены по статистическим критериям и стали рассматриваться как средство определения интеллектуального уровня.
2. Шкала Бине – Симона. Понятие «умственный возраст». Шкала Стэнфорд – Бине
Первая шкала (серия тестов) Бине – Симона
появилась в 1905 г. Затем она несколько раз пересматривалась авторами, которые стремились изъять из нее все задания, требующие специального обучения. Бине исходил из представления о том, что развитие интеллекта происходит независимо от обучения, в результате биологического созревания.
Шкала А. Бине
в последующих редакциях (1908 и 1911) была переведена на немецкий и английский языки. Вторая редакция шкалы (1908) отличалась тем, что в ней был расширен возрастной диапазон детей – до 13 лет, увеличено число задач и введено понятие умственного возраста. Самое широкое распространение получила вторая редакция шкалы Бине. Последняя (третья) редакция шкалы, опубликованная в год смерти Бине, не внесла существенных изменений.
Задания в шкалах Бине были сгруппированы по возрастам (от 3 до 13 лет). Для каждого возраста подбирались определенные тесты. Они считались соответствующими данной возрастной ступени, если их решало большинство детей данного возраста (80–90 %). Детям до 6 лет предлагали четыре задания, а детям старше 6 лет – шесть заданий. Задания подбирались путем исследования большой группы детей (300 человек).
Показателем интеллекта в шкалах Бине был умственный возраст, который мог расходиться с хронологическим. Умственный возраст определялся по успешности выполнения тестовых заданий. Испытание начиналось с предъявления тестовых заданий, соответствующих хронологическому возрасту ребенка. Если он справлялся со всеми заданиями, ему предлагались задания более старшей возрастной группы. Если он решал не все, а некоторые из них, испытание прекращалось. Если же ребенок не справлялся со всеми заданиями своей возрастной группы, ему давались задания, предназначенные для более младшего возраста. Испытания проводились до тех пор, пока не выявлялся возраст, все задания которого решались испытуемым. Максимальный возраст, все задания которого решаются испытуемым, называют базовым умственным возрастом. Если, кроме того, ребенок выполнял также некоторое количество заданий, предназначенных для более старших возрастных групп, то каждое задание оценивалось числом «умственных» месяцев. Тогда к числу лет, определяемых базовым умственным возрастом, прибавлялось и некоторое число месяцев. Пример: ребенок решил все задания, предназначенные для семилетнего возраста, и два задания, рассчитанные на восьмилеток. Число месяцев рассчитывается так: 12 мес.: 6 (число заданий для восьмилеток) = 2 мес. («цена» одного задания); 2 мес. ? 2 = = 4 мес. Итак, умственный возраст ребенка равен 7 годам и 4 мес.
Несовпадение умственного и хронологического возраста считалось показателем либо умственной отсталости (если умственный возраст ниже хронологического), либо одаренности (если умственный возраст выше хронологического).
Вторая редакция шкалы Бине
послужила основой работы по проверке и стандартизации, проведенной в Стэнфордском университете (США) коллективом сотрудников под руководством Л. М. Термена
. Этот вариант тестовой шкалы Бине был предложен в 1916 г. и имел так много серьезных изменений по сравнению с основным, что был назван шкалой Стэнфорд – Бине. Основных отличий от тестов Бине было два: введение в качестве показателя по тесту коэффициента интеллектуальности (IQ), определяющегося отношением между умственным и хронологическим возрастом, и применение критерия оценки тестирования, для чего вводилось понятие статистической нормы.
3. Понятие об интеллектуальном коэффициенте (IQ). Работы В. Штерна
Коэффициент IQ
был предложен В. Штерном
, считавшим существенным недостатком показателя умственного возраста то, что одна и та же разность между умственным и хронологическим возрастом для различных возрастных ступеней имеет неодинаковое значение. Чтобы устранить этот недостаток, Штерн предложил определять частное, получаемое при делении умственного возраста на хронологический. Этот показатель, умноженный на 100, он и назвал коэффициентом интеллектуальности. Используя этот показатель, можно классифицировать нормальных детей по степени умственного развития.
Другим нововведением стэнфордских психологов явилось использование понятия статистической нормы. Норма стала тем критерием, с которым можно было сравнивать индивидуальные тестовые показатели и тем самым оценивать их, давать им психологическую интерпретацию.
Шкала Стэнфорд – Бине была рассчитана на детей в возрасте от 2,5 до 18 лет. Она состояла из заданий разной трудности, сгруппированных по возрастным критериям. Для каждого возраста наиболее типичный, средний показатель выполнения (х) был равен 100, а статистическая мера рассеяния, отклонения индивидуальных значений от этого среднего (а) равнялась 16. Все индивидуальные показатели по тесту, попадавшие в интервал х ± а, т. е. ограниченные числами 84 и 116, считались нормальными, соответствующими возрастной норме выполнения. Если тестовый показатель был выше тестовой нормы (более 116), ребенок считался одаренным, а если ниже 84 – умственно отсталым.
Шкала Стэнфорд – Бине получила популярность во всем мире. Она имела несколько редакций (1937, 1960, 1972, 1986). В последней редакции она применяется и в настоящее время. Показатель IQ, получаемый по шкале Стэнфорд – Бине, на долгие годы стал синонимом интеллекта. Вновь создаваемые интеллектуальные тесты стали проверяться на валидность путем сопоставления с результатами шкалы Стэнфорд – Бине.
ЛЕКЦИЯ № 3. Возникновение группового тестирования
1. Требования практики (массовое обследование больших групп испытуемых)
Следующий этап развития психологического тестирования характеризуется изменением формы проведения тестового испытания. Все тесты, созданные в первом десятилетии XX в., были индивидуальными и позволяли вести опыт только с одним испытуемым. Использовать их могли лишь специально подготовленные люди, имевшие достаточно высокую психологическую квалификацию.
Эти особенности первых тестов ограничивали их распространение. Практика же требовала тестировать большие массы людей с целью отбора наиболее подготовленных к тому или иному виду деятельности, а также распределения по разным видам деятельности людей в соответствии с их индивидуальными особенностями. Поэтому в США в период Первой мировой войны появилась новая форма тестовых испытаний – групповое тестирование.
2. Работы А. С. Отиса. Появление армейских тестов «Альфа» и «Бета»
Необходимость как можно быстрее отобрать и распределить полуторамиллионную армию рекрутов по различного рода службам, школам и училищам заставила специально созданный комитет поручить А. С. Отису
разработку новых тестов. Так появились две формы армейских тестов – «Альфа» и «Бета». Первая предназначалась для работы с людьми, знающими английский язык, вторая – для неграмотных и иностранцев. После окончания войны эти тесты и их модификации продолжали широко применять.
Групповые (коллективные) тесты не только делали реальными испытания больших групп, но наряду с этим допускали упрощение инструктирования, процедуры проведения и оценки результатов тестирования. К тестированию начали привлекаться люди, не имевшие настоящей психологической квалификации, а всего лишь обученные проведению тестовых испытаний.
В то время как индивидуальные тесты, такие как шкала Стэнфорд – Бине, в основном применялись в клинике и для консультирования, групповые тесты использовались преимущественно в системе образования, промышленности и армии. 1920-е гг. характеризовались настоящим тестовым бумом. Быстрое и широкое распространение тестологии было обусловлено прежде всего ее направленностью на оперативное решение практических задач. Измерение интеллекта с помощью тестов рассматривалось как средство, позволяющее научно, а не эмпирически подойти к вопросам обучения, профотбора, оценки достижений и т. д.
3. Недостатки и ограничения тестов общих способностей
На протяжении первой половины XX в. специалистами в области психологической диагностики было создано множество разнообразных тестов. При этом, разрабатывая методическую сторону тестов, они доводили ее до совершенства. Все тесты тщательным образом стандартизировались на больших выборках; тестологи добивались того, что все они отличались высокой надежностью и хорошей валидностью. Тем не менее им свойственны те недостатки, которые были перечислены при описании тестов Бине.
Валидизация выявила ограниченные возможности тестов интеллекта: прогнозировать на их основе успешность выполнения конкретных, достаточно узких видов деятельности часто не удавалось. Требовалась, помимо знания общего уровня интеллекта, дополнительная информация об особенностях психики человека. Так возникло новое направление в тестологии – тестирование специальных способностей, которое вначале призвано было лишь дополнить оценки тестов интеллекта, а впоследствии выделилось в самостоятельную область.
ЛЕКЦИЯ № 4. Тесты специальных способностей и достижений
1. Факторный анализ как теоретическая основа построения комплексных батарей тестов способностей
Толчком для развития тестов специальных способностей стало мощное развитие профессионального консультирования, а также профессионального отбора и распределения персонала в промышленности и военном деле. Стали появляться тесты механических, канцелярских, музыкальных, артистических способностей. Создавались тестовые батареи
(комплекты) для отбора поступающих в медицинские, юридические, инженерные и другие учебные заведения. Были разработаны около дюжины комплексных батарей способностей для использования в образовании, при консультировании и распределении персонала. Различаясь составом, методическими качествами, они сходны в одном – их характеризует низкая дифференциальная валидность. Учащиеся, выбирающие разные области образования или профессиональной деятельности, незначительно различаются своими тестовыми профилями.
Теоретической основой для построения комплексных батарей тестов способностей стало применение особой техники обработки данных об индивидуальных различиях и корреляций между ними – факторного анализа. Факторный анализ позволял точнее определить и классифицировать специальные способности.
2. Двухфакторная теория способностей Ч. Спирмена
Английский психолог Чарльз Спирмен
в 1904 г. пришел к выводу, что положительная корреляция между тестами на различные способности (например, математические и литературные) выявляет некоторый общий генеральный фактор. Он обозначил его буквой «g» (от англ. general – «общий»). Помимо фактора, общего для всех видов деятельности, в каждой из них обнаруживается специфический фактор, свойственный только данному виду деятельности (S-фактор).
Теорию Ч. Спирмена называют двухфакторной
. Согласно ее положениям целью психологического тестирования должно быть измерение g у индивидов. Если такой фактор проявляется во всех изучаемых психических функциях, то его наличие является единственным основанием для предсказания поведения индивида в разных ситуациях. Измерение же специфических факторов смысла не имеет, поскольку они могут обнаружить себя только в даной ситуации.
Спирмен не отрицал того, что двухфакторная теория требует уточнения. Если сравниваемые виды деятельности похожи, то в какой-то степени их корреляция может быть результатом не только фактора g, но и некоторого промежуточного фактора – не столь общего, как g, но и не столь специфичного, как S. Такой фактор, свойственный только части видов деятельности, был назван групповым.
Позднее распространилась точка зрения, согласно которой структуру свойств составляет ряд достаточно широких групповых факторов, каждый из которых может в разных тестах иметь различный вес. Например, вербальный фактор может иметь больший вес в тесте на словарный запас, меньший – в тесте словесных аналогий и совсем незначительный – в тесте на математическое мышление. Корреляции тестов между собой являются результатом нагруженности их групповым фактором.
3. Многофакторная теория способностей Т. Л. Килли и Л. Л. Терстона
Американские психологи Т. Л. Килли
и Л. Л. Терстон
, продолжив работы факторно-аналитического направления, занялись проблемами групповых факторов. Их основные работы вышли в 1920-1930-е гг.
Терстон, основываясь на многочисленных исследованиях, выделил двенадцать факторов, которые он обозначил как «первичные умственные способности»
. Среди них можно назвать следующие: словесное понимание, беглость речи, числовой фактор, пространственный фактор, ассоциативная память, скорость восприятия, индукция (логическое мышление) и др. Дальнейшие исследования привели к увеличению факторов. Число когнитивных факторов, описанных на сегодняшний день, равно ста двадцати.
На основе факторных исследований создавались многофакторные батареи тестов способностей, позволяющие измерять индивидуальный уровень каждой из способностей. Наиболее известна среди них – Батарея тестов общих способностей (GATB)
, включающая тесты способностей для конкретных профессий.
Современное понимание факторного анализа вносит некоторые изменения в ту его трактовку, которая была в 1920-1940-е гг. Факторный анализ – это высшая ступень линейных корреляций. Но линейные корреляции не могут считаться универсальной формой выражения математической связи между психическими процессами. Следовательно, отсутствие линейных корреляций не может толковаться как отсутствие связи вообще, то же относится и к невысоким коэффициентам корреляции. Поэтому факторный анализ и добываемые посредством этого анализа факты не всегда верно отражают зависимости между психическими процессами.
Но, пожалуй, главное, что вызывает сомнение, это понимание так называемых специальных способностей. Эти способности трактуются не как индивидуальные особенности, возникшие в результате влияния требований общества на индивида, а как особенности, исконно присущие данной индивидуальной психике. Такая трактовка порождает массу логических трудностей. В самом деле, откуда вдруг сложились и проявились у современного индивида такие способности, о которых даже представления не имели предшествующие поколения? Нельзя же думать, что в психике таятся способности, пригодные для всех грядущих общественных требований. Но техника факторного анализа принимает эти способности как некую данность; в действительности же они суть психические образования, находящиеся в динамике.
Сказанное убеждает в том, что к возможностям факторного анализа нужно относиться с большой осторожностью и не считать этот анализ универсальным инструментом изучения психики.
4. Тесты достижений
Наряду с тестами интеллекта, специальных и комплексных способностей возник и еще один тип тестов, широко применяемых в учебных заведениях, – тесты достижений. В отличие от тестов интеллекта они отражают не столько влияние многообразного накопленного опыта, сколько влияние специальных программ обучения на эффективность решения тестовых заданий. История развития этих тестов может быть прослежена с момента смены в Бостонской школе устной формы экзаменов на письменную (1845). В Америке тесты достижений начали использоваться при отборе сотрудников на государственную службу уже с 1872 г., а с 1883 г. их применение стало регулярным. Наиболее значительная разработка элементов техники конструирования тестов достижений была выполнена в течение Первой мировой войны и сразу после нее. Тесты достижений относятся к наиболее многочисленной группе диагностических методик. Одним из наиболее известных и широко применяемых до сих пор тестов достижений является Стэндфордский тест достижений (SAT)
, впервые опубликованный в 1923 г. С его помощью оценивается уровень обученности в разных классах средних учебных заведений. Значительное число тестов специальных способностей и достижений было создано в рамках психотехники под воздействием практических запросов со стороны промышленности и экономики. Дальнейшее развитие тестов достижений привело к появлению в середине XX в. критериально-ориентированных тестов
.
ЛЕКЦИЯ № 5. Основные виды диагностических методик
1. Опросники. Интроспекционизм как теоретическая основа метода. Работы Ф. Гальтона, А. Бине, Р. Вудвортса
Особое направление в психологической диагностике связано с разработкой различных методов диагностики личности. С этой целью используются чаще всего не тесты, а особые методы, среди которых выделяются прежде всего опросники и проективная техника.
Опросники, вероятно, являются самыми первыми психодиагностическими методами, заимствованными психологами из естествознания (опросники использовал, например, Ч. Дарвин)
. Опросники
– это большая группа методик, задания которых представлены в виде вопросов или утверждений, а задачей испытуемого является самостоятельное сообщение некоторых сведений о себе в виде ответов. Теоретической основой этого метода можно считать интроспекционизм. Возникший в глубокой древности в рамках религиозной идеологии, он содержал тезис о непознаваемости духовного мира, невозможности объективного изучения психических явлений. Отсюда вытекало предположение, что, кроме самонаблюдения, нет иных способов изучения сознания человека. Метод опросников можно рассматривать в качестве разновидности самонаблюдения (так, например, считал А. Бине
).
Появление первых психодиагностических опросников связано с именем Ф. Гальтона
, который использовал их не для изучения личностных качеств, а для оценки познавательной сферы человека (особенностей зрительного восприятия, умственных образов). В конце ХIХ в. с помощью метода опросников проводились исследования памяти (А. Бине
, Ж. Куртье)
, общих понятий (Т. А. Рибо)
, внутренней речи (Ж. Сен-Поль
) и др. Отпечатанные опросники обычно рассылались по адресам будущих респондентов, иногда их печатали в журналах.
Прототипом личностных опросников был разработанный американским психологом Робертом Вудвортсом
в 1919 г. Бланк данных о личности
. Этот опросник был предназначен для выявления и отсеивания с военной службы лиц с невротической симптоматикой. За прошедшие с того времени десятилетия опросники получили широчайшее распространение в качестве психодиагностического метода исследования личности.
2. Проективные техники. Ассоцианизм. Метод свободных словесных ассоциаций Ф. Гальтона. Психоанализ как теоретическая основа развития проективных методик. Работы Г. Роршаха (пятна Роршаха), X. Моргана и Г. Мюррея (ТАТ)
Другим известным методом диагностики личности являются проективные техники
. Их родоначальником традиционно считается метод словесных ассоциаций, возникший на базе ассоцианистских теорий. Ассоцианистская концепция в качестве ведущего принципа организации сознания человека использовала ассоциацию, понятие которой ведет свое происхождение от Аристотеля. Как целостная система ассоцианизм возник в XVIII в., хотя некоторые его принципы были открыты раньше.
Впервые ассоциация превращается в универсальную категорию, объясняющую всю психическую деятельность, у английского врача Давид Гартли
(1705–1757)
. Согласно его теории идеи связаны между собой в соответствии с порядком и связью материальных процессов, происходящих в нервной системе. Детерминирующими факторами ассоциации Гартли считал смежность во времени и частоту повторений.
Помимо материалистического ассоцианизма, в XVIII в. развивался субъективно-идеалистический ассоцианизм в учениях Дж . Беркли
и Д. Юма
. Согласно их представлениям связь идей дана внутри самих элементов сознания и не требует никакой реальной основы. Их появление у человека подчиняется универсальным законам ассоциации, определяемым правилами самого сознания.
Возникновение метода свободных словесных ассоциаций
связано с именем Френсиса Гальтона
(1822–1911). В 1879 г. он опубликовал результаты своих ассоциативных экспериментов. Предлагая испытуемому отвечать на слово-раздражитель первой пришедшей в голову словесной ассоциацией, Гальтон составлял списки из 75 слов и по очереди открывал их перед испытуемым (иногда он сам выступал в качестве такового). С помощью секундомера он фиксировал время ответа. Позднее эта методика получила развитие в исследованиях Э. Крепелина
(1892)
, К. Юнга
(1906)
, Г. Кента
и А. Розанова
(1910)
и др.
Как интерпретируются результаты этой методики? Большинство исследователей сегодня склонны рассматривать ассоциативный эксперимент в качестве приема для изучения интересов и установок личности. Однако следует отметить, что интерпретация получаемых результатов определяется теоретическими взглядами исследователей. Поэтому вопрос о валидности методики не может быть решен однозначно вне соотнесения с теоретическими позициями ее создателей.
Ассоциативный эксперимент стимулировал появление такой группы проективных методик, как «Завершение предложений»
. Впервые для изучения личности «Завершение предложений» было использовано А. Пейном
в 1928 г.
Кроме ассоцианизма, теоретические истоки проективных методов можно искать в психоанализе, ставящем во главу угла понятие бессознательного. Бессознательное принималось первоначально как скрытый двигатель личности, мотив, слепо действующий из таинственных глубин организма. Разум по отношению к бессознательному служит маскировочным механизмом. Для того чтобы прорваться в область бессознательного, понять скрытые в нем тенденции, необходимо было в эксперименте направить сознание на решение особых заданий, которые позволили бы непроизвольно проявиться бессознательному в личности. Такого типа задания и включались в проективные методики.
Одна из самых популярных проективных методик была разработана в 1921 г. швейцарским психиатром Германом Роршахом
. Создавая эту методику, Роршах экспериментировал с большим количеством чернильных пятен, которые он предъявлял различным группам психически больных. В результате его наблюдений те характеристики ответов, которые можно было соотнести с различными психическими заболеваниями, постепенно объединялись в систему показателей. В дальнейшем эта методика использовалась и квалифицировалась многими исследователями как у нас, так и за рубежом.
Еще одна из старейших и наиболее распространенных в мире методик – Тест тематической апперцепции – ТАТ
. ТАТ был создан в 1935 г. Х. Морган
и Г. Мюрреем
. Стимульный материал ТАТ состоит из таблиц с изображениями неопределенных, допускающих неоднозначные толкования ситуаций. Испытуемому предлагается придумать небольшую историю о том, что привело к ситуации, изображенной на картине, и как она будет развиваться. В настоящее время существует множество модификаций ТАТ, известны разные подходы к анализу и интерпретации данных. Понятие проекции для обозначения подобных методик было впервые использовано Л. Франком
в 1939 г.
К началу 1940-х гг. диагностика с помощью проективных методик стала очень популярной на Западе. Ныне она занимает лидирующее положение в зарубежных исследованиях личности, несмотря на критическое отношение к данным, получаемым с помощью проективных методик. Критические замечания в адрес этих методик большей частью сводятся к указаниям на их недостаточную стандартизацию, пренебрежение нормативными данными, неподатливость традиционным способам определения надежности и валидности, а главное – на субъективизм в интерпретации результатов.
Завершая краткий обзор истории развития и становления психологической диагностики на Западе, отметим, что она отличается широким разнообразием используемых методик как в отношении формы, так и их содержания. Возникновение психологической диагностики вызвано требованиями практики, а ее развитие направлено на удовлетворение этих требований. С этим связано появление не всегда теоретически обоснованных, но методически совершенных приемов и способов диагностирования.
ЛЕКЦИЯ № 6. Отечественные работы в области психологической диагностики
1. Материалистическая основа в русской экспериментальной психологии. Труды И. М. Сеченова и И. П. Павлова. «Рефлексология» В. М. Бехтерева
Особенностью развития психологии в последней четверти XIX в. было внесение в нее экспериментальных методов исследования. Эта черта характерна и для русской психологии того времени. Обычно в психологии период развития экспериментальных методов определяется работами Вильгельм Вундта и его школы. Между тем изучение истории русской психологии показывает, что и в ней развивались экспериментальные работы, причем шли преимущественно в материалистическом направлении. Этим отечественные исследования по экспериментальной психологии отличались от работ школы Вильгельм Вундта. Как уже говорилось, в этой школе собственно психические явления предлагалось изучать при помощи самонаблюдения, а объективный экспериментальный метод применять только к физиологическим и низшим психическим процессам.
В противоположность вундтовской психологии многие экспериментальные исследования в русской психологии проводились под знаком материалистических идей
. У истоков этого направления находились два величайших корифея науки – И. М. Сеченов
(1829–1905)
и И. П. Павлов
(1849–1936)
.
В трудах Сеченова начиная с 1863 г. последовательно формируется материалистическое понимание психической деятельности. Изучая материальный субстрат психических процессов – мозг, Сеченов предложил рефлекторную теорию психической деятельности. Продолжателем его дела был И. П. Павлов, создавший теорию условных рефлексов и проложивший путь от объективных исследований по функциональной физиологии центральной нервной системы к изучению материальных основ психических явлений.
Взгляды Сеченова и Павлова оказали решающее воздействие на мировоззрение видного представителя естественнонаучного направления в психологии В. М. Бехтерева
. Вся рефлексология В. М. Бехтерева была реализацией рефлекторной теории Сеченова. Бехтерев стремился выявить связь психической деятельности с мозгом, нервными процессами, называл психические процессы невропсихикой. По его мнению, изучение психики не может быть ограничено одной ее субъективной стороной. Бехтерев утверждал, что «нет вообще ни одного сознательного или бессознательного процесса мысли, который не выражался бы рано или поздно объективными проявлениями» (Бехтерев В. М. Объективная психология и ее предмет // Вестник психологии. 1904. № 9-10. С. 730). Он утверждал, что объективная психология должна пользоваться только объективным методом и характеризовать психический процесс только с его объективной стороны.
Сочетая в себе талант психолога, физиолога, психиатра и невролога-клинициста, Бехтерев был вместе с тем и выдающимся организатором психологической науки, одним из руководителей ее прогрессивного крыла. Возглавив Психоневрологический институт в Петербурге, он собрал в нем коллектив исследователей, выполнивших ряд работ экспериментального характера.
Вместе с тем при всей прогрессивности борьбы Бехтерева за объективные методы исследования против субъективистской психологии он не мог преодолеть отношения к психическим процессам как к эпифеноменам (побочным, сопутствующим явлениям, не оказывающим влияния на основной процесс) актов поведения и, протестуя против метафизических понятий («память», «чувства», «внимание»), неправомерно игнорировал те реальные процессы, которые находят отражение в них.
2. Первые в России лаборатории экспериментальной психологии. Работа Г. И. Россолимо «Психологический профиль личности». «Научная характерология» А. Ф. Лазурского
Первая в России экспериментальная психологическая лаборатория
открылась в 1885 г. при клинике нервных и душевных болезней Харьковского университета; были устроены лаборатории опытной психологии в Петербурге, Дерпте. В 1895 г. по инициативе крупнейшего русского психиатра С. С. Корсакова
была создана психологическая лаборатория при психиатрической клинике Московского университета. Заведовать ею стал ближайший помощник Корсакова – А. А. Токарский
. Во всех этих лабораториях работали врачи-невропатологи и психиатры, совмещавшие свои психологические исследования с врачебной практикой в клинике, а также студенты-медики. Исключение составляла психологическая лаборатория в Новороссийском университете (в Одессе). В отличие от других она была создана на историко-филологическом факультете профессором философии Н. Н. Ланге
.
Центральной в экспериментальных исследованиях, проводившихся в психологических лабораториях, была проблема зависимости психики от мозга и внешнего мира. Исследовательская работа была тесно связана с медицинской практикой и служила целям диагностики психических и нервных заболеваний.
В этих исследованиях изучались объективные признаки тех или иных психических явлений (например, изменение пульса и дыхания как отражение эмоций), доказывалась предметность, объективность наших восприятий, выяснялась зависимость памяти и внимания от условий опыта и т. д. Кроме того, во всех экспериментальных лабораториях проводились исследования скорости протекания психических процессов.
Итак, во второй половине XIX в. в отечественную психологию был введен эксперимент
. Но для возникновения психологической диагностики необходимо было, кроме того, чтобы практике потребовалось знание об индивидуально-психологических особенностях человека. Первые отечественные работы по психологической диагностике выполнялись в первые десятилетия XX в.
Вероятно, одна из первых значительных дореволюционных отечественных работ по психологическому тестированию, представляющая законченное самостоятельное исследование, была выполнена Г. И. Россолимо
в 1909 г. в Московском университете. Г. И. Россолимо, крупнейший невропатолог и психиатр, поставил своей целью найти метод количественного исследования психических процессов в нормальном и патологическом состояниях. По существу этот метод, получивший широкую известность как в России, так и за рубежом, был одной из ранних оригинальных систем тестов для измерения умственной одаренности. Эта система обследования, названная методикой индивидуального психологического профиля, сводилась к определению одиннадцати психических процессов, которые оценивались по десятибалльной системе на основании ответов на 10 достаточно произвольно подобранных вопросов. Устанавливалась сила прирожденного ума («первичного ума»), который как некое устойчивое качество противопоставлялся «вторичному уму», непрерывно совершенствующемуся под влиянием внешних воздействий. Психические процессы, измеряемые методикой Россолимо, в целом составляли также три группы, как внимание и воля, точность и прочность восприятия, ассоциативная деятельность. Он предложил графическую форму представления измерений психических процессов – вычерчивание психологического профиля, который наглядно демонстрировал соотношение указанных процессов. Отличительная особенность метода психологического профиля – его независимость от возраста испытуемого. Форма профиля оказалась надежным критерием для диагностики умственной отсталости.
Труды Россолимо были с интересом встречены как психологами, так и психиатрами, специализировавшимися на проблемах умственной отсталости. Подобные профили с того времени прочно вошли в психологическую диагностику.
Интересно мнение П. П. Блонского
, высказанное по поводу методики определения психологического профиля: высоко оценивая эту методику, он признает работу Г. И. Россолимо наиболее удачной среди всех отечественных работ, так как в ней отобраны очень показательные для умственного развития тесты. Положительным в исследованиях Россолимо было, считает П. П. Блонский, также и то, что в отличие от западного тестирования он стремился к целостной оценке личности, синтетическому способу изображения ее сильных и слабых сторон. Лишь впоследствии синтетический способ исследования личности, к которому стремился Россолимо, начал укрепляться в психологической диагностике на Западе и в США.
Еще один русский психолог, придерживавшийся сходных взглядов на изучение личности, А. Ф. Лазурский
, примерно в то же время создал новое направление в дифференциальной психологии – научную характерологию. Строго придерживаясь опыта и эксперимента как основных методов исследования, он в то же время стоял за создание научной теории индивидуальных различий. Основной целью дифференциальной психологии он считал «построение человека из его наклонностей», а также разработку возможно более полной естественной классификации характеров.
Неудовлетворенность лабораторно-экспериментальными методами побудила Лазурского искать другие методы. Он выступает за естественный эксперимент, при котором преднамеренное вмешательство исследователя в жизнь человека совмещается с естественной и сравнительно простой обстановкой опыта. Благодаря этому, по мнению Лазурского, удается исследовать не отдельные психические процессы, как это обычно делается, а психические функции и личность в целом.
Важным в теории Лазурского было положение о теснейшей связи свойств характера с нервными процессами. Причем это было не воскрешение галлевской френологии (локализация способностей в виде внешне выраженного развития отдельных обособленных участков больших полушарий), а объяснение свойств личности нейродинамикой корковых процессов. Итак, научная характерология Лазурского строилась как опытная наука, опирающаяся на естественный эксперимент и изучение нейродинамики корковых процессов. Не придавая вначале значения количественным методам оценки психических процессов, используя только качественные методы, он позднее ощутил недостаточность последних и попытался использовать графические схемы для определения способностей ребенка. Но работы в этом направлении были не закончены им, помешала преждевременная кончина исследователя (1917).
3. Развитие психодиагностики и психотехники в советский период (20-30-е гг. ХХ в). «Измерительная шкала ума» А. П. Болтунова. Работы М. Ю. Сыркина. Педология. Постановление ЦК ВКП(б) «О педологических извращениях в системе наркомпросов»
С развитием дифференциально-психологических исследований психология в целом обогатилась рядом новых методов и подходов. Стали вполне осуществимы ее связи с практикой. Все это послужило основой для возникновения психологической диагностики. Собственно психодиагностические работы в России за малым исключением начали развиваться в послереволюционный период. Особенно много таких работ появилось в 1920-1930-е гг. в области педагогики, медицины, педологии. Подавляющее большинство методик были копированием западных психологических тестов. Незначительные отличия проявлялись в формах проведения тестовых испытаний, обработке и интерпретации экспериментального материала.
Определенный интерес с точки зрения развития новых форм тестирования представляет «Измерительная шкала ума» Болтунова
(1928), положившего в основу своей работы шкалу Бине – Симона, переведенную и адаптированную П. П. Соколовым
для испытания умственной одаренности русских школьников. По сути дела, шкала Болтунова представляет собой самостоятельную разработку нового набора тестов. Несмотря на известную аналогию со шкалой Бине – Симона, шкала Болтунова имеет специфические особенности: в ней модифицировано большинство заданий, введены совершенно новые задания, предложена новая инструкция и форма ее использования, определено время решения тестовых заданий, разработаны показатели возрастных ступеней. Принципиальное отличие шкалы Болтунова от шкалы Бине – Симона состоит в возможности проводить групповые испытания. И тем не менее данная работа типична для традиционного психологического тестирования. В ней сильно сказывается утилитарный механистический подход к использованию диагностических методик.
Этот подход характеризовался стремлением внедрить в обработку тестов методы вариационной статистики и вместе с тем тщательно отработать приемы формализации в обработке результатов. Изучению же содержательной стороны диагностируемых психологических процессов не уделялось сколько-нибудь серьезного внимания. В этом отношении психодиагностические исследования в России были определенным отступлением от традиций русской психологии, всегда стремившейся к теоретической и методологической проработке своей экспериментатики.
Работы по тестированию детей, по сути дела заменили поиск теоретических установок и перспектив совершенствования техники эксперимента и математического анализа. Вместо изучения содержательной стороны психологического тестирования тестологи лишь тщательно отрабатывали приемы формализации и обработки результатов.
Особое место в отечественных тестологических исследованиях занимают работы М. Ю. Сыркина
, специально изучавшего проблему сопряженности показателей тестов одаренности и признаков социального положения (факт, установленный еще в первых работах Бине). Связь между особенностями речевого развития и результатами тестирования к тому времени была доказана экспериментально (уже самые первые работы тестологов фиксировали эту зависимость). Однако с течением времени социальный аспект существования интеллектуальных различий между слоями и классами общества для тестологии становился все более острым и значимым.
В этом отношении чрезвычайно важны работы Сыркина, поскольку в отечественных исследованиях по психологическому тестированию он первый доказал, сколь противоречивой является тестовая диагностика индивидуальных различий, допускающая прямо противоположную интерпретацию результатов исследования. Самостоятельные экспериментальные работы Сыркина показывают, что между тестовыми оценками и социальными признаками испытуемых имеется линейная форма связи, в некоторых случаях достаточно тесная, к тому же обладающая высокой временной стабильностью.
В 1920-е гг. в нашей стране значительное развитие получила психология труда и психотехника (труды И. Н. Шпильрейна
, С. Г. Геллерштейна
, Н. Д. Левитова
, А. А. Толчинского
и др.). В рамках этих отраслей психологии развивалась психодиагностика, результаты которой нашли применение в ряде направлений народного хозяйства, прежде всего в промышленности, транспорте, в системе профессионального обучения.
Во многих городах страны работали психотехнические лаборатории, готовились кадры психотехников, было создано Всесоюзное общество по психотехнике и прикладной психофизиологии, издавался журнал «Советская психотехника» (1928–1934), проводились психотехнические конференции и съезды.
Как особая отрасль отечественной психологии психотехника организационно оформляется к 1927–1928 гг. Ею много сделано в области поисков рациональных методов психотехнического и профессионального обучения, организации трудового процесса, формирования профессиональных навыков и умений.
Вместе с тем психотехника подвергалась критике, в особенности за формальное использование некоторых теоретически не обоснованных тестов. Результатом этого стало свертывание работ по психотехнике к середине 1930-х гг.
Отрицательное отношение к психотехнике усилилось в период повсеместно развернувшейся критики педологии, с которой у нее было много общего.
Педология была задумана как комплексная наука, занимающаяся целостным, синтетическим изучением детей. Но научный синтез данных психологии, физиологии, анатомии и педагогики не был осуществлен в рамках педологии.
Претендуя на роль единственной «марксистской науки о детях», педология механистически понимала влияние двух факторов (среды и наследственности), определяющих процесс развития психики, сводила качественные особенности развивающегося человека к биологической характеристике, увлекалась применением тестов, рассматривая их как средство измерения умственной одаренности и метод отбора умственно отсталых детей.
В этой связи в начале 1930-х гг. началась принципиальная критика многих положений педологии, завершившаяся постановлением ЦК ВКП(б) от 4 июля 1936 г. «О педологических извращениях в системе наркомпросов».
Развернувшаяся в этот период резкая критика педологии сопровождалась отрицанием всего положительного, что было сделано учеными, так или иначе связанными с педологией, в области психологии и психологической диагностики.
Постановлением был наложен запрет на применение тестов в школе. По сути дела этим были прекращены все психодиагностические исследования. Понадобилось около 40 лет, чтобы это направление исследований было полностью восстановлено в своих правах. Лишь в конце 1960-х гг. вновь начинают появляться работы по психологической диагностике.
Подводя итог рассмотрению отечественных работ в области психодиагностики, следует отметить, что, несмотря на большое количество вторичных исследований, копирующих западные, в истории имелись и интересные самостоятельные работы, пытающиеся решить научно-методологические проблемы диагностики.
ЛЕКЦИЯ № 7. Методы психодиагностики, их классификация
1. Операционализация и верификация – основные требования, предъявляемые к понятиям и методам психодиагностики
В настоящее время созданы и практически используются методы психодиагностики, которые охватывают все известные науке психологические процессы, свойства и состояния человека. Создание, описание и научное признание права на существование новых научных понятий и соответствующих им явлений идет рука об руку с разработкой пригодных для их экспериментального изучения психодиагностических средств. Дело в психологии как науке поправляется по той причине, что в начале XX в. в ней были официально признаны и приняты те требования, которые к понятиям и методам исследования предъявляют в наиболее развитых современных науках, в частности физике. Это требования операционализации и верификации.
Под операционализацией
понимается требование, согласно которому при введении новых научных понятий обязательно необходимо четко указывать на конкретные процедуры, приемы и методы, с помощью которых можно практически удостовериться в том, что явление, описанное в понятии, действительно существует. Операционализация предполагает указание на практические действия или операции, которые может выполнить любой исследователь, чтобы убедиться в том, что определенное в понятии явление обладает именно теми свойствами, которые ему приписываются.
Требование верификации
означает, что всякое новое понятие, вводимое в научный оборот и претендующее на получение статуса научного, обязательно должно пройти проверку на его непустоту. Последнее предполагает наличие методики экспериментальной диагностики того явления, которое описано в данном понятии. Слово «верификация» буквально обозначает «проверка». Эта проверка непустоты понятия, т. е. реальности существования явления, определяемого этим понятием, должна быть осуществлена при помощи соответствующей психодиагностической процедуры.
Если, например, мы вводим в научный оборот понятие «мотив», то сначала необходимо дать точное определение этого понятия через известные другие понятия и доступные способы диагностики явлений, входящих в содержание данного понятия (oперационализация). Допустим, что таким определением является следующее: «Мотив – это внутренний, психологический, осознанный или неосознаваемый побудительный источник действий человека, придающий им целенаправленность и поддерживающий их активность». (Предполагается, что нам уже известно, что такое «побудительный источник», «осознанный или неосознаваемый», и «активность», в противном случае необходимо было бы дополнить общее определение мотива частными определениями данных понятий, вести эту работу до тех пор, пока в определяющей части всех понятий не останется ни одного термина, требующего дополнительного разъяснения.) На следующем этапе операционализации понятия «мотив» мы обязаны были бы предложить психодиагностическую методику, с помощью которой можно было бы удостовериться в том, что то, что утверждается в определяющейся части данного понятия, действительно существует. На заключительном этапе мы должны были бы осуществить практическую проверку существования явления «мотив» во всех приписанных ему в определении свойствах. Таким образом, как операционализация, так и верификация понятий требуют обращения к психодиагностике, но только операционализация предполагает теоретический, а верификация – практический шаг на этом пути.
2. Бланковые, опросные, рисуночные и проективные психодиагностические методики. Сущность и частота встречаемости. Понятие об объективно-манипуляционных методиках
Большинство созданных и применяемых практических психодиагностических методик представляют так называемые бланковые методики
– такие, в которых испытуемому предлагают серию суждений или вопросов, на которые он должен в устной или письменной форме дать ответ. По полученным ответам испытуемого, в свою очередь, судят о психологии того человека, который эти ответы предложил. Широкая распространенность и практический интерес к бланковым методикам объясняются тем, что они относительно просты как для разработки, так и для использования и обработки получаемых результатов.
Второе место по частоте встречаемости занимают опросные методики
, в процессе применения которых исследователь психологии человека задает испытуемому устные вопросы, отмечает и обрабатывает его ответы. Эти методики хороши тем, что не требуют подготовки специальных бланков и позволяют психодиагносту вести себя в отношении испытуемого достаточно гибко. Недостатком опросных методик является субъективность, которая проявляется как в выборе самих вопросов, так и в интерпретации ответов на них. Кроме того, опросные методики трудно стандартизировать и, следовательно, добиться высокой надежности и сравнимости получаемых результатов.
Третье место по частоте использования занимают рисуночные психодиагностические методики
. В них для изучения психологии и поведения испытуемых используются созданные ими рисунки, которые могут иметь как заданный тематически, так и спонтанный характер. Иногда применяется прием интерпретации испытуемыми стандартных, готовых изображений. Нередко в содержании этих изображений в наглядной форме представлены задачи, которые испытуемый должен решить (например, матричный тест Равена).
Первый и третий из описанных типов психодиагностических методик могут иметь два варианта: ручной
и компьютерный
. При ручном варианте методика с начала и до конца используется без применения средств электронно-вычислительной техники для презентации или обработки экспериментального материала. В компьютерном варианте на одном из указанных этапов психодиагностики применяется электронно-вычислительная техника. Например, текстовый и рисуночный материал можно предъявлять испытуемым через экран дисплея, а процессор машины использовать для производства количественных вычислений, а также вывода на печать получаемых результатов.
Особое место среди психодиагностических методик занимают проективные
, которые, в свою очередь, могут быть бланковыми, опросными и рисуночными. Частота их практического использования также достаточно велика и из года в год возрастает по той причине, что методики этой группы наиболее валидные и информативные.
Следующая группа методик – объективно-манипуляционные
. В них решаемые испытуемыми задачи предлагаются им в форме реальных предметов, с которыми предстоит что-нибудь сделать: собрать из заданных материалов, изготовить, разобрать и т. п.
3. Общие критерии классификации психодиагностических методик. Понятие о научных и практических методиках
Более развернутую классификацию психодиагностических методик можно предложить, лишь выделив общие критерии, в соответствии с которыми различные методы психодиагностики будут разделены на частные группы. Такими критериями являются следующие:
1) тип применяемых в методике тестовых задач;
2) адресат используемого в методике тестового материала;
3) форма представления тестового материала испытуемым;
4) характер данных, используемых для выводов о результатах психодиагностики;
5) наличие в методике тестовых норм.
6) внутреннее строение методики.
По типу применяемых тестовых заданий психодиагностические методики делятся на опросные
(в них используются вопросы, адресуемые испытуемым), утверждающие
(в них употребляются некоторые суждения или утверждения, с которыми испытуемый должен выразить свое согласие или несогласие), продуктивные
(здесь применяется тот или иной вид собственной творческой продукции испытуемого: вербальной, образной, материальной, спонтанно созданной или воспроизведенной по инструкции самим испытуемым), действенные
(испытуемый получает задание выполнить некоторый комплекс практических действий, по характеру которых судят о его психологии), физиологические
(в данном случае психодиагностика производится на основе анализа непроизвольных физических или физиологических реакций организма человека).
К примеру, для оценки психологии некоторого человека можно использовать его ответы на прямые или косвенные вопросы, его согласие или несогласие с теми или иными суждениями, результаты его устной, письменной, изобразительной, технической или иной деятельности, его произвольные и непроизвольные действия и реакции в ответ на некоторые стимулы и многое другое. Этой же цели могут служить также электроэнцефалограмма, электрокардиограмма, электромиограмма, кожно-гальваническая реакция (КГР) и другие рефлексы, включая сердечно-сосудистые рефлексы и рефлексы дыхательной системы.
По адресату тестового материала психодиагностические методики делятся на сознательные
, апеллирующие к сознанию испытуемого, и бессознательные
, направленные на неосознаваемые реакции человека. Примером методик первого типа могут служить опросники, а примером второго – проективные методики.
По форме представления тестового материала испытуемым психодиагностические методики делятся на бланковые
(представляют собой тестовый материал в письменной или какой-либо иной знаковой форме: в виде рисунка, схемы и т. п.), технические
(презентируют испытуемому тестовый материал в аудио-, видео– или киноформе, а также через иные технические устройства и машины), сенсорные
(представляют материал в виде физических стимулов, непосредственно адресованных органам чувств).
По характеру данных, используемых для психодиагностических выводов, методики подразделяются на объективные
(используются показатели, не зависящие от сознания и желания испытуемого или экспериментатора) и субъективные
(употребляются данные, зависящие от желания и сознания экспериментатора или испытуемого, относящиеся к их внутреннему опыту и зависящие от него). Примером методик объективного типа могут служить тесты, включающие анализ физиологических, рефлексивных показателей или практических результатов деятельности испытуемого, при пользовании которыми субъективизм в оценках сведен к минимуму. С другой стороны, классическим примером методики субъективного типа является такая, которая в основном опирается на интроспекцию и выводы, делаемые на базе интуиции и внутреннего опыта.
По критерию наличия тестовых норм психодиагностические методики делятся на имеющие подобные нормы
и не располагающие ими
.
Наконец, по внутренней структуре психодиагностические методики можно разделить на мономерные
и многомерные
. Первые характеризуются тем, что в них диагностируется и оценивается единственное качество или свойство, а вторые – тем, что они предназначены для психодиагностики и оценки сразу нескольких однотипных или разнотипных психологических качеств человека. В последнем случае психодиагностическая методика подразделяется, как правило, на несколько частных методик – подшкал, оценивающих отдельные психологические качества. Например, известный тест Спилбергера – Ханина для оценки тревожности – это мономерная методика, а личностный тест Кеттела – многомерная методика.
Одна и та же психодиагностическая методика одновременно может рассматриваться и квалифицироваться с разных сторон, по различным критериям. Поэтому почти любую методику можно отнести не к одной, а сразу к нескольким классификационным группам. В этой связи выделенные и описанные выше критерии классификации психодиагностических методик следует расценивать не как взаимоисключающие, а как взаимодополняющие друг друга в характеристике разных методик, как возможные аспекты их анализа и разделения на классы.
В отдельную группу выделяются психодиагностические методики, основанные на качественном
и количественном
анализе экспериментальных данных. В первом случае диагностируемое свойство описывается в известных научных понятиях, а во втором случае – через относительную степень его развития у данного человека по сравнению с другими людьми. Иногда количественные и качественные характеристики сочетаются в рамках одной и той же методики, так что в итоге изучаемое свойство получает двойную – количественно-качественную характеристику. Например, в тесте Личко, предназначенном для диагностики акцентуаций характера у подростков, каждая из изучаемых черт характера имеет двойную характеристику – и количественную, и качественную одновременно.
Все методы психодиагностики можно также разделить на научные
и практические
, хотя такое деление условно: большинство известных психодиагностических методик используется как в практической психодиагностике, так и в научно-исследовательском экспериментировании. Однако между ними все же есть разница, которая заключается в том, что научно-исследовательские методики главным образом ориентированы на выявление и последующее изучение того или иного психологического качества в целях его сугубо научного познания, а практические – на оценку степени его развития и использования в практических целях. Кроме того, научная методика может быть уникальной, трудоемкой, дорогостоящей и применяться только в рамках научного исследования, будучи из-за указанных ее качеств непригодной для широкой практической психодиагностики. Практическая же методика, напротив, должна быть универсальной, простой и относительно дешевой.
4. Ограничения, достоинства и недостатки различных типов психодиагностических методик
Существование множества психодиагностических методик объясняется не только большим количеством свойств, которые с их помощью приходится оценивать, но также тем, что практически все методики имеют ограничения в применении
, в силу которых приходится создавать и использовать другие методики, не обладающие подобными ограничениями.
Рассмотрим в этой связи достоинства
и недостатки
некоторых типов методик. Достоинство методик, обращенных к сознанию, в том, что они позволяют судить о психологии данного человека непосредственно на основе того, что говорит он о себе или окружающие люди о нем. Однако испытуемый может недостаточно искренне или некритично отвечать на адресованные ему вопросы, в том числе под влиянием субъективно воспринятой инструкции, предвзятого отношения к психодиагносту или ситуации психодиагностики. Словом, сознательное субъективное искажение результатов тестирования – один из самых серьезных недостатков данной группы методик. Правда, некоторые специальные приемы, используемые конструкторами подобных методик, в частности введение в ее структуру контрольных вопросов, суждений, специально оценивающих степень искренности отвечающего, позволяют существенно снизить уровень субъективности получаемых результатов. Вместе с тем заметим еще раз: полностью избежать данного недостатка в подобного типа методиках практически невозможно, что делает их не всегда валидным, надежным и однозначным измерительным инструментом.
Преимущество объективных методик, опирающихся не на словесные ответы, самохарактеристики или самооценки, а на не зависящие от сознания человека непроизвольные действия и реакции, а также продукты его деятельности, заключается в том, что они позволяют избежать субъективности и в этой связи достаточно надежны. Вместе с тем их валидность и однозначность, а также точность иногда оставляют желать лучшего. Поясним сказанное. Объективные показатели не всегда отражают своими изменениями именно те психологические свойства, для оценивания которых они предназначаются. Например, физиологические реакции не всегда соответствуют психологическим свойствам и состояниям человека. Они, кроме того, связаны с сиюминутными физическими состояниями организма, а не только с психологическими процессами, и в этом смысле не вполне однозначны. Наконец, для показателей подобного рода трудно разработать тонкую измерительную шкалу, позволяющую выявлять различные степени проявления диагностируемого качества и дифференцированно их оценивать. Другими словами, объективные показатели не являются точными мерками силы отражаемого в них свойства. Допустим, что для выводов о наличии у ребенка определенного отношения к членам своей семьи используются особенности рисунка семьи, сделанного самим ребенком. Такой рисунок, как показано в многочисленных исследованиях, действительно может отражать сложившиеся в семье отношения, но, помимо этого, также и художественно-изобразительные способности ребенка, его желание рисовать, стремление понравиться психологу, настроение в момент тестирования и многое другое. В зависимости от всего этого может меняться характер рисунка, в том числе те признаки, по которым обычно судят об отношениях ребенка к отдельным членам семьи.
Проективные методики по сравнению со всеми уже рассмотренными имеют одно весьма существенное достоинство: они, как правило, валидны и относительно надежны при высоком уровне профессиональной подготовки пользователя. Они менее субъективны и мало подвержены случайным, ситуативным влияниям. Недостатки их – трудоемкость и значительные временные затраты, необходимые для получения нужного психодиагностического результата.
Методики, позволяющие получать количественные данные, отражающие степень развитости изучаемого свойства, дают возможность использовать меры и методы количественной обработки результатов психодиагностики. В то же самое время с помощью таких методик невозможно отличить друг от друга качественно различные психологические свойства, имеющие одинаковые количественные показатели. Скажем, если с помощью методики Д. Маккелеланда
, Дж. Аткинсона
мы оцениваем силу мотивации достижения успехов, то, получив те или иные показатели, не в состоянии судить о том, является ли мотивация достижения успехов различной у тех испытуемых, которые имеют количественно одинаковые данные. А между тем она может быть качественно различной. В свое время X. Хекхаузен
показал, что в общем показателе силы мотивации достижения успехов по Д. Маккелеланду
и другим на самом деле скрываются два качественно различных мотива: мотив – стремление к успехам и мотив – стремление избежать неудачи. Два человека, имеющие одинаковые по силе мотивы достижения успехов, могут существенно отличаться друг от друга тем, что стремятся к успехам в совершенно разных сферах человеческой деятельности: один – в бизнесе, другой – в искусстве, третий – в спорте и т. п.
ЛЕКЦИЯ № 8. Метод тестов: достоинства и недостатки
1. Достоинства метода тестов
Метод тестов является одним из основных в современной психодиагностике. По уровню популярности в образовательной и профессиональной психодиагностике он прочно удерживает первое место в мировой психодиагностической практике уже фактически в течение столетия.
В данном разделе под тестами следует понимать методики, которые состоят из серии заданий с выбором из готовых вариантов ответа. При подсчете баллов по тесту выбранные ответы получают однозначную количественную интерпретацию и суммируются. Суммарный балл сравнивается с количественными тестовыми нормами, и после этого сравнения формулируются стандартные диагностические заключения.
Популярность метода тестов объясняется следующими главными его достоинствами:
1) стандартизацией условий и результатов
. Тестовые методики относительно независимы от квалификации пользователя (исполнителя), на роль которого можно подготовить даже лаборанта со средним образованием. Это, однако, не означает, что для подготовки комплексного заключения по батарее тестов не надо привлекать квалифицированного специалиста с полноценным высшим психологическим образованием;
2) оперативностью и экономичностью
. Типичный тест состоит из серии кратких заданий, на выполнение каждого из которых требуется, как правило, не более полминуты, а весь тест занимает, как правило, не более часа. Тестированию одновременно подвергается сразу группа испытуемых, таким образом, происходит значительная экономия времени на сбор данных;
3) количественным дифференцированным характером оценки
. Дробность шкалы и стандартизованность теста позволяют рассматривать его как «измерительный инструмент», дающий количественную оценку измеряемым свойствам. Количественный характер тестовых результатов дает возможность применить хорошо разработанный аппарат психометрики, позволяющий оценить, насколько хорошо работает данный тест на данной выборке испытуемых в данных условиях;
4) оптимальной трудностью
. Профессионально сделанный тест состоит из заданий оптимальной трудности. При этом средний испытуемый набирает примерно 50 % из максимально возможного количества баллов. Это достигается за счет предварительных испытаний – психометрического эксперимента (или пилотажа). Если в ходе пилотажа становится известным, что с заданием справляется примерно половина из обследованного контингента, то такое задание признается удачным, и его оставляют в тесте;
5) надежностью.
Это, наверное, самое главное достоинство тестов в образовательной психодиагностике. Лотерейный характер современных экзаменов с вытягиванием счастливых или несчастливых билетов давно уже стал притчей во языцах. Лотерейность для экзаменующегося здесь оборачивается низкой надежностью для экзаменатора – ответ на один фрагмент учебной программы, как правило, не показателен для уровня усвоения всего материала. В отличие от этого любой грамотно построенный тест охватывает основные разделы учебной программы (тестируемой области знаний или проявления какого-то умения или способности). В результате возможность для «хвостистов» выбиться в отличники, а для отличника вдруг провалиться резко сокращается;
6) справедливостью
. Является важнейшим социальным следствием перечисленных выше достоинств. Ее следует понимать как защищенность от предвзятости экзаменатора. Хороший тест ставит всех в равные условия. Наиболее сильно субъективизм экзаменатора проявляется, как известно, не в трактовке уровня решенности задачи (не так просто назвать черное белым, решенную задачу – нерешенной), а в тенденциозном подборе заданий – своим полегче, чужим – труднее. Тесты обеспечивают важнейшую функцию школы как социального фильтра – функцию «социально-профессиональной селекции». То, насколько справедливой оказывается подобная селекция, имеет гигантское значение для развития общества. Поэтому так важно всем, кто имеет доступ к тестам и их результатам, учиться культуре грамотного и гуманного применения тестов, ибо только добросовестное и квалифицированное отношение пользователей к тестам превращает их в инструмент, повышающий, а не понижающий уровень справедливости в обществе;
7) возможностью компьютеризации
. В данном случае это не просто дополнительное удобство, сокращающее живой труд квалифицированных исполнителей при массовом обследовании. В результате компьютеризации повышаются все параметры тестирования (например, при адаптированном компьютерном тестировании резко сокращается время тестирования). Компьютеризация – это мощный инструмент обеспечения информационной безопасности (достоверности диагностики). Компьютерная организация тестирования, предполагающая создание мощных информационных банков тестовых заданий, позволяет технически предотвратить злоупотребления со стороны недобросовестных экзаменаторов. Выбор заданий, предлагаемых конкретному испытуемому, может производить из такого банка сама компьютерная программа прямо в ходе тестирования, и предъявление данному испытуемому определенного задания в этом случае является таким же сюрпризом для экзаменатора, как и для испытуемого.
Во многих странах внедрение метода тестов (равно как и сопротивление этому внедрению) тесно связано с социально-политическими обстоятельствами. Внедрение хорошо технически оснащенных тестовых служб в образование – важнейший инструмент в борьбе с коррупцией, поражающей правящую элиту (номенклатуру) во многих странах. На Западе тестовые службы работают независимо от выпускающих (школы) и принимающих (вузы) организаций и снабжают абитуриента независимым сертификатом о результатах тестирования, с которым он может отправляться в любое учреждение. Эта независимость службы тестирования от выпускающих и принимающих организаций является дополнительным фактором демократизации процесса селекции профессиональных кадров в обществе, дающая талантливому и просто работоспособному человеку лишний шанс проявить себя.
2. Недостатки метода тестов
Метод тестов обладает некоторыми весьма серьезными недостатками, не позволяющими свести всю диагностику способностей и знаний исключительно к тестированию, такими как:
1) опасность «слепых» (автоматических) ошибок
. Слепая вера низкоквалифицированных исполнителей в то, что тест должен сработать правильно автоматически, порождает иногда тяжелые ошибки и казусы: испытуемый не понял инструкции и стал отвечать совсем не так, как требует стандартная инструкция, испытуемый по каким-то причинам применил искажающую тактику, возник сдвиг в приложении трафарета-ключа к бланку ответов (при ручном, некомпьютерном подсчете баллов) и т. п. Пользователь не должен подходить к тесту с магической установкой, будто этот волшебный черный ящик должен всегда работать исправно без всякого контроля со стороны человека;
2) опасность профанации
. Не секрет, что внешняя легкость проведения тестов прельщает людей, не пригодных ни к какому квалифицированному труду. Оснастившись тестами, им самим непонятного качества, но с громкими рекламными названиями, профаны от тестирования агрессивно предлагают свои услуги всем и вся. Все проблемы предполагается решать с помощью 2–3 тестов – на все случаи жизни. К количественному тестовому баллу приклеивается новый ярлык – заключение, создающее видимость соответствия диагностической задаче. Примером такой профанации может служить повальное использование клинического теста MMPI для отбора кадров в нашей стране. Недобросовестная профанация и элементарное невежество идут в области тестирования рука об руку;
3) потеря индивидуального подхода, стрессогенность
. Тест – самый общий ранжир, под который подгоняют всех людей. Возможность упустить яркую индивидуальность нестандартного человека, к сожалению, довольно вероятна. Это чувствуют сами испытуемые, и это их нервирует, особенно в ситуации аттестационного тестирования. У людей с пониженной стрессоустойчивостью возникает даже определенное нарушение саморегуляции – они начинают волноваться и ошибаться в элементарных для себя вопросах. Вовремя заметить такую реакцию на тест – задача, которая под силу квалифицированному и добросовестному исполнителю;
4) потеря индивидуального подхода, репродуктивность
. Тесты знаний апеллируют прежде всего к стандартному применению готовых знаний;
5) отсутствие возможности раскрыть индивидуальность
при наличии стандартных, заданных ответов – ничем не восполнимый недостаток метода тестов. С точки зрения выявления творческого потенциала большинство тестов ограничено именно тем, что они не апеллируют к творческой, конструктивной деятельности. Во всяком случае отдельные стандартизированные творческие тесты имеют дело с весьма абстрактным материалом, а тесты достижений (знаний), адаптированные на жизненно важном материале (профессионально релевантном), как правило, выполнены в форме стандартного набора заданий с заданным ответом;
6) отсутствие доверительной обстановки
. Бездушный и формализованный характер самой процедуры тестирования оборачивается тем, что испытуемый лишается ощущения того, что психолог заинтересован в нем лично, в том, чтобы помочь в его проблемах и трудностях. Диалогические методы (беседа, игра) в этом плане имеют несомненные преимущества: непосредственно общаясь с испытуемым, квалифицированный психолог может установить доверительный контакт, проявить персональное участие, создать атмосферу, снимающую напряжение и защиту;
7) потеря индивидуального подхода, неадекватная сложность
. Иногда неквалифицированные тестологи обрушивают на ребенка тесты, слишком сложные для него по возрасту. У него еще не сложились необходимые понятия и понятийные навыки, чтобы адекватно осмыслить как общую инструкцию к тесту, так и смысл отдельных вопросов.
Таким образом, тесты нельзя делать единственным исчерпывающим методом любой диагностики (и образовательно-профессиональной, и личностной) – они требуют параллельного использования свободных письменных работ (в личностной диагностике место сочинений занимают проективные тесты со свободным ответом), а также устного собеседования (интервью). Таким образом, место тестов – дополнять указанные выше традиционные методы. В этом качестве тесты незаменимы, так как не имеют многих недостатков, свойственных традиционным методам.
Спокойное осознание достоинств и недостатков метода тестирования освобождает всех (исполнителей, заказчиков, испытуемых) как от чрезмерных упований на метод тестов, так и от пренебрежения ним.
ЛЕКЦИЯ № 9. Надежность психодиагностических методик
1. Определение. Факторы, влияющие на надежность методики. Стандартная ошибка измерения. Надежность измерения. Понятие о методе измерения ретестовой надежности
Надежность
– одно из трех главных психометрических свойств любой измерительной психодиагностической методики (теста).
Надежность – это помехоустойчивость теста, независимость его результата от действия всевозможных случайных факторов
. К числу таких факторов относятся:
1) разнообразие внешних материальных условий тестирования, меняющихся от одного испытуемого к другому (времени суток, освещенности, температуры в помещении, наличия посторонних звуков, отвлекающих внимание и т. п.);
2) динамичные внутренние факторы, по-разному действующие на разных испытуемых в ходе тестирования (время так называемой врабатываемости – выхода на стабильные показатели темпа и точности действий после начала тестирования, скорость наступления утомления и т. п.);
3) информационно-социальные обстоятельства (различная динамика в установлении контакта с психологом или лаборантом, проводящим тестирование; возможное наличие других людей в помещении; наличие предыдущего опыта знакомства с данным тестом; наличие какого-то знания и отношения к тестам вообще и т. п.).
Разнообразие и изменчивость этих факторов так велики, что они обусловливают появление у каждого испытуемого непрогнозируемого по размерам и направлению отклонения измеренного тестового балла от истинного тестового балла (который можно было бы, в принципе, получать в идеальных условиях). Средняя относительная величина этого отклонения определяется как стандартная ошибка измерения (Se)
. Величина ошибки измерения указывает на уровень неточности или ненадежности тестовой шкалы.
Ошибка измерения (Se) и надежность измерения (R) согласно общепринятой психометрической теории связаны следующей формулой:
R
= 1 – Se
2 / Sx
2, (1),
где Sx
– дисперсия тестовых показателей Х.
Формула (1) является чисто теоретической, и на ее основе нельзя подсчитать надежность теста, так как величина Se оказывается также неизвестной величиной. Поэтому на практике применяют корреляционные методы. Самый известный их них – метод перетестирования («тест-ретест») или метод измерения ретестовой надежности
. На одной и той же выборке испытуемых (не менее 30 человек, участвующих в пилотажном психометрическом экспериментальном исследовании) проводят первое тестирование Х, а затем повторное тестирование Y. Интервал, как правило, 2 недели, что гарантирует забывание вопросов теста.
Затем для двух рядов значений Х и Y подсчитывается, например, линейный коэффициент корреляции, или ранговый коэффициент корреляции
:
где Sx, Sy
– стандартные отклонения X и Y, t;
Cov
(X, Y
) – ковариация двух переменных X и Y.
Для сути теории надежности методов важна возможность определить ошибку измерения, после того как подсчитана корреляция «тест – ретест» по формуле (3), полученной путем простого преобразования формулы (1):
Se
= Sx
? V1 – R
. (3)
Таким образом, если стандартное отклонение в тесте составило 10 очков (среднее отклонение, которое в среднем допускают испытуемые от среднего балла для выборки), а корреляция «тест – ретест» оказалась равной лишь 0,5, то ошибка измерения оказывается очень большой:
Se = 10 ? V1-0,5 ~ 7.1.
Оказывается, что ошибка измерения перекрывает большую часть разброса тестовых показателей, так как истинный балл по тесту может отклоняться от измеренного балла на целых 7 очков! И, если испытуемый набрал на 6 очков больше, чем средний испытуемый, мы не можем с достаточной уверенностью (статистической достоверностью) говорить о том, что он значимо превзошел среднего испытуемого, так как это отклонение оказывается в пределах стандартной ошибки измерения.
Таким образом, низкая корреляция результатов теста между первым и повторным тестированием говорит о том, что случайные факторы существенно искажают результаты теста. Это значит, что тест не обладает необходимой помехоустойчивостью и его нельзя использовать как измерительный инструмент.
Показатель надежности R, который принято считать достаточно высоким, равен или превышает 0,95. Хотя в личностных тестах часто пользуются значительно менее надежными тестами с показателями 0,8–0,9.
Метод измерения ретестовой надежности пригоден только для психических свойств, стабильных во времени. Надежность тестов на психические состояния и динамические установки личности нельзя проверить таким образом. В этом случае применяют различные методы расщепления теста на отдельные пункты.
Надежность
– характеристика методики, отражающая точность психодиагностических измерений, а также устойчивость результатов теста к действию посторонних случайных факторов. Надежность и валидность являются важнейшими характеристиками методики как инструмента психодиагностического исследования. Любое изменение ситуации исследования усиливает влияние одних и ослабляет воздействие других факторов на результат теста. Общий разброс (дисперсию) результатов тестового обследования можно, таким образом, представить как результат влияния двух групп причин: изменчивости, присущей самому измеряемому свойству, и факторов нестабильности измерительной процедуры.
В самом широком смысле надежность теста – это характеристика того, в какой степени выявленные у испытуемых различия по тестовым результатам являются отражением действительных различий в измеряемых свойствах и в какой мере они могут быть приписаны случайным ошибкам.
В более узком, методическом смысле под надежностью понимают степень согласованности результатов теста, получаемых при первичном и вторичном его применении у одних и тех же испытуемых в различные моменты времени с использованием разных (но сопоставимых по характеру) наборов тестовых заданий или при других изменениях условий обследования.
Разновидностей характеристик надежности теста так же много, как условий, влияющих на его результаты. Наиболее широкое практическое применение находит несколько типов характеристик надежности: надежность ретестовая, надежность параллельных форм, надежность частей теста.
2. Стандартизация процедуры обследования. Взаимосвязь надежности и валидности
Важнейшим средством повышения надежности психодиагностических методик является стандартизация процедуры обследования
. При строгой регламентации процедуры обследования (обстановки и условий работы испытуемого, характера инструкции, временных ограничений, способов и особенностей контакта с испытуемым, порядка предъявления элементов методики, получения первичных оценок и т. д.) существенно уменьшается дисперсия ошибки, повышается надежность теста.
Если исходить из широкого понимания надежности как отражения в результате исследования удельного веса измеряемого параметра и совокупности посторонних факторов, то можно усмотреть определенную связь надежности с другой важнейшей комплексной характеристикой психодиагностической методики – валидностью.
Надежность
– устойчивость процедуры относительно объектов исследования. Валидность
– однозначность, устойчивость относительно измеряемых свойств объекта, т. е. предмета измерения. Устойчивость теста относительно объектов (испытуемых) является необходимым, но недостаточным условием его устойчивости относительно измеряемых свойств объектов. Следовательно, надежность является необходимым, но недостаточным условием валидности. Это означает, что валидность теста не может качественно и количественно превышать надежность. Данное соотношение нельзя, однако, трактовать как указание на прямую пропорциональную связь характеристик валидности и надежности. Повышение надежности отнюдь не сопровождается обязательным повышением валидности. Например, у теста-опросника из одного вопроса внутренняя согласованность предельна, однако валидность у него минимальна.
3. Надежность параллельных форм. Сущность, достоинства и недостатки
Надежность параллельных форм
– характеристика надежности психодиагностической методики с помощью взаимозаменяемых форм теста. При этом одни и те же испытуемые в выборке определения надежности обследуются вначале с использованием основного набора заданий, а затем – с применением аналогичных дополнительных наборов. Коэффициент надежности по типу надежности параллельных форм может быть определен и другим способом, а именно: испытуемые делятся примерно на равные группы, затем одной из них предлагается форма А теста, а другой – форма Б. Через определенное время (обычно не более недели) проводится повторное тестирование, но в обратном порядке.
Такая процедура обследования лишена значительной части недостатков способа определения ретестовой надежности
. Так как в параллельной форме используется другой по содержанию материал, возможность тренировки и запоминания отдельных решений уменьшается. Важнейшим преимуществом данного метода является сокращение временного интервала перед повторным обследованием. Основным показателем надежности параллельных форм является коэффициент корреляции между результатами первичного и повторного обследований, который позволяет оценить как временную стабильность теста (собственно надежность), так и степень соответствия результатов обеих форм теста. Если формы применяются непосредственно одна за другой, то корреляция отражает их взаимозаменяемость.
Отношение между параллельными формами теста имеет сложный характер. Оба набора заданий должны не только отвечать одним и тем же требованиям, измеряя идентичные показатели и давая сходные результаты, но вместе с тем быть относительно независимыми друг от друга. На практике эта задача осуществима далеко не для всех тестовых заданий (в особенности это касается личностных методик, опросников), что существенно ограничивает сферу применения надежности параллельных форм. Другим недостатком характеристики надежности по типу надежности параллельных форм является возможность усвоения испытуемым принципа решения, общего для основной и параллельной форм. Таким образом, в случае оценки надежности параллельных форм влияние тренировки и навыка, приобретаемого при повторном обследовании, если и снижается по сравнению с характеристикой надежности ретестовой, однако не устраняется полностью.
4. Надежность частей теста, ее определение методом расщепления. Уравнение Спирмена – Брауна. Определение коэффициента надежности с помощью формул Дж. Фланагана и Рюлона
Надежность частей теста
– характеристика надежности психодиагностической методики, получаемая путем анализа устойчивости результатов отдельных совокупностей тестовых задач или единичных пунктов (заданий) теста. Наиболее простым и распространенным способом определения надежности частей теста является метод расщепления
, суть которого заключается в выполнении испытуемым заданий двух равноценных частей теста. Обоснованием метода является вывод о том, что при нормальном или близком к нормальному распределении оценок по полному тесту выполнение любого случайного набора из частей теста даст аналогичное распределение (при условии, что части однородны по характеру заданий, по отношению к тесту в целом).
Для оценки надежности методом расщепления выбирают две эквивалентные по характеру и степени трудности группы задач. Разделение объема заданий теста на сопоставимые части достигается:
1) распределением заданий на четные и нечетные (в том случае, если задания в тесте строго ранжированы по степени субъективной трудности);
2) распределением пунктов по принципу близости или равенства значений индексов трудности. Такой принцип разделения пригоден для тестов достижений, в которых обязателен ответ испытуемых на все пункты;
3) распределением задач по времени решения каждой из частей (для тестов скорости).
Для испытуемых в выборке определения надежности (раздельно для каждой из частей теста) вычисляются оценки успешности решений, среднеквадратические отклонения первого и второго рядов оценок и коэффициенты корреляции сравниваемых рядов. Естественно, эти коэффициенты будут характеризовать надежность лишь половины теста.
Уравнение Спирмена – Брауна отражает влияние изменения количества заданий на коэффициент надежности теста:
rt
= nr' t
/ 1 + (n
– 1) r' t
,
где rt
– коэффициент надежности для полного объема заданий, r' t
– его значение после изменения числа заданий, n
– отношение нового числа заданий к первоначальному (если число заданий полного теста – 100, а его части, полученной методом расщепления на половины, – 50, то n = 0,5).
Отсюда для полного теста:
rt
= 2r' t
/ 1 + r' t
.
Приведенные формулы справедливы для случаев равных стандартных отклонений обеих половин теста (?x
l = ?х
2). Если ?x
l отличается от ?х
2, для определения коэффициента надежности применяется формула Фланагана:
rt
= 4? x
l? х
2r' t
/ ? x
l + ?х
2 + 2?x
l?х
2r' t
.
При определении rt целого теста можно воспользоваться формулой Рюлона:
rt
= 1 – ?
2? / ?
2x
,
где ?
2? – дисперсия разностей между результатами каждого испытуемого по двум половинам теста,
?
2x
– дисперсия суммарных результатов.
В данном случае коэффициент надежности рассчитывается как доля истинной дисперсии результатов теста.
Разделение заданий теста на равноценные половины является лишь частным случаем надежности частей теста. Вполне возможно расщепление на три, четыре и более частей. В предельном случае число частей равно числу пунктов. При разделении всего набора заданий теста на любое количество групп для правильного определения надежности частей теста, как уже указывалось выше, должно соблюдаться требование равноценности таких групп. Поэтому при вычислении коэффициента надежности методом анализа внутренней согласованности отобранные задания теста должны быть в высокой степени однородны по содержанию и трудности (гомогенны). При гетерогенных задачах значения rt ниже истинных.
Характеристика надежности по типу надежности частей теста имеет серьезные преимущества по сравнению с надежностью ретестовой и надежностью параллельных форм главным образом благодаря отсутствию необходимости в повторном обследовании. Таким образом, снимается влияние многих посторонних факторов, в частности тренировки, запоминания решений и т. д. Это обстоятельство определяет широкое распространение методов характеристики надежности частей теста по сравнению с другими типами надежности. К недостаткам метода относится невозможность проверить устойчивость результатов теста спустя определенное время. Это требует комбинирования метода надежности частей теста с другими типами характеристики надежности психологической методики.
ЛЕКЦИЯ № 10. Сущность валидности
1. Определения валидности
Валидность
(от англ. valid – «действительный, пригодный, имеющий силу») – комплексная характеристика методики (теста), включающая сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним.
В наиболее простой и общей формулировке валидность теста – это «понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает» А. Анастази
, 1982). В стандартных требованиях к психологическим и образовательным тестам валидность определяется как комплекс сведений о том, относительно каких групп психологических свойств личности могут быть сделаны выводы с помощью методики, а также о степени обоснованности выводов при использовании конкретных тестовых оценок или других форм оценивания. В психодиагностике валидность – обязательная и наиболее важная часть сведений о методике, включающая (наряду с указанными выше) данные о степени согласованности результатов теста с другими сведениями об исследуемой личности, полученными из различных источников (теоретических ожиданий, наблюдений, экспертных оценок, результатов других методик, достоверность которых установлена и т. д.), суждение об обоснованности прогноза развития исследуемого качества, связь изучаемой области поведения или особенности личности с определенными психологическими конструктами. Валидность описывает также конкретную направленность методики (контингент испытуемых по возрасту, уровню образования, социально-культурной принадлежности и т. д.) и степень обоснованности выводов в конкретных условиях использования теста. В совокупности сведений, характеризующих валидность теста, содержится информация об адекватности применяемой модели деятельности с точки зрения отражения в ней изучаемой психологической особенности, о степени однородности заданий (субтестов), включенных в тест, их сопоставимости при количественной оценке результатов теста в целом.
2. Важнейшие составляющие валидности
Важнейшая составляющая валидности – определение области изучаемых свойств – имеет принципиальное теоретическое и практическое значение при выборе методики исследования и интерпретации ее данных. Содержащаяся в названии теста информация, как правило, недостаточна для суждения о сфере его применения. Это лишь обозначение, «имя» конкретной процедуры исследования. В качестве примера можно привести широко известную корректурную пробу. Область изучаемых свойств личности включает устойчивость и концентрацию внимания, психомоторную подвижность. Данная методика позволяет получать оценки выраженности этих психологических качеств у испытуемого, хорошо согласуется с показателями, полученными другими методами, и, следовательно, обладает высокой валидностью. Наряду с этим результаты выполнения корректурной пробы подвержены влиянию большого количества других факторов (нейродинамических особенностей, характеристик кратковременной и оперативной памяти, индивидуальной переносимости монотонии, развития навыка чтения, особенностей зрения и т. д.), по отношению к которым методика не является специфичной. В случае применения корректурной пробы для их измерения валидность будет невелика или сомнительна.
Таким образом, очерчивая сферу применения методики, валидность отражает и уровень обоснованности результатов измерения. Очевидно, что при небольшом количестве сопутствующих факторов, влияющих на результат исследования, а значит, при их незначительном воздействии на результат теста достоверность тестовых оценок будет выше. Еще в большей степени достоверность данных теста определяется набором измеряемых свойств
, их значимостью для осуществления диагностируемой сложной деятельности, полнотой и существенностью отражения в материале теста предмета измерения. Так, чтобы удовлетворить требованиям валидности, диагностическая методика, предназначенная для профотбора, должна включать анализ широкого круга нередко различных по своей природе показателей, наиболее важных для достижения успеха в данной профессии (уровеня внимания, особенностей памяти, психомоторики, эмоциональной устойчивости, интересов, склонностей и т. д.). Как видно из вышеизложенного, в понятие валидности входит большое количество самой разнообразной информации о тесте. Различные категории этих сведений и способы их получения образуют типы валидности
.
Диагностическая (конкурентная) валидность
отражает способность теста дифференцировать испытуемых по изучаемому признаку. Анализ диагностической валидности имеет отношение к установлению соответствия показателей теста реальному состоянию психологических особенностей испытуемого в момент обследования. Примером определения этого типа валидности может быть исследование по методу контрастных групп. Проведение теста интеллекта у нормально развивающихся детей и их сверстников с нарушениями в интеллектуальном развитии может выявить глубокие количественные и качественные различия в выполнении заданий сравниваемыми группами. Степень надежности дифференциации детей первой и второй групп по данным теста будет характеристикой диагностической валидности оценки умственного развития, получаемой с помощью данной методики.
Сведения, характеризующие степени обоснованности и статистической надежности развития исследуемой психологической особенности в будущем, составляют прогностическую валидность
методики. Заключение об этом типе валидности может быть получено, например, путем сравнения тестовых оценок в одной и той же группе испытуемых спустя определенное время. Основой прогностической валидности является определение того, насколько важен исследуемый признак с точки зрения деятельности испытуемого в будущем с учетом закономерно изменяющихся обстоятельств, перехода на другой уровень развития.
Большинство методик, особенно тестов способностей и интеллекта, исследуется на предмет диагностической и прогностической валидности. Два этих типа валидности нередко объединяют в понятие эмпирической валидности.
Здесь подчеркивается общность подхода к их определению, который осуществляется путем статистического коррелирования баллов (оценок) по тесту и показателей по внешнему параметру, избранному в качестве валидизации критерия (см. валидности критериальная). Критерий валидности выступает в качестве меры, показателя исследуемых психологических особенностей. Так, тесты специальных способностей проверяются путем сопоставления с результатами обучения по другим предметам, достижениями в музыке, рисовании и т. д. Тесты общих интеллектуальных способностей валидизируются сравнением с еще более широкими характеристиками школьных достижений (общей успеваемостью, овладением сложными системами знаний и навыков). Критерий валидности является независимым от теста показателем, обладающим непосредственной ценностью для определенных областей практической деятельности. Например, в области педагогической психологии это успеваемость, в психологии труда – производительность, в медицинской психологии – состояние здоровья и т. д. В качестве непосредственных критериев часто используются экспертные оценки и характеристики лиц, обследованных с помощью валидизируемого теста, данные педагогами, сотрудниками, руководителями.
Во многих случаях бывает сложно или невозможно подобрать адекватный критерий валидизации. При этом особую важность приобретает комплекс характеристик, входящих в тип теоретической валидности. При разработке и использовании теста может быть сформулирован ряд гипотез о том, как будет коррелировать исследуемый тест с другим тестом, измеряющим родственные или противоположные психологические характеристики испытуемых. Эти гипотезы выдвигаются на основании теоретических представлений об измеряемых свойствах как о психологическом конструкте. Подтверждение гипотез свидетельствует о теоретической обоснованности методики, т. е. о степени ее конструктной валидности
. Этот тип валидности является наиболее сложным и комплексным. Для подтверждения соответствия получаемых с помощью теста результатов теоретическим ожиданиям и закономерностям используется самая различная информация, в том числе относящаяся к другим типам валидности.
Валидность содержательная (внутренняя, логическая)
– комплекс сведений о репрезентативности заданий теста по отношению к измеряемым свойствам и особенностям. Одним из основных требований при валидизации методики в этом направлении является отражение в содержании теста ключевых сторон изучаемого психологического феномена. Если область поведения или особенность очень сложна, то содержательная валидность требует представления в заданиях теста всех важнейших составных элементов исследуемого явления. Так, при разработке теста вербального интеллекта необходимо ввести группы заданий (субтестов) для проверки довольно разнородных по своему операциональному составу навыков письма и чтения.
Наряду с перечисленными основными типами валидности (содержательной, критериальной и конструктной) на практике выделяют факторную
, перекрестную (конвергентную)
и дискриминантную
валидности.
3. Основные типы валидности (диагностическая, прогностическая, эмпирическая, критериальная, конструктная, содержательная). Классификация типов валидности
Классификация типов валидности в достаточной мере условна, так как, с одной стороны, нередко для различных критериев валидности применяются общие методы определения, – а стороны, одни и те же исходные данные могут интерпретироваться с точки зрения различных типов валидности.
Классификация типов валидности:
1) конструктная;
2) дифференциальная;
3) конвергентная;
4) дискриминативная (дискриминантная);
5) факторная;
6) валидность по возрастной дифференциации;
7) критериальная;
8) диагностическая (конкурентная);
9) текущая;
10) прогностическая;
11) инкрементная;
12) синтетическая;
13) ретроспективная;
14) эмпирическая;
15) содержательная;
16) лицевая (очевидная).
Другие виды валидности:
1) иллюзорная;
2) экологическая.
4. Относительность деления валидности на типы. Понятие комплекса валидности. Обоснование необходимости периодической валидизации психодиагностических методик
В психологической диагностике не существует универсального подхода к характеристике валидности. Для валидизации каждого вида психодиагностических процедур и отдельных тестов могут применяться различные типы валидности. Сведения, входящие в комплекс валидности, можно оценить качественно и количественно (при помощи коэффициента валидности), нередко их можно описать. Однако в силу сложности, комплексности, ситуативности по отношению к конкретным условиям применения методики валидность в целом невозможно измерить, о ней можно лишь судить.
Реальная валидность раскрывается только в результате накопления значительного опыта работы с тестами. Получение новых, расширенных данных о валидности может радикально изменить представление о сфере применения и эффективности методики. Так, некоторые методики, разработанные для диагностики вербальных факторов интеллекта, с достаточной валидностью отражают лишь уровень осведомленности. Сфера применения теста в ходе его длительной валидизации может быть, напротив, расширена. В качестве примера можно привести прогрессивные матрицы Равена, которые были разработаны для изучения определенных сторон перцептивной деятельности, однако оказались в значительной степени насыщены фактором, общим для тестов интеллекта (см. фактор G). Реальная валидность ряда психодиагностических методик, особенно тестов интеллекта, достижений в обучении, профессиональной пригодности, личностных опросников, изменяется со временем. Это объясняется устареванием возрастных статистических норм, изменением социальных норм и образцов поведения, методов обучения и содержания заданий, требований к профессиям. Данное обстоятельство создает необходимость периодического контроля валидности методик.
ЛЕКЦИЯ № 11. Конструктная валидность
1. Сущность, методы характеристики конструктной валидности
Конструктная валидность
– один из основных типов валидности, отражающий степень репрезентации исследуемого психологического конструкта в результатах теста. В качестве конструкта могут выступать практический или вербальный интеллект, эмоциональная неустойчивость, интроверсия, понимание речи, переключаемость внимания и т. д. Иначе говоря, конструктная валидность определяет область теоретической структуры психологических явлений, измеряемых тестом. Поскольку проявления таких конструктов, как, например, интеллект, в деятельности человека многообразны и неоднозначны с точки зрения их выделения, процедура установления конструктной валидности по сравнению с валидностью критериальной или валидностью содержательной сложна.
При объяснении связи полученных тестовых результатов с теоретическим конструктом необходимо постепенное накопление разнообразной информации о динамике развития измеряемого свойства, а также о его взаимодействии с другими психическими явлениями.
Среди конкретных методов характеристики конструктной валидности в первую очередь необходимо назвать сопоставление исследуемого на предмет конструктной валидности теста с другими методиками, конструктное содержание которых известно. Наличие корреляции между новым и аналогичным по конструкту тестом указывает на то, что разрабатываемый тест «измеряет» примерно ту же сферу поведения, способность, личностное качество, что и эталонная методика. Такая процедура валидизации напоминает определение критериальной валидности в том смысле, что эталонный тест, валидность которого определена, выступает в качестве независимого критерия.
Следует заметить, что в отличие от критериальной валидизации при анализе конструктной валидности не требуется высокой степени связи результатов двух тестов. Если окажется, что новый и эталонный тесты практически идентичны по содержанию и результатам и разрабатываемая методика не обладает преимуществами краткости или легкости применения, то это означает лишь дублирование теста, оправданное только с точки зрения создания параллельной формы теста.
Смысл процедуры конструктной валидности состоит в установлении одновременно как сходства, так и различия психологических феноменов, измеряемых новым тестом по сравнению с известным.
2. Конвергентная и дискриминантная валидности
Конвергентная и дискриминантная валидности
. При анализе конструктной валидности методики обычно формулируют ряд гипотез о том, как будет коррелировать разрабатываемый тест с широким кругом других тестов, направленных на конструкты, находящиеся в теоретически известной или предполагаемой связи с исследуемыми. При этом конструктная валидность характеризуется не только связями проверяемого теста с близкородственными показателями, но и с теми, где исходя из гипотезы значимых связей наблюдаться не должно. Эти подходы определяются как конвергентная
(проверка степени близости прямой или обратной связи) и дискриминантная
(установление отсутствия связи) валидности. Подтверждение совокупности теоретически ожидаемых связей составляет важный круг сведений конструктной валидности. В англоязычной психодиагностике такое операциональное определение конструктной валидности обозначается как предполагаемая валидность (assumed validity).
3. Факторная валидность
Факторная валидность
. Прямое отношение к характеристике конструктной валидности имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными факторами, выявить общие и специфические для группы сопоставляемых тестов факторы, степень их представленности в результатах, т. е. определить факторный состав и факторные нагрузки результата теста. Исключительная важность такой процедуры является основанием для выделения ее в особый вид конструктной валидности – факторную валидность.
Важным аспектом конструктной валидности является внутренняя согласованность, отражающая то, насколько определенные пункты (задания, вопросы), составляющие материал теста, подчинены основному направлению теста как целого, ориентированы на изучение одних и тех же конструктов. Анализ внутренней согласованности осуществляется путем коррелирования ответов на каждое задание с общим результатом теста. Следует отметить, что критерий внутренней согласованности указывает лишь на меру связи всего содержания теста с измеряемым конструктом, давая лишь косвенную информацию о природе измеряемого свойства.
При определении конструктной валидности важное место принадлежит изучению динамики измеряемого конструкта. При этом мы можем опираться на гипотезы о его возрастном развитии, влиянии тренировок, обучения, освоения профессии и т. д. Одним из таких подходов является применение критерия возрастной дифференциации, что предусматривает согласование результатов теста с ожидаемыми изменениями, которые претерпевает изучаемое психическое свойство в возрастной динамике при переходе на новый этап развития. Этот метод конструктной валидности особенно важен для валидизации тестов интеллекта, достижений в обучении.
В комплекс сведений о конструктной валидности методики входят также данные, относящиеся к сфере критериальной и содержательной валидности. Так, критерии, используемые при валидизации, несут информацию, позволяющую раскрыть область поведения, качества, представленные в тесте в виде конструкта. Для характеристики конструктной валидности необходимы связь с практическими формами деятельности, достоверность прогноза реального поведения. Однако конструктная валидность является качественно более высоким и комплексным уровнем описания теста, характеризуя область измеряемого поведения в широких психологических понятиях. Благодаря данным конструктной валидности мы можем с психологических позиций закономерно объяснить результаты теста и их дисперсию, обосновать диагноз, введя измеряемое свойство в систему психологических категорий, прогнозировать поведение в более широких пределах, чем это задается областью деятельности, для которой определялась содержательная валидность.
В качестве примера, иллюстрирующего необходимость глубокого анализа теоретического конструкта, лежащего в основе конкретной методики, для правильного применения теста и интерпретации его результатов, можно привести сопоставление двух популярных личностных опросников – шкалы проявления тревожности (MAS) и варианта личностных опросников Айзенка (EPI). Корреляционные исследования показывают, что шкала тревожности MAS положительно коррелирует со шкалой нейротизма и отрицательно – со шкалой экстраверсии EPI. Согласно концепции Айзенка эти данные можно рассматривать как свидетельство низкой валидности шкалы MAS: тревожность коррелирует не только с релевантным фактором «нейротизм», но и с иррелевантным фактором «интроверсия». С этой точки зрения MAS оказывается просто нечувствительным к особой разновидности нейротизма – нейротизму (тревожности) экстравертов, из перечня пунктов MAS исключены высказывания, в которых могла бы проявиться тревожность экстраверта. Однако с теоретических позиций К. Спенса
и Дж . Тейлора
эта ситуация вполне закономерна, желательна и никак не является артефактом – следствием дефекта данного диагностического средства. Согласно К. Спенсу, пытавшемуся переносить на человеческое поведение теорию научения Халла, MAS измеряет общий уровень драйва – неспециализированного побуждения, которое как раз достигает максимума при сочетании нейротизма (специфической активации по Айзенку) и интроверсии (неспецифической активации) (Практикум по психодиагностике, 1984). Таким образом, названия тестов не всегда однозначно выражают понятия об измеряемом свойстве. В данном примере особенно подчеркивается роль психологической теории, лежащей в основе методики для раскрытия содержания показателей, получаемых с ее помощью.
4. Дифференциальная валидность
Дифференциальная валидность
– вид конструктной валидности, рассматривающей внутренние взаимоотношения между психологическими факторами, диагностируемыми с помощью психодиагностической методики. Содержание дифференциальной валидности может быть проиллюстрировано на примере тестов интересов, которые в своем большинстве обычно умеренно коррелируют с показателями общей академической успеваемости, однако в различной степени связаны с успеваемостью по отдельным дисциплинам. Дифференциальная валидность особенно важна как показатель диагностической ценности методик, используемых в профотборе.
5. Валидность по возрастной дифференциации
Валидность по возрастной дифференциации
– один из компонентов конструктной валидности, связанный с возрастной динамикой изменений исследуемого качества. Характеристика валидности по конструкту здесь заключается в определении соответствия результатов теста теоретически ожидаемым и практически наблюдаемым возрастным изменениям данного конструкта или свойства.
Наибольшее значение валидность по возрастной дифференциации имеет для характеристики валидности тестов, направленных на измерение психологических свойств, функций, отличающихся относительно быстрым изменением под воздействием индивидуального опыта, выраженной иерархичностью ступеней развития (осведомленности, навыков, интеллектуальных операций и др.). По этой причине валидность по возрастной дифференциации является главным оценочным критерием при валидизации тестов интеллекта, особенно предназначенных для детей. Здесь закономерное повышение результатов выполнения заданий теста в каждой последующей возрастной группе является основным психометрическим принципом диагностики уровня развития, базой для построения психометрической шкалы. Прослеживается связь валидности по возрастной дифференциации с текущей валидностъю за счет более точной дифференциации возрастных этапов развития исследуемых свойств. Большое значение валидность по возрастной дифференциации имеет и для характеристики валидности тестов способностей, достижений, уровня образования, навыков, умений. Высокие показатели по этому критерию необходимы также для методик, применяемых в клинике в целях повышения точности дифференцированной диагностики изменений возрастного и патологического характера, психодиагностического обследования лиц пожилого и преклонного возраста.
В ряде случаев валидность по возрастной дифференциации обнаруживает связь с прогностической валидностью методик. Наличие высоких показателей по этому критерию означает стабильное изменение исследуемых свойств в большой статистической выборке при переходе от одной возрастной группы к другой, повышает точность индивидуального прогноза.
Критерий валидности по возрастной дифференциации обычно не находит широкого применения при валидизации методик, предназначенных для психологической диагностики функций, свойств, не обнаруживающих четкой и однозначной тенденции к возрастным изменениям. К их числу, в частности, относятся методики диагностики личности.
Одной из конкретных форм выражения показателей валидности по возрастной дифференциации является статистический анализ достоверности различий между результатами теста у испытуемых различного возраста. Более точным, но и более трудоемким и продолжительным методом определения валидности по возрастной дифференциации является лонгитюдное исследование.
ЛЕКЦИЯ № 12. Содержательная валидность
1. Сущность, область применения. Этапы валидизации
Содержательная валидность
– один из основных типов валидности методики, характеризующий степень репрезентативности содержания заданий теста измеряемой области психических свойств.
Комплекс сведений содержательной валидности традиционно имеет наибольшее значение для тестов, исследующих деятельность, близкую или совпадающую с реальной (чаще всего учебной или профессиональной). Изучаемая деятельность носит, как правило, синтетический характер, складывается из многих, подчас разнородных факторов (проявлений личностных особенностей, комплекса необходимых знаний и навыков, специфические способностей и т. д.). Поэтому одной из важнейших задач создания адекватной модели тестируемой деятельности является подбор таких заданий, которые будут охватывать главные аспекты изучаемого феномена в правильной пропорции к реальной деятельности в целом.
Валидность по содержанию закладывается в тест уже при подборе заданий будущей методики. Первым этапом валидизации является определение круга исследуемых свойств и видов деятельности, расчленение сложной способности или деятельности на элементы. На втором этапе разрабатывают собственно модель тестовой деятельности на основе наиболее важных элементов реальной деятельности. Наконец, на последнем этапе проводят анализ степени соответствия разработанной модели реальной деятельности, проверку соответствия пропорций представленности элементов в заданиях теста и в реальной деятельности. Так, для тестов достижений по отдельным предметам разработке конкретного содержания тестовых задач предшествуют полная систематическая проверка соответствующих учебников и учебных программ, а также консультации со специалистами по данному предмету. На основе собранной таким путем информации составляют спецификацию теста, где указывают тестируемые области содержания (темы), задачи (процессы) обучения, а также относительное значение каждой темы и процесса для достижения целей обучения на данном этапе. Конкретные задания оцениваются экспертами по принципу их близости к реальным требованиям. Эксперты выносят суждения о том, охватывает ли тест репрезентативную выборку конкретных навыков и знаний исследуемой области обучения.
Широкое использование экспертных оценок сближает содержательную валидность с процедурой определения критериальной валидности. Однако существенным различием между этими типами валидности является то, что экспертные оценки при анализе содержания являются критерием самого теста, в то время как при критериальной валидизации они относятся к испытуемым из выборки стандартизации. Расчленение изучаемой деятельности или способности на элементы является необходимым этапом характеристики синтетической валидности. В содержательной валидности синтетический подход реализуется в анализе элементного состава содержания самого теста, а не в совокупности внешних валидизации критериев.
Экспертная оценка адекватности содержания заданий теста может быть дополнена при характеристике содержательной валидности рядом эмпирических процедур. Так, можно проверить, насколько от класса к классу повышается суммарный показатель для группы и индивидуальное выполнение теста достижений. Эта процедура в значительной мере близка определению валидности конструктной с помощью критерия возрастной дифференциации. Роль этого критерия при оценке содержательной валидности заключается не в верификации конструкта, лежащего в основе теста, а лишь в анализе гипотез, приведших к выбору того или иного материала теста.
Наряду с тестами достижений содержательная валидность является одной из важнейших форм валидизации критериально-ориентированных тестов
, а также методик, предназначенных для профотбора, анализа успешности овладения профессией.
Для валидизации личностных опросников и тестов интеллекта критерии содержательной валидности имеют ограниченное применение и используются лишь на начальных стадиях составления теста. Личностные опросники, как правило, не имеют того сходства с исследуемой областью поведения, как это имеет место в случае тестов достижений. Ответы на вопросы анкеты, опросника, данные проективных исследований позволяют лишь косвенно судить о реальной деятельности испытуемого. Проявление личностных свойств и реализация способностей в деятельности могут носить индивидуальный характер.
При проведении теста интеллекта эффективное решение заданий может достигаться за счет логического мышления, механической памяти, психомоторной подвижности, разными путями и способами. Наконец, в отличие от тестов достижений опросники личностные и тесты интеллекта прямо не связаны с конкретным курсом обучения или общностью предшествовавшего жизненного опыта, на которых строится содержание тестов достижений.
2. Очевидная валидность
Очевидная валидность
– представление о тесте, сфере его применения, результативности и прогностической ценности, которое возникает у испытуемого или другого лица, не располагающего специальными сведениями о характере использования и целях методики. Очевидная валидность не является компонентом объективно устанавливаемой валидности. Вместе с тем высокая очевидная валидность в большинстве случаев является весьма желательной. Она выступает в качестве фактора, побуждающего испытуемых к обследованию, способствует более серьезному и ответственному отношению к работе по выполнению заданий теста и к заключениям, формулируемым психологом.
Достаточный уровень очевидной валидности особенно значим для методик обследования взрослых. Если содержание тестовых заданий будет представляться несерьезным, чрезмерно легким, не соответствующим сути изучаемой деятельности, это может привести к ироническому, негативному или враждебному отношению испытуемых к ситуации обследования. Напротив, гипертрофированное отношение к возможностям методики, не вполне адекватное представление о ее направленности и прогностической значимости может вызвать избыточную мотивацию, нежелательную эмоциональную напряженность при обследовании, выраженное установочное поведение. Очевидно, что в приведенных случаях за счет неадекватной очевидной валидности реальная валидность теста снизится.
Представления испытуемых и пользователей психодиагностической информацией об очевидной валидности в немалой степени определяются названием методики, поскольку эта часть сведений о тесте наиболее доступна неспециалистам. Для предупреждения неадекватных мнений о методике следует избегать помещения на бланках, опросных листах, тестовых тетрадях туманных, необоснованно общих названий, которые могут быть неправильно истолкованы (например, «Тест личности», «Тест умственных способностей», «Комплексная батарея оценки достижений» и т. д.). Адекватность очевидной валидности повышается путем введения в инструкцию краткой характеристики целей исследования.
Очевидная валидность существенно улучшает применение понятных формулировок и терминов, а также заданий, по содержанию являющихся наиболее естественными с учетом возрастной, половой, профессиональной специфики испытуемых. Очевидная валидность иногда носит название внешней (face validity) или доверительной (faith validity) валидности.
ЛЕКЦИЯ № 13. Критерий валидности
1. Определение. Основное психометрическое неравенство
Соответствие теста измеряемому психическому свойству называется валидностью теста
. Валидность является важнейшим психометрическим свойством теста. Если высокая надежность говорит о том, что тест действительно что-то измеряет, то высокая валидность указывает на то, что тест измеряет именно то, что мы хотим измерить. Конечно, на валидность теста также негативно влияют случайные факторы. Поэтому в психометрике принято следующее основное психометрическое неравенство:
Валидность ? Надежность,
что означает, что валидность не может превышать надежность теста.
Но в отличие от надежности, помимо случайных факторов, на валидность теста влияют систематические факторы. Они привносят систематические искажения в результаты. Эти факторы есть другие психические свойства, которые мешают проявиться в результатах теста тому свойству, на измерение которого направлен тест.
Например, мы хотим измерить потенциал обучаемости (важнейший компонент общих интеллектуальных способностей человека). Если мы даем испытуемому тест с жестким ограничением времени исполнения и отсутствием возможности вернуться и исправить допущенную ошибку, то очевидно, что искомое психическое свойство оказывается смешанным в тесте с ложным психическим свойством – стрессоустойчивостью: испытуемые с высокими показателями стрессоустойчивости будут лучше выполнять тест. В этом проявится эффект систематического искажения.
В современной психометрике разработаны десятки разнообразных теоретических и экспериментальных методов проверки валидности тестов. Основным элементом практически всех этих методов является так называемый критерий. Критерий валидности
– это не зависимый от теста, внешний по отношению к тесту источник информации об измеряемом свойстве. Мы не можем судить о валидности теста до тех пор, пока не сравним его результаты с источником истинной (или заведомо более валидной) информации об измеряемом свойстве – с критерием.
2. Типы критериев валидности
В научных исследованиях преобладают специальные лабораторные критерии. Например, конструируется компактный тест-опросник на тревожность. А в качестве критерия валидности для него используется специальный трудоемкий объективный лабораторный эксперимент, в котором воспроизводится реальная ситуация тревожности (испытуемым-добровольцам угрожают за ошибочные действия ударами тока и т. п.).
На практике очень часто в качестве критерия валидности используются прагматические критерии – показатели эффективности той деятельности, ради прогнозирования которой предпринимается тестирование.
Очень часто в качестве критерия валидности используется экспертная оценка. Например, мы хотим убедиться, что короткий тест на измерение уровня дисциплинированности валиден. Для этого проводится опрос учителей об уровне дисциплинированности хорошо известных им учеников. После этого сравниваются результаты теста и экспертный рейтинг учеников по дисциплинированности.
Остановимся подробнее на этом последнем примере. Здесь мы имеем один из самых простых и популярных методов эмпирического (статистического) измерения валидности. Это метод известных групп. К участию в психометрическом эксперименте по проверке валидности теста приглашаются испытуемые, про которых известно, к какой группе по критерию они относятся. В случае с тестом дисциплинированности подбираются ученики, заведомо дисциплинированные по данным экспертной оценки учителей (высокая группа по критерию) и заведомо недисциплинированные (низкая группа по критерию). Ученики со средними показателями по критерию в тестировании не участвуют.
После проведения теста производится расчет, например, простейшей корреляции между тестом и критерием (табл. 1).
Таблица 1
Расчет простейшей корреляции между тестом и критерием
Элемент «a» в этой таблице – это число испытуемых, попавших в высокую группу по тесту и по критерию, элемент «b» – число испытуемых, попавших в высокую группу по тесту, но в низкую группу по критерию и т. д.
Очевидно, что при полной валидности теста элементы «b» и «с» таблицы должны быть равны нулю, т. е. тест не должен давать ошибок (говорить о том, что ученик низкодисциплинированный, когда учителя говорят о том, что ученик высокодисциплинированный – случай «с»).
3. Математическое выражение критерия валидности (коэффициент Гилфорда)
Меру совпадения (корреляции) между крайними группами по тесту и по критерию оценивают с помощью самого простого Фи-коэффициента Гилфорда:
При численности протестированной группы в 30 человек (это минимальная выборка для проверки валидности) статистически значимую связь теста с критерием мы можем констатировать – Ph1 ? 0,36. Хотя это и очень невысокая валидность, но все же тест в данном случае дает значимо лучшие результаты, чем случайное гадание.
Однако метод известных групп обладает серьезным недостатком. Он не всегда позволяет использовать тест для прогноза. Дело в том, что при формировании известных групп оценивается поведение, которое происходило в прошлом, а мы хотим сделать тест для прогноза поведения, которое будет происходить в будущем. Многие тесты, используемые в образовательной психодиагностике, обладают указанным недостатком. Они проходят в лучшем случае проверку по методике известных групп и не обладают прогностической валидностью (или эта валидность строго экспериментально не доказана).
4. Основные схемы валидизации психодиагностических методик
Решение проблемы прогностической валидности под силу только крупным научно-методическим центрам. Ведь к психометрическому исследованию по проверке прогностической валидности надо привлекать на порядок больше испытуемых – не 30, а, как минимум, 300, так как неизвестно, кто из этих 300 попадет в крайние группы.
Например, мы хотим использовать тест для прогноза готовности школьников для обучения в вузе. Это типичная прогностическая психодиагностическая задача. Кто-то должен взяться за нелегкую многолетнюю программу проверки прогностического потенциала этого теста. Нужно протестировать 300–500 школьников, а затем подождать, кто из них поступит в вуз и будет успешно там учиться. После двух-трехлетнего интервала можно сформировать критериальные группы и подсчитать корреляцию с прежними тестовыми показателями этих бывших школьников. Только после реализации такой схемы психометрического эксперимента можно утверждать, что тест прошел проверку на прогностическую валидность. Без этого мы исходим только из доверия к научной интуиции разработчика теста и не имеем независимых доказательств того, что тест можно использовать для прогноза.
Различение обычной дешевой схемы валидизации теста (по известным группам) и дорогой прогностической схемы валидизации теста – важнейший элемент психодиагностической грамотности не только для психологов, но и для педагогов, как, впрочем, и для любых заказчиков психодиагностической информации.
ЛЕКЦИЯ № 14. Стандартизация тестов
1. Тестовые нормы
Что, несомненно, должен знать и уметь делать каждый грамотный пользователь теста, так это понимать, что такое тестовые нормы и как ими пользоваться.
Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно диагностически интерпретировать. Его называют в тестологии «сырым» тестовым баллом. Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы в стандартную. Эта процедура называется стандартизацией тестового балла.
Допустим, мы провели тест из 20 заданий, и испытуемый дал 12 правильных ответов. Можно ли при этом сказать, что способность у испытуемого выражена лучше или хуже, чем в среднем? Нет. Для такого вывода нужно сравнить балл 12 со средним баллом по представительной выборке испытуемых.
Выборка, на которой определяются статистические тестовые нормы, называется выборкой стандартизации
. Ее численность, как правило, не меньше 200 человек. Столько должны принять участие в психометрическом эксперименте по определению тестовых норм – в эксперименте по стандартизации теста.
2. Корреляция качественных признаков
Корреляция качественных признаков
– метод анализа связи переменных, измеряемых в порядковых шкалах и шкалах наименований (см. шкалы измерительные). Наиболее часто такой корреляционный анализ проводят с помощью коэффициентов ранговой корреляции, используемых в случаях, когда обе переменные измеряются в шкалах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых переменных в шкалах наименований широко применяются коэффициенты сопряженности, в которых в качестве промежуточной расчетной величины используется критерий согласия Пирсона
(см. критерий X2). Наиболее часто в таких расчетах пользуются коэффициентом сопряженности Пирсона
:
Значение P всегда положительно и измеряется от нуля до единицы. Особенностью коэффициента сопряженности Пирсона является то, что максимальное его значение всегда меньше +1 и в значительной степени зависит от количества наблюдений (размера таблицы). В случае квадратной таблицы (k ? k):
Так, в таблице размером (5 ? 5) Pmax = 0,894; в таблице (10 ? 10) Рmax = 0,949. Поэтому окончательной формой выражения связи между переменными с помощью коэффициента Пирсона является его отношение к величине Рmax для данного случая (Р / Рmax).
При расчете сопряженности находит применение также коэффициент Чупрова:
где t
– число столбцов таблицы;
k
– число строк таблицы.
В психологической диагностике описанные коэффициенты используются относительно редко.
3. Ранговая корреляция
Ранговая корреляция
– метод корреляционного анализа, отражающий отношения переменных, упорядоченных по возрастанию их значения. Наиболее часто ранговая корреляция применяется для анализа связи между признаками, измеряемыми в порядковых шкалах (см. шкалы измерительные), а также как один из методов определения корреляции качественных признаков. Достоинством коэффициентов ранговой корреляции является возможность их использования независимо от характера распределения коррелирующих признаков.
В практике наиболее часто применяются такие ранговые меры связи, как коэффициенты ранговой корреляции Спирмена и Кендалла. Первым этапом расчета коэффициентов ранговой корреляции является ранжирование рядов переменных (табл. 2). Процедура ранжирования начинается с расположения переменных по возрастанию их значений. Разным значениям присваиваются ранги, обозначаемые натуральными числами. Если встречается несколько равных по значению переменных, им присваивается усредненный ранг.
Таблица 2
Ранжирование распределения показателей теста (n = 18)
В таблице 2 приведены данные для расчета коэффициентов ранговой корреляции. Во второй графе представлены ранжированные показатели по первому из сравниваемых распределений (оценка IQ, в третьей графе – соответствующие им данные теста зрительной памяти).
Коэффициент корреляции рангов Спирмена (rs)
определяется из уравнения:
где di
– разности между рангами каждой переменной из пар значений X и Y;
n
– число сопоставляемых пар.
Используя данные таблицы 2, получаем:
Коэффициент корреляции рангов Кендалла
? определяется следующей формулой:
где Р
и Q
рассчитываются по таблице 12.
Так, в восьмой графе подсчитывается, начиная с первого объекта X, сколько раз его ранг по Y меньше, чем ранг объектов, расположенных ниже. Соответственно, в девятой графе (S2) фиксируется, сколько раз ранг Y больше, чем ранги, стоящие ниже его в столбце X. Подставляя эти данные в формулу, получаем:
При сопоставлении приведенных коэффициентов оказывается, что коэффициент ? более информативен, чем rs, и рассчитывается проще. Поэтому на практике при расчете рановой корреляции отдают предпочтение коэффициенту ? (табл. 3).
Таблица 3
Распределение IQ-оценок и показателей теста зрительной памяти
ЛЕКЦИЯ № 15. Измерительные шкалы
Измерительные шкалы
(от лат. scala – «лестница») – форма фиксации совокупности признаков изучаемого объекта с упорядочиванием их в определенную числовую систему. Измерительные шкалы представляют собой метрические системы, моделирующие исследуемый феномен путем замены прямых обозначений изучаемых объектов числовыми значениями и отображение пропорций континуального состава элементов объекта в соответствующих числах. Каждому элементу совокупности проявлений свойств изучаемого объекта соответствует определенный балл или шкальный индекс, количественно устанавливающий положение наблюдаемой единицы на шкале, которая охватывает всю совокупность или ее часть, существенную с точки зрения задач исследования. Операция упорядочивания исходных эмпирических данных в шкальные носит название шкалирования. Измерительные шкалы являются главным средством сбора и анализа статистического материала как в прикладных, так и в теоретических исследованиях. Они различаются в зависимости от характера функции, лежащей в основе их построения. В качестве такой функции могут служить: сравнение по признаку убывания или возрастания, ранжирование, оценка интенсивности признака или оценка пропорциональных отношений между признаками. Наиболее общая классификация измерительных шкал предложена С. Стивенсон
. В ее основу положен признак метрической детерминированности. Согласно этому признаку шкалы делятся на метрические
(интервальные и шкалы отношений) и неметрические
(номинативные, шкалы порядка).
1. Номинативные шкалы
Номинативные шкалы (шкалы наименований)
устанавливают соответствие признака тому или иному классу. Объекты объединяют в классы на основании какого-либо общего свойства (классы эквивалентности) либо символа (обозначения). Необязательно, чтобы между выявленными классами существовала внутренняя взаимосвязь. Само название «шкала наименований» указывает на то, что значения по шкале играют роль лишь названий классов. Одним из распространенных видов номинативной шкалы является классификация объектов на две группы по принципу «А – не-А» (альтернативные признаки в дихотомической шкале наименований). Конкретными примерами применения такой шкалы являются оценивание ответа испытуемого на пункт опросника в виде утверждения или отрицания, соответствие или несоответствие полученного вида ответа ключу (коду) измеряемого свойства (см. личностные опросники).
Примером оценивания в номинативной шкале могут служить классификация решений тестовой задачи или пункт опросника с задачей закрытого типа.
Из названных городов северней расположен город…
1) Псков;
2) Нижний Новгород;
3) Волгоград;
4) Новосибирск;
5) Красноярск.
Противоположностью значения «великодушный» является…
1) расточительный;
2) упрямый;
3) малодушный;
4) скупой;
5) щедрый.
Другой простейшей разновидностью номинативной шкалы является перечень или набор каких-либо признаков, группируемых при сборе информации или ее обработке.
Вы предпочитаете проводить досуг…
1) с товарищами и приятелями;
2) на лоне природы;
3) в занятиях спортом;
4) в кругу семьи и т. д.
Распределение признаков в классах шкалы наименований можно охарактеризовать путем определения абсолютных и относительных частот встречаемости, возможно также определение модальных и центральных значений в классах. Оценка статистической связи между группами признаков возможна с помощью анализа корреляции (см. корреляция качественных признаков).
Если один из рядов переменных представлен в дихотомической шкале наименований, а другой – в любой иной (интернальной, отношений или порядковой), то применяются коэффициенты корреляции бисериальной. Переменные в дихотомической шкале могут распределяться по нормальному закону или иначе в зависимости от этого выбирают способ расчета коэффициентов корреляции.
В строгом смысле номинативная шкала не является шкалой измерения. Она допускает лишь операцию равенства и неравенства и более или менее дифференцированную классификацию признаков. Вместе с тем в психологических исследованиях и психологической диагностике этот вид измерительных шкал имеет достаточно большое значение, особенно при фиксации качественной информации (например, данных проективных методик при сборе психологического анамнеза и т. д.).
2. Порядковые шкалы
Порядковые шкалы (ординальные)
предназначены для расчленения совокупности признаков на элементы, связанные отношением «больше – меньше», и допускают отнесение переменных к группам, упорядоченным (ранжированным) друг относительно друга и представляющим некое системное единство. Порядковые шкалы дают возможность оценить степень выраженности признака. Они содержат не менее трех классов с установленной последовательностью, не допускающей перестановки. Так, между двумя показателями объектов А и В, обладающих признаком X, возможны три вида отношений: ХА = ХB; ХА ‹ ХB; ХА › ХB. Если имеются три объекта A, В, С и между ними установлены отношения ХА ‹ ХB, ХB ‹ ХC, из этого следует, что ХА ‹ ХC. При этом значения разностей между признаками не устанавливаются (шкала неметрическая, единицы измерения отсутствуют). Упорядочивание признаков в ординальной шкале может быть униполярным (при определении классов исходят из степени выраженности измеряемого свойства) и биполярным (в основе разделения лежит ранг степени приближения к одному из противоположных полюсов свойства).
В качестве примера униполярного упорядочивания может быть приведена шкала оценивания качеств внимания: «весьма устойчивое /устойчивое / лабильное / рассеянное». Примером оценивания по биполярному принципу может служить идентификация выраженности свойств между полярными антонимическими характеристиками свойств личностных проявлений:
1) уравновешенный… нестабильный;
2) общительный… замкнутый;
3) подвижный… медлительный.
Порядковые шкалы относятся к числу распространенных в психологической диагностике. В качестве одного из практических приемов оценивания результатов испытуемого по порядковой шкале можно привести модификацию теста «Прогрессивные матрицы Равена», в котором каждый ответ включает три варианта, последовательно приближающихся к правильному. Вариантом применения порядковой шкалы может быть закрытый дифференцированный ответ на пункт опросника:
Бывает, что я никак не могу принять какое-то окончательное решение и упускаю возможность сделать что-то своевременно.
1. Полностью согласен.
2. Пожалуй, могу согласиться.
3. Не уверен.
4. Скорее не согласен.
5. Совершенно не согласен.
Порядковая шкала допускает операции равенства / неравенства и сравнения по интенсивности. По сравнению со шкалой наименований здесь возможны определение медианы распределения
, использование коэффициентов ранговой корреляции
и сопряженности
(см. корреляция качественных признаков).
3. Метрические шкалы
Шкала интервалов относится к метрическим шкалам, в которых элементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе ранжирования признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака.
В шкале интервалов нулевая точка отсчета может устанавливаться произвольно, а величины единиц и направление отсчета могут определяться по избираемым константам.
К разряду шкалы интервалов относятся шкалы стандартного IQ-показателя, Т-баллов, процентилей и другие (см. стандартизация, оценки шкальные). Шкалирование в интервальной шкале составляет основу психометрических измерений.
В шкалах отношений (пропорциональных) числовые значения присваиваются объектам таким образом, чтобы между числами и объектами соблюдалась пропорциональность. Начало отсчета в такой шкале фиксировано. Шкала предусматривает операции равенства / неравенства, больше / меньше, равенства интервалов и равенства отношений.
Примером использования такой шкалы в психологических измерениях может служить шкала порогов абсолютной чувствительности анализатора.
Наряду с делением шкал на метрические и неметрические существует классификация по признаку формы фиксации эмпирических данных, а именно: шкалы вербальные, шкалы числовые и шкалы графические.
В психологической диагностике важным практическим вопросом является оценка надежности, одномерности и обоснованности измерительных шкал. Надежность шкалы определяется на основе анализа устойчивости повторных измерений.
Под валидностью понимается обоснование гипотезы о приспособленности данной шкалы для измерения критериального качества, о полноте его отражения и техническом соответствии самой процедуры шкалирования. Под одномерностью или соразмерностью шкалы понимаются сопоставимость шкалируемых параметров, отсутствие их смещений или пропорциональность между положительными и отрицательными полюсами шкалы, равенство интервалов шкалы или симметричность различных позиций.
ЛЕКЦИЯ № 16. Типы тестирования
1. Тестовая батарея
Тестовая батарея
– совокупность групп тестовых заданий (субтестов), объединенных в одну психодиагностическую методику и направленных на измерение различных сторон сложного психологического конструкта.
Наиболее известными и распространенными в современной психологической диагностике примерами тестовых батарей являются шкалы измерения интеллекта Векслера, батарея тестов общих способностей (GATB), тест структуры интеллекта Амтхауэра (TSI). Составные методики с включением в них различных групп заданий, направленных на изучение вербальных и практических сторон общих способностей, довольно распространены среди тестов интеллекта.
Комплекс заданий, включенных в тестовую батарею, в значительной мере отражает элементный состав конструкта, на исследование которого направлена данная методика (см. валидность конструктная). Так, батарея тестов WISC (см. шкалы измерения интеллекта Векслера) включает задания на общую осведомленность, понимание, способность к установлению сходства и аналогий, визуальную комбинаторику и репродукцию, смысловой анализ последовательных событий, арифметические способности и навыки, изучение репродуктивной функции памяти и т. д. В совокупности результаты измерений по отдельным субтестам с той или иной степенью полноты репрезентируют исследуемое комплексное качество (в данном примере – комплекс общих способностей).
Несмотря на принадлежность к общей методике, некоторые субтесты тестовых батарей используются в отдельности для решения определенных узких диагностических задач. Часто отдельные субтесты тестовых батарей снабжаются собственными частными нормами и стандартами выполнения. Возможность их комбинирования в зависимости от ситуации обследования является специфической особенностью многих батарейных методик.
Для отдельных многосубтестовых тестовых батарей, таких, например, как шкалы Векслера, шкала умственного развития Стэнфорд-Бине и других, разработаны сокращенные варианты, состоящие из наиболее нагруженных исследуемыми факторами субтестов, результаты которых тесно коррелируют с результатами полной батареи.
Невзирая на относительную независимость некоторых субтестов тестовой батареи, непременным условием разработки методики и оценки качеств теста в целом является анализ внутренней согласованности, трудности заданий теста, валидности заданий теста не только с точки зрения состава задач отдельных субтестов, но и связи отдельных субтестов с общим результатом тестовой батареи. Таким образом, процедура разработки и проверки диагностических качеств батарейных методик значительно усложняется по сравнению с единичными тестами. Тестовые батареи проходят процедуру исследования валидности, дискриминативности, внутренней согласованности сначала раздельно, по субтестам, а затем в целом.
2. Миннесотский многоаспектный личностный опросник
Миннесотский многоаспектный личностный опросник (MinnesotaMultiphasicPersonalityInventory
, MMPI)
– предложен С. Хатуэем
и Дж . Маккинли
в 1940 г. MMPI является реализацией типологического подхода к изучению личности и занимает ведущее место среди других личностных опросников в психодиагностических исследованиях (библиография составляет около 4000 названий). Опросник состоит из 550 утверждений, образующих десять основных диагностических шкал. На каждое из утверждений обследуемые (лица в возрасте от 16 лет и старше с коэффициентом интеллекта не ниже 80) должны дать ответ: «Верно», «Неверно», «Не могу сказать». Ответ, совпадающий с ключом, оценивается в 1 балл. Возможны различные варианты предъявления утверждений, обычно это делается с помощью карточек, которые обследуемый раскладывает на три группы в соответствии со своим ответом. Полученные данные заносятся экспериментатором в стандартный регистрационный бланк, в котором отмечаются также сведения об обследуемом и время, затраченное на раскладку карточек. Завершается обследование построением профиля личности, который вычерчивается на специальных бланках (два вида – для мужчин и женщин), где балльные оценки переводятся в стандартные, так называемый Т-оценки (см. оценки шкальные) со средним значением 50 и стандартным отклонением 10. Для ускорения интерпретации структуры показателей, экономного описания профиля используется система его числового кодирования (см. кодирование оценок тестовых). Для этого шкалы записываются по их цифровому обозначению в таком порядке, чтобы на первом месте оказалась шкала с наиболее высокими показателями, а затем – остальные по мере снижения. С помощью специальных значков показывают, как высоко расположены шкалы профиля, например расположенные на уровне 120 Т – «!!», 110–119 Т – «!», 100–109 Т – «**». Существует несколько способов кодирования профиля.
Приведем основные клинические шкалы MMPI
и примеры утверждений по каждой из них (каждая из шкал включает ряд утверждений, одновременно входящих в другие шкалы).
A. Шкала ипохондрии (HS) определяет близость обследуемого к астеноневротическому типу личности.
Примеры.
1. Несколько раз в неделю меня беспокоят неприятные ощущения в верхней части живота (под ложечкой).
2. У меня часто бывает такое чувство, будто голова стянута обручем.
Б. Шкала депрессии (D) предназначена для определения степени субъективной депрессии, морального дискомфорта (гипотимический тип личности).
Примеры.
1. У меня беспокойный, прерывистый сон.
2. Любая работа дается мне ценой больших усилий.
B. Шкала истерии (Ну) разработана для выявления лиц, склонных к невротическим реакциям конверсионного типа (использование симптомов физического заболевания в качестве средства разрешения сложных ситуаций).
Примеры.
1. Я никогда не падал(-а) в обморок.
2. Часто я ощущаю комок в горле.
Г. Шкала психопатии (Ра) направлена на диагностику социопатического типа личности.
Примеры.
1. Иногда мне очень хочется уйти из дома.
2. В школе меня вызывали к директору за прогулы.
Д. Шкала мужественности / женственности (MF) предназначена для измерения степени идентификации обследуемого с ролью мужчины или женщины, предписываемой обществом.
Примеры.
1. Я очень люблю охоту.
2. Я люблю поэзию.
Е. Шкала паранойи (Ра) позволяет судить о наличии сверхценных идей, подозрительности (паранойяльный тип личности).
Примеры.
1. Я думаю, что за мной следят.
2. Большинство людей честны только потому, что боятся наказания.
Ж. Шкала психастении (Pt) устанавливает сходство обследуемого с больными, страдающими фобиями, навязчивыми действиями и мыслями (тревожно-мнительный тип личности).
Примеры.
1. Меня беспокоит то, что я могу сойти с ума.
2. В школьные годы мне было трудно говорить перед всем классом.
3. Шкала шизофрении (Sc) направлена на диагностику шизоидного (аутического) типа личности.
Примеры.
1. Когда вокруг никого нет, я слышу странные вещи.
2. Я опасаюсь пользоваться ножом, другими острыми и колющими предметами.
И. Шкала гипомании (Ма) определяет степень близости обследуемого гипертимному типу личности.
Примеры.
1. Я – значительная личность.
2. Временами у меня мысли текут быстрее, чем я успеваю их высказать.
К. Шкала социальной интроверсии (Si) диагностика степени соответствия интровертированному типу личности. Клинической шкалой не является, добавлена в опросник в ходе его дальнейшей разработки.
Примеры.
1. Люблю поухаживать за женщинами (пококетничать с мужчинами).
2. Мне нравится ходить туда, где шумно и весело.
Особенностью MMPI является использование в нем четырех оценочных шкал
(см. шкалы контрольные):
1. Шкала «?» может быть названа шкалой условно, так как не имеет относящихся к ней утверждений. Регистрирует количество утверждений, которые обследуемый не смог отнести ни к верным, ни к неверным.
2. Шкала «лжи» (L) предназначена для оценки искренности обследуемого.
3. Шкала достоверности (F) создана для выявления недостоверных результатов (связанных с небрежностью обследуемого), а также аггравации и симуляции.
4. Шкала коррекции (К) введена, для того чтобы сгладить искажения, вносимые чрезмерной недоступностью и осторожностью обследуемого.
Соотношения между показателями, полученными по этим шкалам, позволяют судить о достоверности результатов обследования.
Собственной теоретической основы MMPI не имеет. Для составления утверждений авторы использовали жалобы больных, описания симптоматики тех или иных психических заболеваний в клинических руководствах (классификация психических заболеваний, предложенная Э. Крепелином), ранее разработанные опросники. Первоначально утверждения были предъявлены значительной группе здоровых людей, что позволило определить их нормативные показатели. Затем эти показатели были сопоставлены с данными, полученными при обследовании различных клинических групп. Так были отобраны утверждения, которые достоверно дифференцировали здоровых и каждую из изученных групп больных. Эти утверждения объединили в шкалы, названные в соответствии с клинической группой, по которой та или иная шкала была валидизирована.
При интерпретации полученных результатов исходят из того, что любой показатель, равный 70Т или выше (пик профиля), принимается в качестве нормативного для выявления патологических отклонений. В то же время необходимо учитывать, что значение одного и того же показателя как патологического может изменяться от шкалы к шкале. Следует избегать буквальной интерпретации шкал MMPI; в частности нельзя полагать, что высокий показатель по шкале шизофрении указывает на ее наличие. Авторы подчеркивают, что с помощью шкал MMPI измеряется не, скажем, истерия, а симптомы, присущие лицам с данным психическим расстройством. На особенности профиля личности влияют возраст, пол, образование обследуемого, его отношение к процедуре тестирования и некоторые другие переменные. Любая гипотеза, исходящая из интерпретации ведущих пиков профиля, должна быть подтверждена показателями других шкал и прежде всего независимыми от результатов, полученных с помощью MMPI, данными о личности обследуемого.
Неоднократно проводившийся факторный анализ
данных MMPI в различных группах (В. Далстром
и Г. Уэлш
, 1965; Ю. М. Забродин
с соавторами, 1987 и др.) позволил выделить наряду с другими факторы, близкие нейротизму и экстраверсии (см. Айзенка личностные опросники; опросник «Шестнадцать личностных факторов»). Валидность MMPI, установленная на основе дифференциации клинических групп, достаточно высока. Коэффициент ретестовой надежности
шкал, по данным В. Далстрома
и Г. Уэлша
, в различных группах обследованных колеблется от 0,05 до 0,86 и в среднем составляет 0,50-0,80.
Помимо основных и оценочных шкал, на базе утверждений MMPI создано множество дополнительных шкал (около 500). Например, шкала академических способностей, алкоголизма, социальной ответственности, ригидности и т. д. Важную роль при интерпретации профиля личности играют те дополнительные шкалы, с помощью которых конкретизируются, уточняются результаты основных. Так, шкала депрессии имеет следующие дополнительные шкалы: D, – субъективной депрессии; D2 – психомоторной заторможенности; D3 – физической слабости; D4 – психологической скованности; D5 – мрачной угрюмости.
Неоднократно предлагались сокращенные варианты опросника. Один из наиболее известных – Mini
-Mult
, состоящий из 71 утверждения, отобранного на основе факторного анализа. В зарубежных исследованиях конструктной валидности Mini-Mult указывается на его достаточную валидность при групповой диагностике, а при индивидуальной – только в случаях выраженных психических отклонений. На русском языке Mini-Mult адаптирован В. П. Зайцевым
(1981), однако имеются данные об отсутствии валидности этой методики.
Утверждения MMPI часто используют для конструирования других личностных опросников (см. Айзенка личностные опросники, шкала «Проявления тревожности»). В последние годы для облегчения обработки данных все шире привлекаются различные компьютерные программы.
MMPI широко применяется в отечественных психодиагностических исследованиях. Адаптация опросника началась еще в 1960-е гг. Первым был предложен вариант, состоящий из 384 утверждений Ф. Б. Березин
и М. П. Мирошников
, 1967). Ф. Б. Березиным с соавторами разработана оригинальная интерпретация шкал MMPI, осуществлена его тщательная стандартизация. Большая работа по адаптации опросника проводилась также в Ленинградском психоневрологическом институте им. В. М. Бехтерева, московскими психологами (Л. Н. Собчик
, 1971). На основе утверждений MMPI петербургскими психологами и психиатрами созданы новые дифференциально-диагностические шкалы: параноидной шизофрении, уровня невротизации и психопатизации, депрессивных состояний. Предпринимались попытки использования компьютера для интерпретации данных, полученных с помощью MMPI.
В 1989 г. опросник был значительно переработан (рестандартизационный проект начался в 1982 г.) и опубликован под названием MMPI-2 (Дж. Бучер
, В. Далстром
, Дж. Грэхем
, А. Теллиджен
и Б. Кэммер
, 1989). Одновременно были изданы как обычная, так и компьютерная версии (см. компьютерные тесты). Новая редакция опросника содержит 567 утверждений, из которых 394 взяты из раннего варианта, 66 модифицированы и 107 разработаны вновь. MMPI-2 так же, как и MMPI, содержит три шкалы контрольные и десять шкал клинических (утверждения 1-370). Новые шкалы были разработаны специально для MMPI-2. С их помощью оцениваются такие свойства, как:
1) тревожность;
2) подверженность страхам;
3) обсессивность;
4) депрессивность;
5) забота о здоровье;
6) причудливость, странность мышления;
7) гневливость;
8) циничность;
9) склонность к антисоциальным поступкам;
10) близость типу А личности;
11) низкая самооценка;
12) семейные проблемы;
13) социальный дискомфорт;
14) помехи в работе;
15) негативные индикаторы для лечения.
MMPI-2 содержит и три новые контрольные шкалы (Fb, VRIN и TRIN). Первая шкала состоит из редко подтверждаемых утверждений. Вторая и третья – шкалы несовместимости ответов, с помощью которых оценивается степень выраженности у обследуемого тенденции отвечать в противоречивой манере. Новые нормативные данные базируются на выборке, состоящей из 1138 мужчин и 1462 женщин в возрасте от 18 до 84 лет.
В последнее время обсуждается вопрос об имеющихся различиях в подъеме профиля по данным MMPI и MMPI-2. В общем отмечается, что профиль по клиническим шкалам MMPI-2 менее поднят, нежели в MMPI. В итоге снижается демаркационная линия подъема клинических шкал (от Т больше 70 в MMPI до Т больше 65 в MMPI-2).
Разработан вариант для обследования лиц моложе 18 лет – MMPI-А.
3. Опросник «Шестнадцать личностных факторов»
Опросник «Шестнадцать личностных факторов» (SixteenPersonalityFactorQuestionnaire, 16 PF)
– личностный опросник. Впервые опубликован Р. Кэттелл
в 1950 г., последнее переработанное руководство опросника «Шестнадцать личностных факторов» вышло в 1970 г. (Р. Кэттелл с соавторами). Предназначен для измерения 16 факторов личности и является реализацией подхода к ее исследованию на основе черт.
Разработаны две основные эквивалентные формы опросника (А и В, причем А считается стандартной формой) по 187 вопросов в каждой (для обследования взрослых людей с образованием не ниже чем 8–9 классов). В обеих формах ШЛФ по 3 буферных вопроса и от 20 до 26 вопросов, относящихся к каждому из измеряемых факторов. Обследуемому предлагают занести в регистрационный бланк один из вариантов ответа на вопрос: «Да», «Нет», «Не знаю» (или «а», «в», «с»); при этом его предупреждают о том, чтобы ответов «Не знаю» было как можно меньше. Полученные результаты выражаются в шкале стэнов
с минимальным значением в 0 баллов, максимальным – 10 и средним 5,5 балла (см. оценки шкальные). Строится профиль личности, при интерпретации которого руководствуются степенью выраженности каждого фактора, особенностями их взаимодействия, а также нормативными данными.
В разработке ШЛФ Р. Кэттелл первоначально исходил из так называемый L-данных (life record data), т. е. данных, полученных путем регистрации реального поведения человека в повседневной жизни. Выделенные Г. Олпортом
и X. Олдберг
4500 слов, ясно обозначающих черты личности и особенности поведения (на базе словаря из 18 000 слов), Р. Кэттелл разбил на синонимичные группы и отобрал в каждой из них по одному слову, выражающему основное смысловое содержание соответствующей группы. Это позволило сократить список личностных черт до 171. Затем каждая из этих характеристик личности оценивалась экспертами с целью выбора наиболее значимых. Взаимная корреляция экспертных оценок позволила выделить 36 корреляционных плеяд, внутри которых расположились высококоррелирующие характеристики. Все плеяды содержали пары членов, имеющие значимые отрицательные корреляции, например веселый – печальный, разговорчивый – молчаливый и т. д. Так был получен набор из 36 биполярных названий, который был расширен до 46 за счет включения специальных терминов, найденных в работах других исследователей. Для всех биполярных пар были составлены рабочие определения. Например: эмоциональный (всегда аффектированный, возбужденный, много смеется, часто бывает сердит, проявления эмоций отличаются чрезмерной выразительностью) – стабильный (эмоциональная выразительность отсутствует, диапазон эмоциональных проявлений мал, сохраняет спокойствие даже в эмоциогенных ситуациях).
В результате факторизации L-данных (см. факторный анализ) было получено от 12 до 15 факторов. В дальнейшем Р. Кэттелл осуществил переход (обусловленный трудностями экспертного оценивания) к Q-данным (questionnaire data), т. е. данным, полученным с помощью опросников. При этом сбор Q-данных координировался с имеющимися L-данными. Р. Кэттеллом созданы разные модификации факторных моделей с различным числом входящих в них факторов, однако наиболее известной является 16-факторная, соотнесенная с опросником «Шестнадцать личностных факторов». Факторы личности, диагностируемые опросником «Шестнадцать личностных факторов», обозначаются буквами латинского алфавита, причем буква «Q» используется только для тех факторов, которые выделены на основе Q-данных. Факторы имеют бытовые и технические названия. Первые представляют собой общедоступные определения, ориентированные на непрофессионалов. Например, фактор А – «сердечность, доброта – обособленность, отчужденность». Технические названия предназначены для специалистов и тесно связаны с научно установленным значением фактора. При этом часто используются искусственно созданные названия, например тот же фактор А будет определяться как «аффектотимия – сизотимия». Как бытовые, так и технические названия факторов даются в биполярной форме, чем устраняется двусмысленность в определении их содержания. Следует иметь в виду, что определение концов оси фактора как положительных (+), так и отрицательных (-) условно и не имеет ни этического, ни психологического смысла. Обычно описание каждого фактора
у Р. Кэттелла состоит из разделов:
1) буквенного индекса фактора; разработана также система универсальной индексации, включающая сведения о принципе выделения того или иного фактора и его порядковом номере;
2) технического и бытового названия;
3) списка наиболее значимых характеристик в L-данных;
4) интерпретации фактора. Например, фактор С, выделенный на основе L– и Q-данных (по В. М. Мельникову
и Л. Т. Ямпольскому
, 1985, с сокращениями), (табл. 4).
Таблица 4
Интерпретация фактора С по Р. Кэттеллу
Окончание таблицы 4
Интерпретация фактора С по Р. Кэттеллу
Некоторые вопросы по фактору С.
1. У меня всегда хватает сил, чтобы справиться с трудностями.
2. Мне часто приходилось менять планы из-за состояния здоровья.
Этот фактор характеризует способность управлять эмоциями и настроением, особенно умение найти им адекватное объяснение и реалистическое выражение. Высокие оценки обнаруживаются у лиц эмоционально зрелых, уверенных в себе, не поддающихся случайным колебаниям настроения. Низкие оценки бывают у людей, которые не способны контролировать эмоции и импульсивные влечения и выразить их в социально-допустимой форме. Внешне это проявляется как плохой эмоциональный контроль, отсутствие чувства ответственности, уклонение от реальности (табл. 5).
Таблица 5
Полный перечень факторов, измеряемых опросником «Шестнадцать личностных факторов»
Окончание таблицы 5
Полный перечень факторов, измеряемых опросником «Шестнадцать личностных факторов»
Рассмотренные выше факторы – первого порядка. В итоге их дальнейшей факторизации были выделены более общие факторы второго порядка. Р. Кэттелл неоднократно извлекал вторичные факторы из корреляций между первичными. В разных работах автора представлено от четырех до восьми вторичных факторов.
Наиболее важными из них являются «эксвия – инвия» и «тревожность – приспособленность» (см. личностные опросники Айзенка). Эти факторы описываются следующим образом (табл. 6).
Таблица 6
Описание вторичных факторов по Р. Кэттелу
Предпринимались попытки получения факторов третьего порядка, однако практического значения результаты не имеют.
Подход Р. Кэттелла к исследованию личности достаточно уязвим. Отметим лишь наиболее слабые точки. Прежде всего это выраженный эмпиризм
, пренебрежение какими-либо исходными теоретическими положениями о содержании и количестве определяемых черт личности. При избранной автором технике сбора данных ничего не известно о функциональных связях между переменными; эти связи выражаются лишь в виде корреляций – меры степени линейной зависимости между переменными. Не удалось верифицировать и исходную гипотезу об идентичности структурных элементов в факторах, выделенных на основе L-данных, и тех, которые выделены на основе Q-данных. В факторах, выделенных из L-данных, обнаруживаются те, которым нет соответствия в факторах, выделенных из Q-данных, и наоборот. Исключительно низки интеркорреляции переменных, якобы характеризующих один и тот же фактор, но полученных из разных источников (L– и Q-данные). Сказанное позволяет сделать вывод о том, что Р. Кэттелл принял факторный анализ за гораздо более эффективный инструмент познания личности, чем он фактически является.
Коэффициент надежности шкал-факторов опросником «Шестнадцать личностных факторов», определенный путем расщепления, находится в пределах 0,71-0,91. Коэффициент ретестовой надежности через двухнедельный промежуток – 0,36-0,73. Автор также сообщает о достаточно высокой валидности опросника.
Р. Кэттеллом и его сотрудниками, помимо двух основных форм опросника «Шестнадцать личностных факторов» (А и В), разработаны формы С, D и Е. Формы С и D сокращенные – по 105 заданий – и предназначены для лиц, имеющих более низкий уровень образования. Форма Е используется для обследования тех, кто малограмотен (в 1985 г. опубликованы нормы для заключенных, культурно неприспособленных и других лиц). Б. Брианом
в 1987 г. на основе формы Е предложен компьютерный (см. компьютерные тесты) «Профессионально-личностный отчет» (Vocational Personality Report), предназначенный для использовании в консультациях по выбору работы и службах планирования для малограмотных. Известны варианты опросника для детей и подростков. Существует специальное «патологическое» дополнение к опроснику «Шестнадцать личностных факторов», которое состоит из двенадцати клинических факторов-шкал. Возможно групповое обследование.
Опросник нашел достаточно широкое распространение в психодиагностических исследованиях стран СНГ. Однако адаптация опросника «Шестнадцать личностных факторов» не завершена, несмотря на проведенную проверку соответствия зарубежных и отечественных нормативных данных. Анализ воспроизводимости факторов опросника на русскоязычных выборках (Ю. М. Забродин
с соавторами, 1987) показывает, что нельзя считать гомогенными факторы А, С, I, L, M, N, Q1 Q2 (от одной четверти до одной трети вопросов отечественного варианта опросника не коррелируют значимо с соответствующим фактором). Это требует переформулирования вопросов (утверждений) или отказа от диагностических категорий Р. Кэттелла.
В 1990 г. В. М. Русаловым и О. В. Гусевой
на основе выделенных гомогенных шкал предложен сокращенный вариант опросника под названием 8 PF (70 вопросов).
4. Факторный анализ
Факторный анализ
– комплекс аналитических методов, позволяющих выявить скрытые (латентные) признаки, а также причины их возникновения и внутренние закономерности их взаимосвязи.
Факторный анализ направлен на преобразование исходного набора признаков в более простую и содержательную форму. Центральная задача метода – переход от совокупности непосредственно измеряемых признаков изучаемого явления к комплексным обобщенным факторам, за которыми стоят комбинации исходных признаков, выделяемых на основе их внутренних закономерностей, отражающих структуру исследуемой области явлений.
Согласно точке зрения одного из создателей факторного анализа (Л. Терстона)
этот метод применяется для конденсирования тестовых оценок, сведения их к относительно малому числу независимых переменных и для выделения факторов, необходимых для описания индивидуальных различий тестовых результатов. Поэтому факторный анализ представляет собой не только метод статистической обработки исходных данных для их обобщений, но и широкий научный метод подтверждения гипотез относительно природы процессов, присущих самому измеряемому свойству.
Исходной информацией для проведения факторного анализа является корреляционная матрица, или матрица интеркорреляций показателей тестов. В некоторых моделях факторного анализа матрица может включать и другие характеристики связей и сопряженности между изучаемыми признаками (например, кластерные отношения, расстояния в семантическом пространстве и т. д.). Выделенные путем анализа интеркорреляций или других характеристик связи обобщенные факторы первого порядка могут быть представлены в виде новой матрицы, отражающей корреляции между факторами. На основе таких матриц могут определяться факторы более высокого порядка.
В истории психологии факторный анализ связан с решением ряда теоретических задач. Сначала он воспринимался как один из основных подходов к раскрытию содержания психологических свойств. Так, Ч. Спирменом
(1931) на основе анализа корреляций между результатами различных тестов была выдвинута идея единого генерального фактора (фактор G), лежащего в основе успешности выполнения любых тестов, связанных с измерением интеллектуальных свойств. Им же в 1927 г. была разработана математически обоснованная методика факторного анализа, теоретической основой которой послужила однофакторная теория, исходящая из того, что в основе матрицы интеркорреляций лежат один общий и столько единичных факторов, сколько было использовано тестов. Л. Терстоном
(1931) разработан мультифакторный анализ оценки многих коррелирующих между собой (облических) и относительно независимых (ортогональных) факторов, объясняющий мультифакторную концепцию интеллекта. После работ Л. Терстона начался период активной разработки различных математических моделей факторного анализа. В настоящее время методы факторного анализа составляют сложную специальную область математической статистики. В психологической диагностике факторный анализ широко используется как для решения исследовательских задач, так и при конструировании психодиагностических методик (например, опросник «Шестнадцать личностных факторов»).
5. Шкала «Проявления тревожности»
Шкала «Проявления тревожности» (ШПТ) (ManifestAnxietyScale
, MAS)
– личностный опросник, предназначен для измерения проявлений тревожности, опубликован Дж . Тейлор
в 1953 г.
ШПТ состоит из 50 утверждений, на которые обследуемый должен ответить «Да» или «Нет». Утверждения отбирались из набора утверждений Миннесотского многоаспектного личностного опросника (MMPI). Выбор пунктов для шкалы проявления тревожности осуществлялся на основе анализа их способности различать лиц с хроническими реакциями тревоги.
Примеры утверждений:
1. Я не в состоянии сосредоточиться на одном предмете.
2. Через день мне снятся кошмары.
3. Даже в прохладные дни я легко потею.
Обработка результатов исследования осуществляется аналогично процедуре MMPI. Индекс тревожности измеряется в шкале Т-баллов (см. шкальные оценки). Шкала проявления тревожности нередко используется в качестве одной из дополнительных шкал MMPI. При этом результат измерения тревожности не только дополняет данные по основным клиническим шкалам MMPI, но и в некоторых случаях может быть привлечен к интерпретации профиля в целом. Как показывают данные исследований (Дж . Рейх
и соавторы, 1986; Дж. Хенсер
, В. Майер
, 1986), состояние тревоги связано с изменением когнитивной оценки окружающего и самого себя. При высоких показателях уровня тревожности необходимо соблюдать известную осторожность в интерпретации данных самооценки.
Нормы шкалы «Проявления тревожности» определены на выборке, состоящей из 1971 студента университета и 103 больных различными психическими заболеваниями. Показатели ретестовой надежности – 0,82 (при интервале ретеста 5 мес.) и 0,81 (интервал ретеста 9-17 мес.). Валидностъ шкалы изучалась путем сравнивания результатов у здоровых испытуемых и лиц с различными неврологическими и психотическими нарушениями.
В СНГ шкала «Проявления тревожности» находит широкое применение в клинико-психологических исследованиях, психодиагностике спорта (В. Г. Норакидзе
, 1975; В. М. Блейхер
, Л. Ф. Бурлачук
, 1978; В. Л. Марищук
и соавторы, 1984).
6. Личностные опросники Айзенка
Личностные опросники Айзенка
– серия личностных опросников, предназначены для диагностики нейротизма, экстраверсии – интроверсии и психотизма, разработаны Г. Айзенком
с сотрудниками. Личностные опросники Айзенка являются реализацией типологического подхода к изучению личности.
Г. Айзенк в своих работах неоднократно указывал на то, что его исследования вызваны к жизни несовершенством психиатрических диагнозов. По его мнению, традиционная классификация психических заболеваний должна быть заменена системой измерений, в которой представлены важнейшие характеристики личности. При этом психические расстройства являются как бы продолжением индивидуальных различий, наблюдаемых у нормальных людей. Изучение работ К. Юнга
, Р. Вудвортса
, И. П. Павлова
, Э. Кречмера
и других известных психологов, психиатров и физиологов позволило предположить существование трех базисных измерений личности: нейротизма, экстра-, интроверсии и психотизма. Кратко остановимся на описании этих личностных измерений (в том виде, как они представлены в последних публикациях Г. Айзенка).
Нейротизм
(или эмоциональная неустойчивость) представляет собой континуум от нормальной аффективной стабильности до ее выраженной лабильности. Нейротизм не тождествен неврозу, однако у лиц с высокими показателями по данной шкале в ситуациях неблагоприятных, например стрессовых, может развиться невроз. Нейротическая личность характеризуется неадекватно сильными реакциями по отношению к вызывающим их стимулам.
Заимствуя у К. Юнга понятие экстраверсии и интроверсии, Г. Айзенк наполняет их иным содержанием. У К. Юнга это типы, различающиеся направленностью либидо, для Г. Айзенка – комплексы коррелирующих между собой черт (см. также о понятиях экстратенсии и интроверсии у Г. Роршаха – тест Роршаха). Характеризуя типичного экстраверта, Г. Айзенк отмечает его общительность, широкий круг знакомств, импульсивность, оптимистичность, слабый контроль над эмоциями и чувствами. Напротив, типичный интроверт – это спокойный, застенчивый, интроспективный человек, который отдален от всех, кроме близких людей. Он планирует свои действия заблаговременно, любит порядок во всем и держит свои чувства под строгим контролем.
По Г. Айзенку, высокие показатели по экстраверсии и нейротизму соответствуют психиатрическому диагнозу истерии, а высокие показатели по интроверсии и нейротизму – состоянию тревоги или реактивной депрессии. Измерения экстра-, интроверсии и нейротизма, которыми оперирует Г. Айзенк, в работах Р. Кэттелла
рассматриваются в качестве факторов второго порядка (см. опросник «Шестнадцать личностных факторов»).
Психотизм, как и нейротизм, континуален (норма – психотизм). В случае высоких показателей по этой шкале можно говорить о предрасположенности к психическим отклонениям. Психотическая личность (не патологическая) характеризуется Г. Айзенком как эгоцентрическая, эгоистическая, бесстрастная, неконтактная.
Большое внимание Г. Айзенк в своих исследованиях уделяет сбору экспериментальных данных, подтверждающих универсальность предложенных им измерений личности. Для этого он привлекает факторный анализ результатов многочисленных и разнородных тестов (методик), с помощью которых обследуются критериальные группы. Первоначально на основе комплекса признаков, дифференцирующих здоровых людей и больных неврозом, был выделен фактор нейротизма, позднее – фактор экстра-, интроверсии, под который Г. Айзенк в течение длительного времени стремился подвести физиологическую основу, используя ряд положений теории И. П. Павлова. В последние годы аналогичным путем обосновывается фактор психотизма. Например, одним из доказывающих экспериментов является обследование групп психотических больных, больных неврозами и здоровых лиц с помощью тестов на остроту зрения, способность опознания «зашумленных» объектов, кожно-гальванической реакции и т. п. Показано, что эти группы дифференцируются по двум факторам – нейротизму и психотизму. Остается неясным, чем руководствовались исследователи, составляя такие наборы тестов. Использованные показатели лишены теоретического обоснования, а применительно к нейротизму и психотизму не могут быть поняты в качестве внутренних условий, вызывающих невротические и психотические симптомы. И в то же время нейротизм и психотизм в случае их выраженности понимаются в качестве «предрасположенности» к соответствующим заболеваниям. Личностные измерения, предложенные Г. Айзенком, следует рассматривать как некоторые поведенческие характеристики, значение которых определяется их отношением к достаточно широкому кругу жизненных ситуаций.
Первый из опросников Г. Айзенка – «Моудслейский медицинский опросник» (Maudsley Medical Questionnaire, или MMQ, от названия клиники, в которой был создан) – был предложен в 1947 г. Он предназначен для диагностики нейротизма и состоит из 40 утверждений, с которыми обследуемому предлагается согласиться («Да») или не согласиться («Нет»).
Примеры.
1. Время от времени у меня случаются головокружения.
2. Я беспокоюсь о своем здоровье.
Утверждения были отобраны из уже известных к тому времени опросников, при этом автор опирался на клинические описания невротических расстройств. MMQ стандартизировался на материале обследования двух групп: невротиков (1000 человек) и нормальных (1000 человек). Среднее количество ответов, совпадающих с ключом, у здоровых лиц составляло 9,98, а у невротиков – 20,01. Детальный анализ ответов, полученных по каждому утверждению MMQ (при учете различий в психиатрических диагнозах), показал, что с помощью опросника могут быть дифференцированы два типа невротических расстройств: истерические и дистимические. Исходя из этих результатов, Г. Айзенк предположил, что ответы на утверждения MMQ позволяют сделать заключение и о позиции обследуемого на шкале другого измерения личности, постулируемого этим исследователем, экстраверсии – интроверсии. Этим была начата работа по конструированию нового личностного опросника. MMQ в психодиагностических исследованиях применения не нашел. Вслед за MMQ был предложен «Моудслейский личностный опросник» (Maudsley Personality Inventory, или MPI), опубликованный в 1956 г. Он предназначен для диагностики нейротизма и экстраверсии – интроверсии. MPI состоит из 48 вопросов (по 24 на каждое измерение), на которые обследуемый должен ответить «Да» или «Нет». Предусмотрен случай, когда обследуемый затрудняется ответить («?»). За ответ, совпадающий с ключом, дается 2 балла, а за «?» – 1 балл. MPI разрабатывался в соответствии с теоретическими представлениями Г. Айзенка об экстраверсии – интроверсии и нейротизме и с учетом данных, полученных с помощью первого опросника.
Приведем примеры вопросов по шкале экстраверсии – интроверсии.
1. Склонны ли вы действовать быстро, решительно?
2. Считают ли вас человеком живым, общительным?
Основанием для разработки MPI послужили данные о том, что шкалы ратимии (беззаботности) и циклоидной эмоциональности опросника Гилфорда – Мартина (один из опросников, разработанных Дж. Гилфордом с сотрудниками) дифференцируют невротиков в соответствии с теоретическими предположениями Г. Айзенка. Больные истерией по шкале ратимии получали большее количество баллов, нежели лица, страдающие реактивной депрессией и навязчивыми состояниями. В изученных клинических группах количество баллов по шкале циклоидной эмоциональности также было больше, чем у здоровых. На этой основе Г. Айзенк приступил к созданию MPI.
Предварительные исследования были проведены с использованием перечня из 261 вопроса, заимствованного из разных опросников. По результатам, полученным по шкале ратимии и циклоидной эмоциональности, были выделены (отдельно среди мужчин и женщин) две группы. Затем провели разделение на группы с высокими и низкими показателями. Используя критерий X2, осуществили анализ ответов на каждый вопрос. В итоге получили две группы вопросов, ответы на которые наиболее различались. На их основе построили две шкалы – экстра-, интроверсии и нейротизма – по 24 вопроса в каждой. С помощью установленных ранее ключей сравнили результаты исходных групп. Для отдельных вопросов были рассчитаны коэффициенты интеркорреляции, подвергнутые затем факторному анализу. Два выделенных фактора соответствовали первоначально предположенным – экстра-, интроверсии и нейротизму.
Коэффициент надежности MPI, определенный путем расщепления, для шкалы нейротизма составлял 0,85-0,90, для шкалы экстра-, интроверсии – 0,75-0,85, коэффициенты ретестовой надежности – 0,83 и 0,81 соответственно. Валидностъ обеих шкал MPI устанавливали способами, которые признаны многими исследователями методически несостоятельными, поэтому она не доказана. Обнаружена корреляция между шкалами экстра-, интроверсии и нейротизма с коэффициентом 0,15-0,40, что противоречит исходному положению Г. Айзенка о независимости данных измерений личности. Разработан сокращенный вариант MPI из 12 вопросов. Коэффициенты корреляции с полным опросником составляют по шкале нейротизма 0,86, по шкале экстра-интроверсии – 0,87.
Практическое использование MPI показало значительные расхождения между получаемыми данными и теоретическими предсказаниями автора (особенно в клинических группах). Г. Айзенк не смог убедительно опровергнуть высказанные во многих зарубежных работах замечания, однако, несмотря на критику, MPI долгое время применяли в зарубежных психодиагностических исследованиях.
На основе дальнейших исследований Г. Айзенка и сотрудников, направленных на анализ составляющих экстра-, интроверсии и нейротизма как базисных личностных измерений, был предложен новый опросник, получивший название «Личностный опросник Айзенка» (Eysenck Personality Inventory, или EPI). Опубликован в 1963 г., состоит из 48 вопросов, предназначенных для диагностики экстра-, интроверсии и нейротизма, а также 9 вопросов, составляющих шкалу лжи, по которой определяется наличие у обследуемого тенденции представить себя в лучшем свете (см. шкалы контрольные). Ответы, совпадающие с ключом, оцениваются в 1 балл (ответы только «Да» или «Нет»). Разработаны две эквивалентные формы опросника – А и В.
Число обследованных в ходе разработки ЕРI превышает 30 000 человек. Испытуемые были разделены на группы в зависимости от проявлений диагностируемых характеристик. Изучались ответы лиц, отнесенных компетентными экспертами в группы экстравертов или интровертов, невротиков или эмоционально уравновешенных. На основе полученных данных определялась дискриминативная возможность каждого вопроса. В ходе разработки ЕРI было установлено, что экстраверсия является фактором высшего порядка и, следовательно, в вопросах должны быть в более или менее равной доле представлены факторы низшего порядка. Прежде всего речь идет о таких выделенных Г. Айзенком компонентах экстраверсии, как импульсивность и общительность.
Коэффициенты ретестовой надежности EPI для фактора экстра-интроверсии составляют 0,82-0,85, для фактора нейротизма – 0,81-0,84, коэффициент надежности методом расщепления – 0,74-0,91. В зарубежных исследованиях сообщается о достаточной валидности EPI, иногда эти данные оспариваются. В данном опроснике существенно изменилось значение коэффициента интеркорреляции между шкалами (от +0,12 до -0,16), что соответствовало теоретическим предположениям Г. Айзенка. Предложен сокращенный вариант EPI, состоящий из 12 вопросов. Показатели корреляции с полным вариантом по шкале экстра-, интроверсии – 0,81, нейротизма – 0,79. Созданы варианты EРI для обследования детей и подростков. EPI широко используется в отечественных исследованиях, однако его адаптация полностью не завершена.
В 1969 г. Г. Айзенк и С. Айзенк публикуют новый опросник под названием «Айзенка личностный опросник» (Eysenck Personality Questionnaire, или EPQ), который предназначен для диагностики нейротизма, экстра-, интроверсии и психотизма. Так же, как и в EPI, в него включена шкала лжи. Опросник состоит из 90 вопросов (по шкале нейротизма – 23, по шкале экстра-, интроверсии – 21, по шкале психотизма – 25, по шкале лжи – 21). Однако обычно используют вариант, состоящий из 101 вопроса (из них 11 вопросов – буферные, ответы на которые не учитываются).
Примеры вопросов по шкале психотизма.
1. Будете ли вы употреблять наркотические препараты, способные оказать непредвиденное или опасное воздействие?
2. Испытываете ли вы чувство жалости, сострадания к животному, попавшему в ловушку?
Изучение валидности личностного измерения «психотизм» осуществлялось обычным для исследований Г. Айзенка путем поиска экспериментальных коррелятов психотизма, сравнением результатов, полученных в группах здоровых и больных. Полученные данные спорны. Коэффициенты ретестовой надежности (месячный интервал) опросника в различных группах по шкале психотизма составляют 0,51-0,86, по шкале экстра-, интроверсии 0,80-0,92, по шкале нейротизма – 0,74-0,92, по шкале лжи 0,61-0,90. Разработан вариант опросника для обследования детей и подростков (от 7 до 15 лет).
Во многих зарубежных исследованиях аргументировано доказывается, что введение такого личностного измерения, как психотизм, не имеет научного обоснования, экспериментальные данные противоречивы, а использование шкалы психотизма на практике может способствовать появлению ложных диагностических ориентиров.
7. Опросник самоотношения
Личностный опросник, направленный на исследование комплекса факторов отношения к себе. Предложен В. В. Сталиным
в 1985 г.
Методика содержит 62 пункта, сформулированных в виде утверждений.
Примеры утверждений.
1. Иногда я сам себя плохо понимаю.
2. Случайному знакомому я, скорее, покажусь человеком приятным.
Используются два варианта ответов: «Согласен» и «Не согласен». На этапе разработки результаты опросника были подвергнуты факторному анализу. В результате были отобраны и интерпретированы семь факторов, которые легли в основу четырех шкал опросника.
1. Самоуважение
(14 пунктов) – шкала направлена на отражение аспектов самоотношения к своим способностям, энергии, самостоятельности, оценки возможностей контролировать свою жизнь, степени веры в свои силы.
2. Аутосимпатия
(16 пунктов) – шкала на позитивном полюсе объединяет доверие к себе и положительную самооценку. На негативном полюсе – видение в себе преимущественно недостатков, низкую самооценку, склонность к самообвинению.
3. Самоинтерес
(8 пунктов) – отражение меры близости к себе, интерес к собственным мыслям и чувствам, уверенность в собственном интересе для других.
4. Ожидаемое отношение от окружающих
(13 пунктов).
Наряду с приведенными факторами – шкалами в опроснике предусмотрена возможность оценивания по обобщенному фактору глобального самоотношения (чувства за или против себя). Балл по глобальному самоотношению подсчитывается на основании учета ответов на 30 пунктов опросника.
Опросник стандартизирован на выборке из 260 испытуемых. Имеются данные об удовлетворительной ретестовой надежности (коэффициенты от 0,57 до 0,90 по отдельным шкалам, интервал ретеста – 7-10 дней). Проводятся исследования конструктной валидности.
Рекомендуется для применения в консультативных целях и в научных исследованиях. Прямая форма большинства вопросов и отсутствие контрольных шкал ограничивают применение опросника самоотношения в экспертных ситуациях.
8. Опросник уровня субъективного контроля
Опросник уровня субъективного контроля (УСК)
– личностный опросник. Предназначен для диагностики интернальности / экстернальности. Разработан на основе шкалы локуса контроля Дж . Роттера
(Locus of control scale) и опубликован Е. Ф. Бажиным
с соавторами в 1984 г.
УСК состоит из 44 утверждений, с которыми обследуемый может согласиться (+) или не согласиться (-). Для исследовательских целей предусмотрен ответ по шестибалльной шкале -3, -2, -1, +1, +2, +3, в которой +3 означает «Полностью согласен», а -3 – «Совершенно не согласен. С помощью УСК осуществляется измерение интернальности / экстернальности по следующим шкалам.
1. Шкала общей интернальности (И0).
2. Шкала интернальности в области достижений (Ид).
3. Шкала интернальности в области неудач (Ин).
4. Шкала интернальности в семейных отношениях (Ис).
5. Шкала интернальности в области производственных отношений (Ип).
6. Шкала интернальности в области межличностных отношений (Им).
7. Шкала интернальности в отношении здоровья и болезни (И3).
Примеры утверждений УСК (рядом – ключевой ответ по соответствующей шкале).
1. Продвижение по службе больше зависит от удачного стечения обстоятельств, чем от способностей и усилий человека (И0-, Ид-, Ин-).
2. Думаю, что случай или судьба не играют важной роли в моей жизни (И0).
3. Многие мои успехи были возможны только благодаря помощи других людей (И0-, Ид-).
Полученные результаты выражаются в стэнах (см. оценки шкальные) и могут быть представлены в виде профиля субъективного контроля.
Уровень субъективного контроля – обобщенная характеристика личности, оказывающая регулирующее воздействие на формирование межличностных отношений, способы разрешения кризисных семейных и производственных ситуаций и т. д. В соответствии с концепцией локуса контроля (от лат. locus – «место, месторасположение») те лица, которые принимают ответственность за события своей жизни на себя, объясняя их своим поведением, способностями, чертами личности, обладают внутренним (интервальным) контролем. И напротив, людям, которые склонны приписывать ответственность за все события внешним факторам (другим людям, случаю, судьбе и т. п.), присущ внешний (экстернальный) контроль. Любой человек по локусу контроля занимает определенное место на континууме интернальность / экстернальность.
В многочисленных экспериментальных исследованиях установлена связь между различными формами поведения, особенностями личности и уровнем интернальности / экстернальности. Так, интерналы в отличие от экстерналов менее склонны подчиняться давлению других людей, сильнее реагируют на утрату личной свободы, активнее ищут информацию, более уверены в себе и т. д.
Стандартизация опросника проводилась на выборке из 84 обследуемых – студентах вуза, средний возраст которых составлял 20,4 года. Авторы УСК сообщают о весьма высоких показателях его надежности. Валидность демонстрируется связями шкал опросника с другими особенностями личности, измеренными, в частности, с помощью опросника «Шестнадцать личностных факторов». Рекомендуется использование УСК в клинической психодиагностике, семейных консультациях, для изучения эффективности социально-психологического тренинга и групповой психотерапии.
9. «Несуществующее животное»
«Несуществующее животное»
– проективная методика исследования личности, и предложена М. З. Друкаревич
.
Испытуемому предлагают придумать и нарисовать несуществующее животное, а также дать ему ранее не существовавшее имя. Из имеющейся литературы видно, что процедура обследования не стандартизована (используются разных размеров листы бумаги для рисования, в одних случаях рисунок выполняется цветными карандашами, в других – одним цветом и т. д.). Общепринятой системы оценки рисунка не существует. Теоретические посылки, положенные в основу создания методики, совпадают с таковыми у прочих проективных методик. Как и многие другие рисуночные тесты, тест «Несуществующее животное» направлен на диагностику личностных особенностей, иногда ее творческих потенций.
Показана удовлетворительная конвергентная валидность методики путем установления связи между результатами, полученными с ее помощью, и данными других личностных методик на материале обследования пациентов психиатрической клиники и лиц, проходящих профотбор в штат МВД (П. В. Яньшин
, 1988, 1990). Валидность также подтверждена при дифференциации больных неврозами и здоровых (Т. И. Краско
, 1995). «Несуществующее животное» – одна из наиболее популярных рисуночных методик и широко используется психологами СНГ при обследовании детей и взрослых, больных и здоровых чаще всего в качестве ориентирующей методики, т. е. такой, данные которой позволяют выдвинуть некоторые гипотезы об особенностях личности.
10. «Нарисуй человека»
«Нарисуй человека» (НЧ) (DrawA
-PersonTest
, DAP)
– проективная методика исследования личности. Разработана К. Маховер
в 1948 г. на основе теста Ф. Гудинаф
, предназначенного для определения уровня интеллектуального развития детей и подростков с помощью выполненного ими рисунка мужчины.
Тест «Нарисуй человека» можно использовать для обследования как взрослых, так и детей, допускается групповое обследование.
Обследуемому предлагают карандашом на чистом листе бумаги нарисовать человека. После выполнения рисунка ему дают задание нарисовать человека противоположного пола. Заключительный этап обследования – опрос. К. Маховер составлены специальные перечни вопросов о нарисованных фигурах. Эти вопросы касаются возраста, образования, семейного положения, привычек и т. д.
При интерпретации полученных данных автор исходит из идеи о том, что рисунок является выражением «я» обследуемого. Значительное внимание уделяется анализу разнообразных деталей рисунка, прежде всего особенностям изображения основных частей тела, которые зачастую оценивают в соответствии с психоаналитической символикой. Изучение валидности теста «Нарисуй человека» западными психологами привело к противоречивым результатам в силу умозрительности предлагаемых автором интерпретаций. Имеются данные о том, что общие субъективные оценки более валидны и надежны, нежели оценки по отдельным деталям рисунка.
В нашей стране тест «Нарисуй человека» первоначально применялся в клинико-психологических исследованиях. Анализировались преимущественно формальные аспекты рисунков, например размер фигуры, ее расположение на листе бумаги, степень законченности рисунка и тому подобное (Ю. С. Савенко
, 1970). Полученные при обследовании пациента результаты соотносились с клинической картиной заболевания, обогащая и уточняя представление о больном. Начиная с 1990-х гг. сфера использования теста существенно расширяется, выполнено немало исследований в возрастной и педагогической психологии.
11. Тест тематической апперцепции
Тест тематической апперцепции (ТАТ) (ThematicApperceptionTest, ТАТ)
– проективная методика исследования личности. Наряду с тестом Роршаха одна из старейших и наиболее распространенных в мире. Создана X. Морган
и Г. Мюрреем
в 1935 г. Впоследствии методика становится более известной по имени Г. Мюррея, который внес весомый вклад в ее разработку. Стимульный материал теста тематической апперцепции – стандартный набор из 31 таблицы: 30 черно-белых картин и одна пустая таблица, на которой обследуемый может вообразить любую картину. Таблицы, применяемые в настоящее время, – это третья редакция теста тематической апперцепции (1943). В используемых изображениях представлены относительно неопределенные ситуации, допускающие их неоднозначную интерпретацию. В то же время каждый из рисунков обладает особой стимулирующей силой, провоцируя, например, агрессивные реакции или способствуя проявлению установок обследуемого в сфере семейных отношений. В ходе эксперимента предъявляются в определенной последовательности 20 картин, отбираемых из стандартного набора в зависимости от пола и возраста (есть картины для всех: для женщин, мужчин, мальчиков и девочек до 14 лет). Возможно использование сокращенных наборов специально подобранных картин. Обычно обследование проводится в два этапа – по 10 картин за один сеанс с интервалом между сеансами не более чем 1 день. Испытуемому предлагают придумать небольшую историю о том, что привело к ситуации, изображенной на картине, что происходит в настоящее время, о чем думают, что чувствуют действующие лица, чем эта ситуация закончится. Рассказы обследуемого записываются дословно, с фиксацией пауз, интонации, выразительных движений, других особенностей. Обычно прибегают к стенограмме или записи на скрытый магнитофон. При групповом обследовании допускается самостоятельная запись рассказа или выбор одного из множества предлагаемых вариантов. Отмечается время с момента предъявления картины до начала рассказа и общее время, затраченное на рассказ по каждой картине.
Завершает обследование опрос, основная задача которого – получение дополнительных данных об обследуемом, а также уточнение источников тех или иных сюжетов, разбор всех обнаруженных в рассказах логических неувязок, оговорок, ошибок восприятия и т. д. Анализ рассказов, записанных при использовании теста тематической апперцепции, строится следующим образом:
1) нахождение героя, с которым обследуемый идентифицирует себя. Разработан ряд критериев, облегчающих поиск, героя (например, подробное описание мыслей и чувств какого-либо из персонажей; совпадение с ним по полу и возрасту, социальному статусу; употребление прямой речи и др.);
2) определение важнейших характеристик героя – его чувств, желаний, стремлений, или, по терминологии Г. Мюррея, «потребностей» (табл. 7).
Таблица 7
Перечень потребностей (needs; n) по Г. Мюррею (в порядке латинского алфавита)
Следующие потребности были постулированы, но систематически не исследовались.
Также выявляется давление среды, т. е. силы, воздействующие на героя извне. Как потребности, так и давление среды оцениваются по пятибалльной шкале в зависимости от интенсивности, длительности, частоты и значения их в сюжете рассказа. Сумма оценок по каждой переменной сравнивается со стандартной для определенной группы обследуемых;
3) сравнительная оценка сил, исходящих от героя, и сил, исходящих из среды. Сочетание этих переменных образует тему (отсюда – тест тематической апперцепции), или динамическую структуру взаимодействия личности и среды. По Г. Мюррею, содержание тем составляет:
а) то, что обследуемый реально совершает;
б) то, к чему он стремится;
в) то, что им не осознается, проявляясь в фантазиях;
г) то, что он испытывает в настоящий момент;
д) то, каким ему представляется будущее.
В итоге исследователь получает сведения об основных стремлениях, потребностях обследуемого, воздействиях, оказываемых на него, конфликтах, возникающих во взаимодействии с другими людьми, и способах их разрешения, другую информацию.
Осуществляется также формальный анализ рассказов, включающий в себя расчет длительности рассказов, их стилевых особенностей и др. Этот аспект анализа может быть полезен для обнаружения патологических тенденций. Диагностическая ценность ТАТ основывается на признании существования в человеческой психике двух ярко проявляющихся тенденций. Первая из них выражается в стремлении истолковывать каждую многозначную ситуацию, с которой сталкивается индивидуум, в соответствии со своим прошлым опытом. Вторая тенденция состоит в том, что во всяком литературном творчестве автор опирается прежде всего на собственные переживания и сознательно или неосознанно наделяет ими выдуманных персонажей. В завершенном виде теория личности, разработанная Г. Мюрреем, названная им персонологией и сформировавшаяся под сильным воздействием психоанализа, носит достаточно эклектический характер. Она была критически рассмотрена в работах отечественных психологов (Л. Ф. Бурлачук
и В. М. Блейхер
, 1978; Е. Т. Соколова
, 1980 и др.).
Надежность теста тематической апперцепции неоднократно изучалась различными исследователями. В большинстве работ обсуждается проблема повторяемости тем рассказов по истечении определенного периода времени. Согласно С. Томкинсу
корреляция при повторе теста через 2 месяца была равна 0,80, через 6 месяцев – 0,60, а через 10 месяцев составила 0,50. Валидность теста тематической апперцепции, несмотря на то что в случае проективных методик этот вопрос не может быть решен традиционно психометрически, подтверждается многочисленными исследованиями.
Известны различные подходы к анализу и интерпретации данных (подробнее см. Л. Ф. Бурлачук и В. М. Блейхер, 1978; Е. Т. Соколова, 1980). Существует множество модификаций теста тематической апперцепции (для обследования лиц разного культурного уровня, подростков-правонарушителей, людей пожилого и старческого возрастов и др.). В отечественных исследованиях ТАТ впервые был использован в начале 1960-х гг. в Ленинградском научно-исследовательском психоневрологическом институте им. В. М. Бехтерева для выявления значимых, прежде всего патогенных отношений личности, дифференциальной диагностики неврозов, психозов и пограничных состояний (И. Н. Гильяшева
, 1983). Позднее ТАТ начинают применять в общепсихологических исследованиях (В. Г. Норакидзе
, 1975 и др.).
12. Тест Роршаха
Тест Роршаха (РТ) (RorschachTest)
– проективная методика исследования личности. Создана Г. Роршахом
в 1921 г. Тест Роршаха по своей популярности в психодиагностических исследованиях личности занимает ведущее место среди других проективных методик.
Стимульный материал теста Роршаха состоит из 10 стандартных таблиц с черно-белыми и цветными симметричными аморфными (слабоструктурированными) изображениями (так называемые пятна Роршаха).
Обследуемому предлагают ответить на вопрос о том, на что, по его мнению, похоже каждое изображение. Ведется дословная запись всех высказываний обследуемого, учитываются время с момента предъявления таблицы до начала ответа, положение, в котором рассматривается изображение, а также любые особенности поведения. Завершается обследование опросом, который осуществляется экспериментатором по определенной схеме (уточнение деталей изображения, по которым возникли ассоциации и т. д.). Иногда дополнительно применяется процедура определения пределов, сущность которой состоит в прямом призыве обследуемого к определенным реакциям-ответам.
Каждый ответ формализуется с помощью специально разработанной системы символов по следующим пяти счетным категориям.
1. Локализация (выбор для ответа всего изображения или его отдельных деталей).
2. Детерминанты (для формирования ответа могут быть использованы форма изображения, цвет, форма совместно с цветом и т. д…
3. Уровень формы (оценка того, насколько адекватно форма изображения отражена в ответе, при этом в качестве критерия используются интерпретации, получаемые наиболее часто).
4. Содержание (ответ может касаться людей, животных, неодушевленных предметов и т. д.).
5. Оригинальность – популярность (оригинальными считаются очень редкие ответы, а популярными те, которые встречаются не менее чем у 30 % обследуемых).
Эти счетные категории имеют детально разработанные классификации и интерпретативные характеристики. Обычно изучаются суммарные оценки, т. е. суммы однотипных оценок, отношения между ними. Совокупность всех полученных отношений позволяет создать единую и уникальную структуру взаимосвязанных особенностей личности.
Основным теоретическим предположением Г. Роршаха является то, что активность индивидуума определяется как внутренними, так и внешними побуждениями. Сообразно такому пониманию причин активности (в которой личность выражается тем отчетливее, чем менее стереотипны вызывающие ее стимулы) автор теста Роршаха вводит понятия интроверсии
и экстратенсии
, соответствующие совокупности определенных черт, связанных с преобладающим видом активности. Экстратенсивный тип – это такой тип личности, который преимущественно обусловливает свое поведение причинами, лежащими вне его «я», а интровертированный строит свою деятельность исходя из внутренних, присущих его «я» интенций. Здесь следует заметить, что содержание роршаховских понятий экстратенсии и интроверсии не полностью совпадает с таковым у других психологов, использовавших их в своих работах (например, К. Юнг
, Г. Айзенк
и др.). Соотношением между параметрами интроверсии и экстратенсии определяется тип переживания – важнейший показатель теста Роршаха. Тип переживания указывает на то, как, а не что переживает индивидуум, как он взаимодействует с окружением.
Помимо установления общей направленности личности (типа переживания), тест Роршаха позволяет получить диагностические данные о степени реалистичности восприятия действительности, эмоциональном отношении к окружающему миру, тенденции к беспокойству, тревожности, тормозящей или стимулирующей активность индивидуума (Л. Ф. Бурлачук
, 1979). Диaгностические показатели теста Роршаха не имеют строго однозначного психологического значения. Однозначность достигается непосредственным контактом с обследуемым, его углубленным изучением. Дифференциально-диагностическое значение данных, получаемых при использовании теста Роршаха, тем определеннее, чем большая совокупность показателей, относящихся к конкретной задаче, изучается.
Несмотря на то что и по настоящее время нет завершенной теории, связывающей особенности интерпретации стимулов с личностными характеристиками, валидность теста Роршаха доказана многочисленными исследованиями. Специальными исследованиями 1980–1990 гг. подтверждена и высокая ретестовая надежность как отдельных групп показателей теста, так и методики в целом (Дж. Экснер
, 1980, 1986 и др.). Развитие теста Роршаха привело к появлению шести наиболее известных в мировой психодиагностической практике схем анализа полученных результатов, которые имеют как формальные, так и интерпретативные различия. Известны тесты чернильных пятен, разработанные по образцу теста Роршаха, его модификации для проведения группового обследования.
В советской психологии тест Роршаха использовался преимущественно в клинико-психологических исследованиях личности (Л. Ф. Бурлачук
, 1979; И. Г. Беспалько
, 1983 и др.). Велась значительная работа по стандартизации теста (Б. И. Белый
, 1982; И. Г. Беспалько
, 1983), которая позднее не получила дальнейшего развития. В работах советских психологов результаты, получаемые с помощью теста Роршаха, анализировались не только на личностном уровне, но и на уровне более элементарном – перцептивном. По настоящее время сфера использования теста в СНГ весьма узка, профессиональная работа с тестом Роршаха все еще остается уделом незначительного числа специалистов-психологов.
13. Шкалы измерения интеллекта Векслера
Шкалы измерения интеллекта Векслера (ШИИВ)
– группа наиболее известных и широко используемых тестов интеллекта, предназначенных для измерения уровня интеллектуального развития. Разработаны Д. Векслером
. Первой была предложена в 1939 г. Векслер – Белльвью шкала (Wechsler Bellevue Scale – от названия клиники, в которой она была разработана). Шкала стандартизирована на выборке испытуемых в возрасте от 7 до 69 лет.
Наибольшую известность получил модифицированный вариант этой шкалы, опубликованный в 1955 г. под названием «Векслера интеллекта взрослых шкала» (Wechsler Adult Intelligence Scale, WAIS), последняя редакция, WAIS-R, опубликована в 1981 г. WAIS предназначена для обследования лиц в возрасте от 16 до 64 лет. Включает 11 субтестов, составляющих вербальную и невербальную (действия) шкалы.
Шкала вербальная.
1. Субтест общей осведомленности. Исследует запас относительно простых сведений и знаний. Предлагается 29 вопросов, оценка – 1 балл за правильное решение каждого вопроса.
Примеры:
1) из чего делают резину?
2) почему на солнце в темной одежде теплее, чем в светлой?
3) что такое гносеология?
2. Субтест общей понятливости. Оценивает полноту понимания смысла выражений, способность к суждению, понимание общественных норм. Испытуемый должен дать ответ о своих предполагаемых действиях в описанной ситуации. Предлагаются 14 вопросов, оценка в зависимости от точности ответа: 0, 1, 2 балла.
Примеры:
1) что нужно сделать, если вы нашли на улице запечатанный конверт с написанным на нем адресом и непогашенной маркой?
2) что означает выражение «Куй железо, пока горячо»?
3) почему человек, родившийся глухим, не может говорить?
3. Арифметический субтест. Оценивает концентрацию внимания, легкость оперирования числовым материалом.
Испытуемый должен устно решить серию арифметических задач. Дается оценка не только точности ответа, но и затраченного на решение времени.
Примеры:
1) если человек купил 7 марок по 2 копейки каждая и дал полтинник, сколько он должен получить сдачи?
2) цена двух банок с консервированными яблоками – 31 копейка. Сколько стоят 12 банок?
3) восемь человек могут закончить работу за 6 дней.
Сколько человек потребуется, чтобы закончить работу за полдня?
4. Субтест установления сходства. Оценивает способность к формированию понятий, классификации, упорядочиванию, абстрагированию, сравнению. Испытуемый должен установить и охарактеризовать общность между парой понятий. Оценка варьируется от 0 до 2 баллов в зависимости от достигнутого уровня обобщения: конкретного, функционального, концептуального. Например, при установлении общего в паре понятий «платье – пальто» могут быть даны ответы:
1) сделаны из одинакового материала, имеют пуговицы (0 баллов);
2) их носят, они дают тепло (1 балл);
3) верхняя одежда (2 балла).
В субтесте предлагаются 13 пар понятий.
5. Субтест повторения цифровых рядов. Направлен на исследование оперативной памяти и внимания, состоит из двух частей: запоминания и повторения чисел в прямом и обратном порядке. Задания аналогичны соответствующему субтесту шкалы памяти (см. шкала памяти Векслера).
6. Словарный субтест. Направлен на изучение вербального опыта (понимания и умения определить содержание слов). Предлагается объяснить значение ряда слов. Всего в задании 42 слова: первые 10 – весьма распространенные, повседневного употребления; следующие 20 – средней сложности; третью группу составляют 12 слов высокой степени сложности. Оценка – от 0 до 2 баллов.
Примеры.
Шкала невербальная.
1. Субтест шифровки цифр. Изучает степень усвоения зрительно-двигательных навыков. Задача состоит в том, чтобы написать под каждой цифрой в клеточке соответствующий ей символ. Время выполнения лимитировано.
2. Субтест нахождения недостающих деталей. Изучает особенности зрительного восприятия, наблюдательность, способность отличить существенные детали.
Испытуемому предъявляют 21 изображение, в каждом из которых необходимо отыскать какую-либо недостающую деталь или какое-то несоответствие. Правильный ответ оценивается 1 баллом (лимит времени – 20 с).
3. Субтест кубиков Коса. Направлен на изучение сенсомоторной координации, способности синтеза целого из частей. Испытуемому предлагают последовательно воспроизвести десять образцов рисунков из разноцветных деревянных кубиков. Время ограничивается по каждому заданию. Оценка зависит как от точности, так и от времени исполнения (см. также Кубики Коса).
4. Субтест последовательности картинок. Исследует способность к организации фрагментов в логическое целое, к пониманию ситуации и предвосхищению событий. В задании предлагается восемь серий картинок. В каждой серии картинки объединены сюжетом, в соответствии с которым испытуемый должен расположить их в определенной последовательности. Оценка зависит от правильности и времени решения.
5. Субтест составления фигур. Направленность субтеста аналогична субтесту 4. Испытуемому предлагают в определенной последовательности детали четырех фигур («человек», «профиль», «рука», «слон») без указания на то, что из этих деталей должно быть составлено. В оценке учитывается время и правильность решения.
В 1949 г. была предложена «Векслера интеллекта шкала для детей» (Wechsler Intelligence Scale for Children, WISC; последняя редакция, WISC-R, опубликована в 1974 г.), предназначенная для обследования детей в возрасте от 5 лет до 15 лет 11 мес. (для WISC-R стандартизация осуществлялась в возрастном диапазоне от 6,5 до 16,5 года).
В отличие от шкалы WAIS в тесте WISC-R имеется 12-й субтест, альтернативный субтесту шифровки цифр. Этот субтест включает девять лабиринтов, время выхода из которых лимитировано. Задания вербальных и практических субтестов предъявляются в детском варианте шкалы в чередующемся порядке. Субтест «Лабиринты», проведение которого требует больше времени, по усмотрению экспериментатора может быть заменен на «Шифровку». Любая другая замена, в том числе замена лабиринтов на какой-либо другой субтест, так же, как и замена запоминанием цифр (второй альтернативный субтест, используемый только в WISC-R) любого из вербальных субтестов, производится только в случае, если один из основных субтестов приходится пропускать из-за непредвиденных препятствий. Дополнительные субтесты батареи WISC-R («Запоминание цифр» и «Лабиринты») могут быть проведены вместе с основной группой заданий, но в этих случаях их показатели не учитываются при определении значений IQ.
В 1963 г. была опубликована «Векслера интеллекта шкала для дошкольников и младших школьников» (Wechsler Preschool and Primary Scale of Intelligence, WPPSI), предназначенная для детей в возрасте от 4 до 6,5 лет.
Она включает 11 субтестов, из которых 10 засчитываются при определении IQ, 8 субтестов представляют собой облегченные и адаптированные варианты заданий WISC, остальные 3 разработаны специально для данной шкалы. Субтесты также сгруппированы в вербальную шкалу и шкалу действия; предъявление субтестов той и другой группы чередуется (табл. 8).
Таблица 8
Состав субтестов шкалы WPPSI
Окончание таблицы 8
Состав субтестов шкалы WPPSI
«Предложения» – тест на запоминание, заменивший субтест повторения цифровых рядов из WISC. От ребенка требуется вслед за экспериментатором повторять произносимое предложение. Этот субтест можно использовать вместо любого субтеста из вербальной шкалы или предъявить как дополнительный для получения более точной диагностической информации. Субтест «Дом животного» сходен с субтестами шифровки цифр. В этой группе заданий ребенку предъявляется карта с изображением собаки, цыпленка, рыбы и кошки. В верхней части карты размещаются картинки-ключи со вставленными в них различного цвета цилиндриками (дом животного). От ребенка требуется расставить домики по соответствующим изображениям животных. Оценка зависит от времени выполнения и количества ошибок. В тесте «Геометрические схемы» требуется с помощью цветного карандаша скопировать 10 простых чертежей.
Для рассмотренных трех вариантов шкал измерения интеллекта Векслера существуют сокращенные формы, включающие 4–6 субтестов, коэффициенты корреляции которых с основными вариантами составляют 0,8–0,9. Среди них можно указать на «Краткий Векслера интеллекта тест» (Reduzierter Wechsler Intelligenztest, WIP) – сокращенный вариант гамбургской редакции основного теста (НА WIK), состоит из четырех субтестов. Разработаны нормы для пациентов психиатрических клиник (в возрасте от 15 до 60 лет) и здоровых лиц (от 10 до 79 лет). Тест стандартизирован на материале обследования 947 больных и 124 здоровых испытуемых. Показатели корреляции с основной формой теста (HAWIK) составляют по отдельным субтестам от 0,89 до 0,97. Коэффициенты надежности (по методу Кьюдера – Ричардсона), определенные на основании данных обследования 305 больных и 197 здоровых лиц, варьируются от 0,53 до 0,89. Показатели внутренней согласованности заданий теста для психиатрических пациентов оказываются существенно выше, чем для здоровых. Имеются сведения о конвергентной и дискриминантной валидности (см. валидность конструктная).
Одним из важных достоинств шкал измерения интеллекта Векслера является возможность качественного анализа и интерпретации характера выполнения испытуемым заданий субтестов. При использовании сокращенной программы обследования качественные наблюдения невозможны.
Традиционно психометрическая часть обработки результатов обследования с помощью рассматриваемых шкал предусматривает подсчет первичных оценок по каждому из применявшихся вербальных и практических субтестов. Согласно таблицам переходов «сырых» показателей в оценки шкальные могут быть получены стандартные оценки результатов выполнения каждого отдельного субтеста. Эти данные могут быть представлены в виде профиля. Оценки отдельных субтестов рассчитаны по шкале с характеристиками: М = 10, s = 3. По суммам «сырых» оценок (отдельно вербальной и невербальной частей теста) с помощью специальных таблиц определяются шкальные оценки IQ-вербального, IQ-невербального и общего IQ-показателя. Оценки по этим трем показателям выражены в единицах IQ-показателя стандартного (М = 100, s = 15). Интерпретация IQ-показателей по Векслеру проводится в соответствии со схемой, приведенной в таблице 9.
Таблица 9
Классификация IQ-показателей по Векслеру
Количественная интерпретация результатов исследований с помощью шкал измерения интеллекта Векслера включает некоторые специальные приемы. Так, при анализе показателей WAIS может быть определен индекс возрастного снижения некоторых интеллектуальных функций. Опираясь на экспериментальные данные, Д. Векслер разделяет субтесты на основные, результаты которых мало изменяются с возрастом испытуемых (словарный, осведомленность, составление фигур, обнаружение недостающих деталей), и те, которые чаще обнаруживают с возрастом ухудшение результатов относительно стандартов (воспроизведение цифр, обнаружение сходства, шифровка, кубики Коса). Сравнением показателей в этих условно выделяемых группах субтестов определяется коэффициент детериорации, или ущерба (DQ):
где ТНР
– шкальные показатели по субтестам с практически неизменными результатами;
ТПР
– показатели результатов с переменными результатами.
Наибольший интерес представляют качественная интерпретация структуры уровня развития определенных функций интеллекта, а также оценка комплексных интеллектуально-личностных особенностей испытуемого.
При конструировании шкал Д. Векслер исходил из стремления отразить в заданиях теста не только интеллектуальные, но и прочие факторы, от которых зависит эффективность проявления интеллекта. Характеристика функциональной направленности отдельных групп заданий шкал измерения интеллекта Векслера и факторов, влияющих на результаты отдельных субтестов, приведены в таблице 10.
Таблица 10
Функции интеллекта, определяемые субтестами шкал Векслера
Окончание таблицы 10
Функции интеллекта, определяемые субтестами шкал Векслера
Окончание таблицы 10
Функции интеллекта, определяемые субтестами шкал Векслера
Разработка шкал измерения интеллекта Векслера опиралась на тщательную стандартизацию. Нормативная выборка для WAIS состояла из 1700 испытуемых с равным количеством мужчин и женщин. Испытуемые в возрасте 16–64 лет были распределены по семи возрастным уровням. Предпринимались разные меры по обеспечению репрезентативности выборки. Для пожилых людей были установлены дополнительные нормы путем тестирования выборки лиц пожилого возраста из 470 человек. Стандартизация шкальных показателей отдельных субтестов осуществлялась на группе из 500 испытуемых (возраст от 20 до 34 лет), входивших в выборку стандартизации. Выборка стандартизации WISC-R состояла из 100 мальчиков и 100 девочек в каждом возрастном годовом интервале от 6,5 до 16,5 лет (общее количество испытуемых – 2200). Аналогично процедуре стандартизации WAIS для обеспечения максимальной репрезентативности выборка была стратифицирована на основе данных переписи населения. Шкала WPPSI была стандартизирована на аналогичной выборке из 1200 детей (по 100 мальчиков и 100 девочек в каждой полугодовой возрастной группе в диапазоне от 4 до 6,5 лет).
В ходе широкого и длительного применения шкал измерения интеллекта Векслера в психодиагностике накоплено немало сведений о надежности и валидности этих методик. Показатели надежности вербальных и практических шкал, а также теста в целом приведены в таблице 11.
Таблица 11
Коэффициенты надежности показателей IQ в шкалах Векслера
Коэффициенты валидности текущей WAIS (по связи с критериями академической успеваемости и оценками профессиональной деятельности) составили 0,3 для невербальных субтестов и 0,4–0,5 для вербальных. Для WISC показатели валидности критериальной по связи с результатами тестов достижений и учебными критериями интеллекта находятся в пределах 0,5–0,6. При этом показатели вербальной шкалы более тесно коррелируют с критерием, чем показатели невербальной шкалы.
Шкалы измерения интеллекта Векслера отличаются высокой корреляцией с результатами других достаточно известных тестов интеллекта. Коэффициент корреляции с показателями шкалы умственного развития Стэнфорд – Бине для WAIS составляет около 0,8. Характерна более тесная связь с результатами вербальной шкалы, чем с невербальным IQ-показателем. Так, для шкалы WISC коэффициенты корреляции с данными теста Стэнфорд – Бине составляют 0,76 по вербальной шкале и 0,56 – по невербальной. Коэффициенты корреляции показателей IQ WPPSI и теста Стэнфорд – Бине равны 0,82, 0,81, и 0,67 для полной, вербальной и невербальной шкалы, соответственно.
Данные о валидности конструктной существенно дополняются факторным анализом результатов теста. Согласно его результатам шкалы измерения интеллекта Векслера насыщены фактором общего интеллекта (фактор G), определяющим около 50 % суммарной дисперсии батареи. Кроме того, выявлены три групповых фактора: фактор вербального понимания (субтесты «Словарный», «Осведомленности», «Понимание», «Нахождение сходства»); фактор перцептивной организации (субтесты «Кубики Коса», «Составление фигур»), выраженный сочетанием факторов скорости восприятия и пространственных представлений; фактор памяти («Арифметика», «повторение цифровых рядов»).
Для правильной интерпретации количественных показателей, особенно в случае сравнительных психодиагностических исследований, имеют значение сведения об ошибке измерения, отражающей точность индивидуального результата (табл. 12)
Таблица 12
Величины стандартной ошибки измерения (?m) IQ-показателей в шкале Векслера
В отечественных исследованиях шкалы измерения интеллекта Векслера нашли достаточно широкое распространение. WAIS, впервые адаптированная в Ленинградском психоневрологическом научно-исследовательском институте им. В. М. Бехтерева, успешно использовалась в комплексном лонгитюдном изучении развития интеллекта (Б. Г. Ананьев
, 1969 и др.). Тест применялся в дифференциальной диагностике умственной отсталости и задержки психического развития детей (А. Ю. Панасюк
, 1976), а также судебно-психологической экспертизе подростков (Л. А. Калинина
, 1980). С помощью WAIS были получены данные, углубляющие представления об особенностях интеллекта при некоторых психических заболеваниях (И. Н. Гильяшева
, 1983 и др.). WISC была адаптирована и стандартизирована на отечественной выборке (А. Ю. Панасюк
, 1973).
14. Шкала памяти Векслера
Шкала памяти Векслера (WechslerMemoryScale
, WMS)
– методика психометрической оценки памяти. Тестовая батарея, включающая серии заданий для исследования отдельных мнестических функций, разработана Д. Векслером в 1946 г. Задания методики объединяются в семь субтестов.
I субтест – ориентировка и осведомленность. Выполнение заданий предусматривает ответы испытуемого на наиболее общие вопросы, касающиеся личных и общественных данных (6 вопросов, правильный ответ – 1 балл).
II субтест – ориентировка во времени и пространстве (5 вопросов, правильный ответ – 1 балл).
Первые два субтеста методики предъявляются в случае подозрения на наличие умственного недоразвития, глубоких дефектов памяти, нарушения ориентировки, а также в случае явной неудачи испытуемого при выполнении субтестов.
III субтест – психический контроль. Включает три задания: отсчитывание от 20 в обратном порядке, называние букв алфавита, отсчитывание от 1 до 40 через 3 единицы. Время выполнения лимитировано. За быстрое выполнение добавляются дополнительные баллы.
IV субтест – логическая память. Задание состоит в воспроизведении коротких рассказов, отпечатанных на карточках. Оценка выполнения производится по числу воспроизведенных смысловых единиц рассказа.
V субтест – воспроизведение рядов цифр в прямом и обратном порядке. Оценка соответствует наибольшему числу элементов цифрового ряда, воспроизведенных испытуемым в двух попытках (отдельно для воспроизведения в прямом и обратном порядке).
VI субтест – воспроизведение геометрических фигур. Испытуемому демонстрируются последовательно 4 карточки с простыми геометрическими изображениями. Экспозиция – 10 с. Оценка успешности выполнения дифференцирована в зависимости от числа воспроизведенных элементов фигур.
VII субтест – воспроизведение парных ассоциаций. Обследуемому зачитывают 10 пар слов, близких или отдаленных по степени ассоциативной связи. Первые 6 пар – легкие ассоциации, следующие 4 пары – трудные ассоциации. При первом прочтении они расположены вперемешку. Затем трижды, каждый раз в другом порядке, экспериментатор зачитывает первое слово каждой пары и проверяет запомнившиеся ассоциации. Пауза между сериями – 10 с. Ответ, данный в течение 5 с, засчитывается как правильный.
Результат теста получают при сложении половины суммы удавшихся легких ассоциаций с суммой трудных ассоциаций. Первичные результаты по всем субтестам суммируют и, используя специальную таблицу, к «сырым» баллам прибавляют возрастную поправку, рассчитанную для возрастных групп в диапазоне от 15 до 79 лет. Корригированный по возрасту первичный результат может быть переведен в оценки, соответствующие баллам стандартного IQ-показателя. Имеется возможность пересчета «сырых» оценок по отдельным субтестам в шкальные оценки. Таким образом, тест допускает профильную оценку данных с учетом состояния отдельных мнестических функций (Д. Векслер
, 1945).
Достоинством шкалы памяти Векслера является возможность количественного измерения кратковременной и долговременной памяти, словесно-логической, визуальной и ассоциативной репродукции. Наряду с измерением многих показателей в этой компактной и удобной для проведения методике предусмотрен охват широкого возрастного диапазона испытуемых.
В нашей стране шкала памяти Векслера получила наибольшее распространение в клинической психодиагностике.
15. Кубики Коса
Кубики Коса (КК)
– невербальный тест интеллекта. Предложен К. Косом
в 1920 г.
Испытуемому предлагают составить фигуры из цветных кубиков по рисункам-образцам. Тестовый материал состоит из шестнадцати кубиков с ребром 2,5 см, стороны которых окрашены в красный, белый, желтый и синий цвета. Оставшиеся две противоположные грани разделены по диагонали, причем одна окрашена в белый и красный цвета, а вторая – в синий и желтый (см. шкалы измерения интеллекта Векслера). В набор включены восемнадцать образцов фигур, первый из которых является тренировочным и выполняется совместно с испытуемым. Цвета рисунков-образцов соответствуют цветам кубиков, но размеры образцов вдвое меньше. Образцы размещены посередине картонной карточки, имеющей размер 10 ґ 7,5 см.
Задания следуют в порядке возрастающей трудности, что обеспечивается последовательной комбинацией следующих условий:
1. фигуру можно построить только из одноцветных сторон кубиков;
2. для построения фигуры следует использовать несколько двухцветных граней;
3. фигуру можно сложить только из двухцветных сторон или из сочетания двухцветных и одноцветных, причем на образце не обозначена граница между соседними кубиками;
4. образец повернут на 45°, т. е. стоит на ребре;
5. для составления фигур требуется использовать все большее количество кубиков;
6. образцы постепенно становятся все менее симметричными;
7. увеличивается количество цветов на образце;
8. образец не ограничивается рамкой, так что на краях сливается с фоном. Образцы-рисунки испытуемому предъявляются последовательно, тестирование прекращается после пяти последовавших друг за другом неудачных решений. Успешность оценивается с нескольких позиций. Самым важным показателем является время решения отдельных заданий. В протоколе фиксируется и количество попыток при выполнении. Первичные оценки по результатам выполнения заданий переводятся в показатель умственного возраста. В более поздних модификациях оценки переводятся в стандартные IQ-показатели. Данные дополняются качественным анализом поведения испытуемого.
КК принадлежат к часто применяемым тестам и широко используются как в оригинальной, так и в сокращенных модификациях. Ценность теста определяется особенностями деятельности испытуемого, которая моделируется его заданиями. Испытуемый начинает выполнение задания с анализа образца путем сопоставления фрагментов образца с гранями кубиков. Затем осуществляется генерализация выделяемого признака. Вслед за этим осуществляется переход к синтезу – констатация соответствия между образцом и собранной из кубиков фигурой. По мнению К. Коса, в ходе решения заданий задействуются все мыслительные процессы.
Имеются сведения о конструктной валидности
кубиков Коса. Получена значимая корреляция со шкалой умственного развития Бине – Симона (r = 0,82 – у нормальных детей и r = 0,67 – у слабоумных детей). Изучались связи показателей КК с основными тестами интеллекта, в частности шкалой умственного развития Стэнфорд – Бине (r = 0,77), прогрессивными матрицами Равена (r = 0,81). Обращается внимание на независимость друг от друга показателей КК и тестов арифметических способностей.
Наиболее широкое применение кубики Коса находят в клинической психодиагностике (В. М. Блейхер, И. В. Крук
, 1986). По данным Л. Кошча
(1976) тест весьма полезен при работе с такими разнообразными контингентами испытуемых, как творческие личности с высоким уровнем способностей и, с другой стороны, умственно отсталые лица; дети с минимальной мозговой дисфункцией, нарушением концентрации внимания, нарушением пространственной ориентировки; дети, страдающие неврозами; дети с задержкой психического развития, педагогически запущенные; больные юношеского и зрелого возраста, страдающие шизофренией. Тест может использоваться и при анализе интеллектуального потенциала здоровых лиц.
В отечественной психодиагностике кубики Коса используются чаще всего в том виде, как они представлены в соответствующем отдельно взятом субтесте шкалы измерения интеллекта Векслера.
16. Компьютерные тесты
1. Тесты, предъявление и обработка которых приспособлены к среде ЭВМ.
2. Тесты, специально разработанные для реализации условий и возможностей современной вычислительной техники.
На современном этапе развития компьютерной психодиагностики преобладающее большинство компьютерных тестов – компьютерные версии уже известных методик. Чаще всего это различные личностные опросники, реже – тесты интеллекта и др. Важнейшая проблема, возникающая в связи с появлением компьютерной формы той или иной методики, связана с доказательством ее эквивалентности основной версии теста. Сегодня многочисленными исследованиями доказано, что такие компьютерные тесты нуждаются в изучении их психометрических параметров. Применительно к характеристике компьютерных тестов введено понятие эквивалентности валидности, включающее эквивалентность психометрическую, эквивалентность, относящуюся к процессу обследования и популяционную эквивалентность. Большинство исследований за рубежом ограничивается установлением лишь психометрической эквивалентности компьютерной версии теста. Для многих компьютерных версий тестов, используемых в странах СНГ, отсутствуют данные об их валидности, надежности, величине стандартного отклонения и других психометрических показателях.
Собственно компьютерные тесты, т. е. те, которые изначально разработаны с учетом требований и возможностей современной вычислительной техники, весьма немногочисленны. Их создание осуществляется в рамках так называемого адаптивного тестирования
, важнейшей особенностью которого является управление со стороны компьютера основными этапами психодиагностического процесса. Это означает, что должен поддерживаться постоянный и адекватный режим диалога между компьютером и обследуемым. Имеются определенные достижения в адаптивном тестировании специальных способностей, а также уровня достижений. Однако диагностика личностных особенностей в адаптивном тестировании остается проблематичной. На нынешнем уровне развития адаптивное тестирование, скорее, ставит проблемы, нежели их решает.
Несмотря на достаточно широкое распространение компьютерных тестов (свыше тысячи тестов ныне используются на Западе в психологических исследованиях, образовании, промышленности и управлении), не утихают споры об их месте в решении многих психодиагностических задач. Так, оспаривается значение компьютерных тестов в индивидуальной диагностике. При этом наибольшее неприятие исследователей вызывает компьютерная интерпретация результатов тестирования. Отмечается, что простейшие, так называемые дескриптивные компьютерные интерпретации (в основном имеющие хождение в СНГ) игнорируют паттерны множественных шкал, а поэтому содержат противоречивые и взаимозаменяемые утверждения, не обладают гибкостью.
Обобщенные утверждения, выдаваемые компьютером, содержат некоторую долю истины обо всех людях, но не решают задачи их дифференциации (эффект Барнума). Компьютерные интерпретации, моделирующие диагностическую деятельность специалиста, также далеки от совершенства, и зачастую их использование может привести к ошибкам. Поэтому и сегодня многие психологи предпочитают при использовании компьютеров статистический подход, при котором получаемая информация не идет дальше обработки результатов по некоторому алгоритму, а процесс их интерпретации остается делом специалиста. Такую позицию по отношению к интерпретациям компьютера в индивидуальной диагностике следует считать наиболее обоснованной.
17. Контрольные шкалы
Контрольные шкалы
– вспомогательные диагностические средства, позволяющие оценить достоверность информации, получаемой с помощью тех или иных психодиагностических методик. Наиболее широко контрольные шкалы применяются в личностных опросниках.
Недостоверность диагностических данных, полученных в результате обследования, можно обнаружить, опираясь на анализ различного рода специальных показателей. В качестве примера можно привести комплекс контрольных шкал Миннесотского многоаспектного личностного опросника, включающий четыре специализированные шкалы.
1. Шкала «?» учитывает количество пунктов опросника, оставленных испытуемым без ответа. Превышение определенного критического числа таких незаполненных пунктов является основанием для суждения о недостаточной мотивированности испытуемого на обследование, возможном низком культурном уровне и недостаточном понимании содержания формулировок пунктов опросника. С учетом данных шкалы «?» оцениваются достоверность и диагностическая ценность результата обследования.
2. Шкала «L» – один из наиболее распространенных типов контрольных шкал. Направлена на оценку тенденции испытуемого к социально-положительным ответам. В содержание пунктов шкалы включены вопросы, предусматривающие однозначный ответ в ситуации, отражающей житейски реальное поведение, которое внешне может показаться осуждаемым строгой моралью. Испытуемый, желающий показать себя в максимально выгодном свете, может отвечать на вопросы не в соответствии с истинными поведенческими проявлениями или качествами, а отражать свое представление о нужных (с точки зрения моральных норм или образцов здоровой либо высокоценимой окружающими личности) реакциях, качествах характера, требованиях культуры поведения, установках и т. д.
В том случае, если значения оценок по шкале «L» превышают критические, считается, что испытуемый отличается установкой на ответы: «Не так, как есть», а «Как должно понравиться» или «Как будет правильно».
Шкалы, подобные «L», наряду с методикой MMPI используются в опросниках EPI, MAS (см. личностные опросники Айзенка, шкала «Проявления тревожности») и ряде других.
3. Шкала валидности («F») направлена на анализ тенденции к намеренному или неосознанному ухудшению результата обследования (симуляция, аггравация). В состав пунктов шкалы включены утверждения, касающиеся проявлений психической и физической сферы, которые весьма редко встречаются в клинической практике, однако внешне соответствуют житейским представлениям о явлениях, которые могут возникнуть при психических расстройствах, стрессе и т. д. В том случае, если испытуемый отмечает у себя большое количество таких симптомов, есть основания предполагать упомянутую выше тенденцию или наличие выраженной мнительности, внушаемости, ипохондричности, склонности к оценке своего состояния в мрачных тонах. Оценки по шкале «F» значительно выше критических могут возникнуть и при случайных (наугад) ответах, невнимательной или поверхностной работе испытуемого, тенденции давать эксцентричные ответы.
4. Шкала коррекции («К») направлена на изучение противоположной предыдущей установки испытуемого к намеренному или неосознанному улучшению результата обследования (диссимуляция). В шкалу включены утверждения, касающиеся часто встречающихся в жизни проявлений, которые могут восприниматься испытуемым как признаки болезни, какого-либо личностного недостатка. Субъект, желающий показаться максимально здоровым или благополучным в личностном или жизненном плане, может часто отрицать наличие у себя таких симптомов, привычек, реакций на окружающие обстоятельства. При повышенных К-показателях можно ожидать, что и на вопросы других шкал испытуемый будет стремиться ответить в более приглаженном, чем в реальности, виде. В зависимости от степени выраженности исследуемой тенденции делается поправка к результату ряда основных клинических шкал методики MMPI.
Высокий К-показатель может означать защитную реакцию на ситуацию тестирования или попытку казаться хорошим. Низкий К-показатель может указывать на чрезмерную честность или самокритичность либо на нарочитую попытку показаться плохим.
Различные варианты показателей контрольных шкал методики ММРI могут интерпретироваться комплексно, давая информацию о возможном характере конкретных данных.
Существующий комплекс контрольных шкал является ценным психодиагностическим инструментом. Контрольные шкалы могут использоваться отдельно от основной методики в сочетании с любым другим приемом диагностики личности в целях контроля достоверности сообщаемых испытуемым данных, анализа установок, искажающих информацию, полученную на основе самооценки.
18. «Завершение предложения»
«Завершение предложения»
– группа проективных методик исследования личности, представляющих собой развитие словесной ассоциации теста. В качестве инструмента для измерения лингвистических способностей имеют давнюю историю в психологических исследованиях. Впервые для изучения личности «Завершение предложения» были применены А. Пейном
(1928), а затем А. Тендлером
(1930). Обследуемому предлагается серия незаконченных предложений, состоящих из одного или нескольких слов, с тем чтобы он их завершил по своему усмотрению.
Пример.
1. Будущее кажется мне…
2. Думаю, что настоящий друг…
3. Женщины…
Предложения формулируются таким образом, чтобы стимулировать обследуемого на ответы, относящиеся к изучаемым свойствам личности. Обработка полученных данных может быть как качественной, так и количественной.
Существует значительное количество методик, основанных на принципе вербального завершения. Одни предназначены для выявления мотивов, потребностей; другие – чувств обследуемого, его отношения к семье, половой жизни, вышестоящим по работе и т. д. Наиболее известны «Завершение предложения», разработанные Дж . Роттером
(1950), Д. Саксом
(1950), Б. Форером
(1950), А. Роде
(1957). Принцип вербального завершения используется также в методиках «Завершение истории».
Достоинствами «Завершение предложения» являются их гибкость, возможность приспособления к разнообразным исследовательским задачам. По оценке зарубежных специалистов, валидность и надежность этих методик достаточно высоки Р. Ватсон
, 1978). Допускается групповое обследование.
В нашей стране разные виды «Завершение предложения» используются преимущественно в клинико-диагностических исследованиях (Г. Г. Румянцев
, 1969 и др.).
19. Критериально-ориентированные тесты
Критериально-ориентированные тесты
– тип тестов, предназначенных для определения уровня индивидуальных достижений относительно некоторого критерия на основе логико-функционального анализа содержания заданий. В качестве критерия (или объективного эталона) обычно рассматриваются конкретные знания, умения, навыки, необходимые для успешного выполнения той или иной задачи. Это основное отличие критериальноориентированных тестов от традиционных психометрических тестов, оценка в которых осуществляется на основе соотнесения индивидуальных результатов с групповыми (ориентация на статистическую норму). Термин «критериально-ориентированные тесты» предложен Р. Гласером
в 1963 г. Установление содержательного и структурного соответствия заданий теста и реальной задачи – важнейший этап разработки критериально-ориентированных тестов. Этим целям служит так называемая спецификация, включающая:
1) содержательный анализ критериальной задачи, описание ее возможных форм и особенностей;
2) систематизацию знаний, умений и навыков, обеспечивающих выполнение критериальной задачи;
3) образцы тестовых заданий и описание стратегии их конструирования.
Различают две разновидности критериально-ориентированных тестов:
1) тесты, задания которых гомогенны, т. е. сконструированы на одной или аналогичной содержательной и логической основе. Обычно такого рода критериально-ориентированные тесты разрабатываются на материале учебных программ и используются для контроля за формированием соответствующих знаний, умений и навыков;
2) тесты, задания которых гетерогенны и заметно отличаются по логической структуре. В этом случае обычна ступенчатая структура теста, при которой каждая ступень характеризуется собственным уровнем сложности, определяемым логико-функциональным анализом содержания, относящегося к критериальной области поведения. Такого рода критериально-ориентированные тесты обычно используются для диагностики специфических трудностей в обучении. Существенной особенностью критериально-ориентированных тестов является то, что в них индивидуальные различия сводятся к минимуму (индивидуальные различия влияют на длительность усвоения, а не на конечный результат). Поэтому критериально-ориентированные тесты лучше всего приспособлены для оценки развития основных навыков на элементарном уровне. В более сложных областях поведения предела достижений не существует, и исходя из этого необходимо обращаться к оценкам, ориентированным на нормы.
Сегодня за рубежом разработаны тесты, выполнение заданий которых можно соотносить как с критериями, так и с нормами. Необходимо учитывать и то, что нормы неявно присутствуют в критериально-ориентированных тестах, ибо выбор содержания или навыков, подлежащих измерению, предполагает наличие сведений о том, как в подобных ситуациях действовали другие обследуемые (А. Анастази
, 1982). Исходя из этого наиболее перспективным представляется объединение критериально-ориентированного подхода с традиционным психометрическим.
А. Анастази (1982) правомерно считает, что акцент критериальноориентированных тестов на содержательном смысле интерпретации тестовых показателей может оказать благотворное влияние на тестирование в целом. В частности, описание результатов, полученных с помощью тестов интеллекта, в терминах специфических навыков и умений в значительной мере обогащает фиксируемые ими показатели. Для критериально-ориентированных тестов непригодны в большинстве случаев обычные приемы определения валидности и надежности.
В отечественных исследованиях имеется опыт создания критериально-ориентированных тестов (Е. И. Горбачева
, 1985). Кроме того, осуществляется разработка методик, близких критериальноориентированным тестам, но ориентированных не на критерий, а на так называемый социально-психологический норматив или общественно-заданный объективный содержательный эталон (Школьный тест умственного развития). Также исходя из социально-психологического норматива анализируются результаты, полученные с помощью известных психометрических тестов.
ЛЕКЦИЯ № 17. Профессионально-этические принципы в психодиагностике
Так же, как и медицинское обследование, любое психодиагностическое обследование может существенно повлиять на судьбу человека. Поэтому во всех странах, где психодиагностическая практика широко и интенсивно развивается, она регламентируется как общим профессионально-этическим кодексом, так и специально разработанными профессионально-этическими стандартами в области тестирования и психодиагностики. Любой член психологического общества должен строго соблюдать кодекс и стандарты. В противном случае он может быть исключен из психологического общества и лишен права лицензии
на психологическую практику. Воссозданное в 1994 г. Российское психологическое общество подготавливает совместно с отраслевыми министерствами и ведомствами (прежде всего с Министерствами образования и здравоохранения РФ) серьезные законопроекты, регламентирующие доступ к психодиагностической информации и порядок использования психологических тестов в стране.
Ведомственные организационные нормативы и правила проведения психодиагностики отражены, в частности, в «Положении о службе практической психологии образования в Российской Федерации» (Вестник образования. 1995. № 7). Здесь будут освещены лишь основные принципы, имеющие прежде всего этическое значение.
В настоящем разделе кратко излагаются основные профессионально-этические принципы в том виде, в каком они распространяются на всех пользователей сертифицированных психодиагностических методик.
1. Принцип специальной подготовки и аттестации лиц, использующих психодиагностические методики
Требование, чтобы диагностические методики использовались только достаточно квалифицированными пользователями, является первым шагом по защите индивида от их неправильного использования. Конечно, необходимая квалификация меняется в зависимости от типа диагностической методики. Так, для правильного применения индивидуальных тестов интеллекта и большинства личностных тестов и опросников и особенно проективных техник требуется относительно длинный период интенсивного обучения, в то время как для тестирования достижений в учебной и профессиональной деятельности нужна минимальная специальная подготовка.
Психолог-диагност должен выбирать методики, которые подходят как для конкретной цели, с которой он проводит обследование, так и для конкретного человека, которого он обследует. Например, психолог, занимающийся диагностикой нарушений развития, должен не только владеть методиками, но и знать особенности детей, относящихся к разным категориям нарушенного развития, а также уметь общаться с ними таким образом, чтобы, не выходя за рамки инструкций и правил применения методик, полностью раскрыть возможности ребенка в выполнении предъявляемых заданий.
Психолог также должен знать соответствующую научную литературу, касающуюся выбранной методики, и быть способным оценить технические параметры таких ее характеристик, как репрезентативность норм, надежность, валидность, достоверность. Известно, что результаты диагностики чувствительны ко множеству условий ее проведения. Психодиагност в подписываемом им заключении должен зафиксировать, что все необходимые методические условия были соблюдены. Психодиагност делает выводы или дает рекомендации только после рассмотрения диагностической информации в свете другой касающейся индивида информации. В тех случаях, когда результаты стандартизированных методик явно противоречат другим источникам информации о человеке, психолог должен взять на себя ответственность за то, чтобы признать результаты проведенного обследования недостоверными, но обосновать это свое заключение указанием на объективные факты, свидетельствующие о недостоверности этих результатов.
Психолог должен знать границы своей компетентности
и ограниченность используемых методов и не предлагать своих услуг, а также не использовать методик, которые не удовлетворяют профессиональным стандартам
, установленным в отдельных областях практики и для определенных категорий методик.
Как правило, в большинстве развитых стран получения диплома о высшем психологическом образовании еще недостаточно для получения права на психологическую практику. Для получения соответствующей лицензии кандидат проходит процедуру аттестации
, включающую специальные экзамены и анализ опыта работы по использованию психодиагностических методик.
Такого рода процедуры аттестации с использованием стандартной системы требований к любым исполнителям (пользователям) независимо от их уровня и направленности образования предусматриваются в работе соответствующих комиссий Российского психологического общества. Профильное образование в данном случае служит инструментом более адекватной подготовки к подобным профессиональным испытаниям, служащим своего рода вступительным экзаменом для новых членов психологического общества.
2. Принцип личной ответственности
Если психолог привлекает к определенным работам по выполнению психодиагностического обследования каких-то исполнителей, не являющихся аттестованными специалистами в области психодиагностики (в частности, педагогов-предметников), то вся полнота ответственности за правильность проведения методики и корректность интерпретации и использования ее результатов целиком лежит именно на психологе. При проведении группового тестирования по разветвленной психодиагностической программе (независимыми исполнителями в разных помещениях в разное время) психолог должен лично завизировать разработанную им программу обследования и лично подписать отчет, содержащий проинтерпретированные им результаты обследования.
3. Принцип ограниченного распространения психодиагностических методик (принцип профессиональной тайны)
В кратком изложении этот принцип гласит, что сертифицированные
психологическим обществом профессиональные психодиагностические методики могут распространяться только среди аттестованных специалистов.
Этот принцип тесно связан с предыдущим и имеет двоякую цель: неразглашение содержания методик и предупреждение их неправильного применения.
Доступ к таким методикам должен быть ограничен теми людьми, кто имеет профессиональную заинтересованность и гарантирует их правильное использование, т. е. они должны быть доступны только тем специалистам, которые будут проводить психологическую диагностику и отвечать за достоверность ее результатов.
Специально подчеркнем здесь, что сохранение профессиональной тайны имеет значение не столько для поддержания авторитета и социального статуса психологов, сколько для обеспечения корректной и точной психодиагностики. Профессиональные психодиагностические методики не должны поступать в открытую продажу. Свободный доступ к методикам может привести, например, к тому, что родители будут натаскивать своих детей на выполнение заданий, входящих в эти методики, в результате чего их диагностическое применение станет абсолютно бессмысленным, они утратят диагностическую ценность, что приведет к серьезным ошибкам и при переводе в специальные школы детей с недостатками развития (профиль школы будет не соответствовать характеру дефекта развития) и при определении направления дальнейшего профессионального обучения и т. п.
Проиллюстрируем это одним уже историческим примером. В середине 1950-х гг. в России начали создаваться первые детские сады для умственно отсталых. Началась разработка содержания занятий в этих садах, при этом, естественно, в такие занятия стали вводиться различные действия, которыми овладевает нормально развивающийся ребенок в преддошкольном и дошкольном возрасте, например складывание пирамидки из цветных колец, построение домиков из кубиков, складывание разрезных картинок, вкладывание предметов в коробку форм и др. Эти же действия традиционно использовались при диагностике детей на медико-педагогических комиссиях, осуществляющих отбор в специальные школы, с целью выявления отставания в умственном развитии. Они действительно представляют определенные трудности для умственно отсталых детей, не прошедших дошкольной подготовки. Неудивительно поэтому, что первое появление выпускников специальных детских садов для умственно отсталых на медико-педагогических комиссиях вызвало некоторое замешательство у работавших там специалистов: заведомо умственно отсталые дети довольно успешно справлялись со многими заданиями, имевшими для специалистов критическое диагностическое значение.
Вскоре после создания новой методики ее распространяют только для исследовательских целей. Это условие должно быть ясно указано в руководстве, и, соответственно, применение этой методики должно быть ограничено только кругом лиц, участвующих в накоплении банка данных по этой методике и не использующих ее для вынесения отдельных выводов без параллельного использования других надежных методик.
Обязанностью автора и издателя диагностических методов является их проверка и повторная стандартизация, проводимые так часто, как это требуется, чтобы предотвратить их старение. Быстрота, с которой методика устаревает, очень различна и зависит от ее содержания. Сертифицированные психодиагностические методики и их основные части нельзя печатать в газете, журнале или популярной брошюре ни в целях описания, ни для использования их при самооценке. Исключение составляют устаревшие тесты достижений, задания этих тестов можно публиковать в специальных брошюрах для тренировки учащихся в выполнении подобных тестов.
Исключения
, касающиеся тестов достижений и методов экспертной оценки, формулируются следующим образом.
1. Сертифицированные тесты достижений, разработанные в центрах, аккредитованных органами народного образования, могут использоваться педагогами как для оперативного, так и для аттестационного контроля уровня знаний. Любой педагог может самостоятельно разработать тест достижений, но использовать его он может только для оперативного контроля за уровнем знаний своих учеников.
2. Методы экспертной оценки личностных качеств учащихся могут использоваться любым педагогом, но их результаты могут иметь применение только в оперативной педагогической работе с данными учащимися и не могут иметь аттестационного значения, т. е. передаваться другим лицам и организациям.
4. Принцип обеспечения суверенных прав личности
Вопрос, возникающий в особенности в связи с использованием личностных тестов, касается посягательства на тайну личности. Это сложный вопрос, поскольку о сущности некоторых тестов, раскрывающих эмоциональные и мотивационные особенности, а также установки личности, человеку не сообщается и он может проявить такие черты в ходе тестирования, которые для него самого нежелательны, не осознавая, что он это делает.
Основной этический принцип в данном случае гласит, что человек не должен подвергаться какому-либо обследованию обманным путем. Это значит, что человек перед обследованием должен быть предупрежден о том, кто будет иметь доступ к результатам обследования и какие решения могут быть им приняты. В том случае, если обследованию подвергаются несовершеннолетние дети, такое предупреждение должны совершенно официально получить родители.
Поясним здесь, что проинформированный о целях и общем смысле обследования (но, конечно, не о содержании тестовых заданий) испытуемый получает следующие возможности
:
1) психологически мобилизоваться для его наилучшего выполнения;
2) отказаться от обследования, осознавая при этом, от каких возможностей он отказывается в случае положительных результатов обследования;
3) не формулировать своего отказа в явной форме, но применить собственную тактику выполнения методики, которая, с его точки зрения, позволяет ему скрыть истинную информацию о себе.
Данный этический принцип, который охраняет право индивида отказываться от участия в обследовании и, следовательно, защищает тайну его личности, осложняет работу психолога и повышает требования к его квалификации. При правильных взаимоотношениях и взаимном уважении психолога и обследуемого число отказов от участия в диагностировании может быть сведено к незначительному числу.
5. Принцип объективности
Обследование должно быть абсолютно беспристрастным. На его исполнителя не должны оказывать влияние общие впечатления о личности обследуемого: симпатии или, наоборот, антипатии, равно как и собственное состояние или настроение.
К сожалению, этот принцип слишком часто нарушается лицами, не имеющими специальной подготовки для проведения психодиагностических обследований и не обладающими необходимыми элементами самоуважения в своем профессиональном самосознании и практическими навыками корректного, доброжелательно-нейтрального общения с испытуемым. Например, доброжелательное отношение к испытуемому ни в коем случае не может выразиться в появлении подсказок и других форм прямой помощи, искажающей результаты. Кроме того, любые ошибки испытуемого, которые говорят о том, что испытуемый просто не понял инструкции к тесту, должны быть тут же скорректированы.
6. Принцип конфиденциальности
Вся информация, получаемая в процессе обследования, должна быть строго конфиденциальной: она должна быть доступна только для тех, для кого она предназначена.
В отличие от предыдущей проблемы в данном случае вопрос состоит о том, кому и в какой форме психолог может сообщать информацию по результатам обследования. Один из ответов на этот вопрос вытекает из принципа 5: можно сообщать информацию тем лицам, о которых был предупрежден испытуемый. Ну, а что же это все-таки за люди? Имеет ли право сам испытуемый получать эти сведения? Или это должны делать родители обследованного ребенка? Если сообщать родителям ученика результаты тестирования, то как это делать?
Психолог должен обеспечить такое преподнесение информации, чтобы родители осознавали свою личную ответственность за возможные невысокие результаты их ребенка по тестам, а не видели в этом лишь вину ребенка, которого за это можно и нужно наказывать. Но если ребенок не был предупрежден о том, что результаты по тесту узнают учителя и родители, то психолог вообще не имеет права сообщать их ни тем ни другим.
Особые ситуации возникают, когда диагностические результаты запрашиваются новыми людьми, как, например, в тех случаях, когда будущий наниматель или колледж просят представить им данные тестового обследования индивида, проведенного в школе. В таких случаях требуется получить согласие индивида на передачу данных. Это же относится и к обследованию в клинике или консультации, а также к тестированию, осуществленному с исследовательскими целями.
Другая проблема относится к сохранению диагностических данных в учреждениях. В случаях, когда данные получены либо для длительного использования в интересах индивида, либо для научных целей, для предотвращения неправильного их применения от психолога категорически требуется обеспечить строгий контроль за доступом любых лиц к этим данным, в том числе учителей и школьной администрации. Психолог обязан сообщать информацию по этим тестам по специальному запросу, отвечая на те вопросы, которые ему задает при этом педагог или директор школы. Требование конфиденциальности психологической информации может нарушаться только в тех случаях, когда нераскрытие диагностических данных представляет опасность для обследуемого индивида или для общества.
Применительно к обследованию детей на психолого-педагогических консультациях (комиссиях) в целях выявления недостатков развития следует отметить, что школа получает общее заключение об итогах исследования, но официальные данные о результатах выполнения примененных тестов могут быть переданы только с согласия самого обследованного, его родителей или представляющих его лиц (например, опекунов). Положение о конфиденциальности диагностической информации введено, в частности, в проект Закона Российской Федерации «Об образовании лиц с ограниченными возможностями здоровья».
7. Принцип психопрофилактического изложения результатов
В последнее время все шире во многих странах распространяется следующий этический норматив: испытуемый также должен иметь возможность комментировать содержание своих результатов и в случае необходимости разъяснять или исправлять фактическую информацию. Очевидно, что в этом случае мы получаем как минимум, два серьезных производных требования
:
1) при сообщении результатов самому испытуемому должны быть соблюдены соответствующие меры предосторожности, направленные против их неправильного использования, неверной интерпретации или возможного появления невротически-депрессивных реакций или обострения депрессивного состояния (т. е. результат должен быть преподнесен по возможности в ободряющем, не травмирующем психику и самооценку контексте);
2) если испытуемый настаивает на том, чтобы переделать тестовое задание, психолог должен иметь наготове запасной вариант практически эквивалентной методики (ряд профессиональных методик специально имеют так называемые параллельные формы), чтобы убедить самого испытуемого, что ему предоставлен дополнительный шанс, с одной стороны, и что результаты первого тестирования были достаточно достоверны, с другой стороны.
В тех случаях, когда школьному психологу заведомо известно, что данные тестирования могут быть использованы родителями или учителями школьника как дополнительный инструмент в конфронтации с ним, которая носит психотравмирующий характер для ребенка, он должен преподносить свою информацию в форме, снижающей риск обострения подобной конфронтации.
Если учитель не запрашивает какой-то информации о ребенке, а психолог владеет этой информацией, но опасается, что эта информация приведет к ухудшению положения ребенка в классе, то психолог имеет право вообще не сообщать эту информацию учителю. Во всех своих профессиональных действиях психолог следует главному императиву своего этического кодекса «Не повреди!». И знание об этом должно сделать понятным для всех, почему психолог ограничивает распространение психодиагностической информации: он делает так не ради сохранения этой информации в тайне, а ради благополучия, психического и физического здоровья всех людей, а в школе – прежде всего ради детей. Но поскольку вся деятельность педагога также должна быть подчинена этому высшему этическому приоритету, то для продуктивного сотрудничества психолога и педагога в школе существуют все необходимые объективные предпосылки.
ЛЕКЦИЯ № 18. Психологический диагноз
Психологический диагноз
(от греч. – «распознание») (ПД) – конечный результат деятельности психолога, направленный на выяснение сущности индивидуально-психологических особенностей личности с целью оценки их актуального состояния, прогноза дальнейшего развития и разработки рекомендаций, определяемых задачей психодиагностического обследования.
Предмет психологического диагноза (ПД) – установление индивидуально-психологических различий в норме и в патологии. Важнейшим элементом психологического диагноза является выяснение в каждом отдельном случае того, почему данные проявления обнаруживаются в поведении обследуемого, каковы их причины и следствия. По мере обогащения психологического знания этиологический элемент в ПД, вероятно, не будет иметь столь существенного значения, как в настоящее время, во всяком случае в текущей, практической работе. Сегодня, как правило, установив средствами психодиагностики те или иные индивидуально-психологические особенности, исследователь лишен возможности указать на их причины, место в структуре личности.
Такой уровень диагностики Л. С. Выготский
назвал симптоматическим
(или эмпирическим). Этот диагноз ограничивается констатацией определенных особенностей или симптомов, на основании которых непосредственно строятся практические выводы. Л. С. Выготский отмечает, что данный диагноз не является собственно научным, ибо установление симптомов никогда автоматически не приводит к диагнозу. Здесь работу психолога вполне можно заменить машинной обработкой данных.
Второй ступенью в развитии психологического диагноза является тиологический диагноз
, учитывающий не только наличие определенных особенностей (симптомов), но и причины их возникновения.
Высший уровень – типологический диагноз
, заключающийся в определении места и значения полученных данных в целостной, динамической картине личности. По словам Л. С. Выготского, диагноз всегда должен иметь в виду сложную структуру личности.
Диагноз неразрывно связан с прогнозом. По Л. С. Выготскому содержание прогноза и диагноза совпадает, но прогноз строится на умении настолько понять внутреннюю логику самодвижения процесса развития, что на основе прошлого и настоящего намечает путь развития. Рекомендуется разбивать прогноз на отдельные периоды и прибегать к длительным повторным наблюдениям. Развитие теории психологического диагноза в настоящее время является одной из наиболее важных задач психодиагностики.
1. Кодирование тестовых оценок
Кодирование тестовых оценок
– элемент процедуры обработки данных психодиагностического обследования. Применяется в многопараметровых тестовых батареях
, личностных опросниках, других методиках, предусматривающих представление результата в виде профильных оценок
.
Кодирование тестовых оценок дает возможность более экономного и краткого описания совокупности шкальных оценок, профиля шкал, а также более четкой и быстрой разбивки материала на клинически (или характерологически) сходные группы. Кодирование тестовых оценок способствует выявлению в изучаемой группе наиболее общих характеристик и закономерностей. Формализация комплексных тестовых оценок является важным элементом создания банка данных и автоматизированной обработки данных обследования (см. компьютерная психодиагностика).
Примером кодирования тестовых оценок может служить процедура шифровки данных Миннесотского многоаспектного личностного опросника (MMPI). Код ММРI представляет собой обозначение профиля с последовательным перечислением шкал (начиная с самых высоких) с использованием их порядкового обозначения для шкал клинических и буквенного – для контрольных шкал. Существует несколько вариантов кодирования тестовых оценок профиля MMPI. Наиболее детальным является метод Г. Уэлша. Определение кода
осуществляется в несколько этапов.
1. Все клинические шкалы перечисляются с использованием их цифрового обозначения слева направо в таком порядке, чтобы на первом месте находилась шкала, которая является в данном профиле ведущим пиком, а затем – остальные по мере снижения.
2. Обозначается высота шкал профиля в зависимости от выраженности результата в Т-баллах (табл. 13).
Таблица 13
Выражение результата по отдельным шкалам
Используя эти обозначения, можно отделить шкалы, расположенные в различных сигмах графика (сигмы разделяют на профиле десятки стандартных делений Т). Если между шкалами 2 и более сигм, то следует перечислить пропущенные сигмы. Например, если 2-я шкала находится выше 90 Т, а следующая 3-я – между 80 и 70, то следует записать 2"3' и т. д.
3. Шкалы, расположенные на одном уровне, записываются согласно порядковому номеру и подчеркиваются одной линией. Если разница показателей шкал в Т единицах не превышает 1 балла, то они также подчеркиваются, однако первой из них становится расположенная выше независимо от порядкового номера (21 – если 2-я имеет результат 68 Т, а 1-я – 67 Т).
4. Шкалы достоверности перечисляются начиная с наиболее высоко расположенной, между ними ставятся обозначения сигм.
Кроме описанного метода кодирования тестовых оценок, существует процедура, предложенная С. Хатуэем
, при которой шкалы, расположенные между 46 и 54 Т, не записываются совсем, шкалы выше 70 Т отделяются знаком (С), а те, что расположены ниже 46 Т, – знаком (-). Контрольные шкалы (без шкалы «?») пишутся в порядке их расположения на графике в числовом выражении (в «сырых» баллах). При этом если результат по шкале превышает критические значения (см. контрольные шкалы), перед обозначением шкалы ставится косой крест, чтобы обратить внимание на недостоверность профиля.
Приведенные способы в соответствующей модификации могут быть перенесены на шифровку данных других методик, например тестов интеллекта. Приемы кодирования применимы в тех случаях, когда результаты отдельных субтестов выражаются в единых измерительных шкалах.
2. Шкальные оценки
Шкальные оценки
– способ оценки результата теста путем установления его места на специальной шкале. Шкала содержит данные о внутригрупповых нормах выполнения данной методики в выборке стандартизации. Так, индивидуальные результаты выполнения заданий (первичные оценки испытуемых) сравниваются с данными в сопоставимой нормативной группе (например, результат, достигнутый учеником, сравнивается с показателями детей того же возраста или года обучения; результат исследования общих способностей взрослого сопоставляется со статистически обработанными показателями репрезентативной выборки лиц в заданных возрастных пределах).
Шкальные оценки в этом смысле имеют четко определенное количественное содержание и могут быть использованы при статистическом анализе. Одной из распространенных в психологической диагностике форм оценки результата теста путем соотнесения с групповыми данными является расчет процентилей
.
Процентиль – процентная доля индивидов из выборки стандартизации, результат которых ниже данного первичного показателя. Шкалу процентилей можно рассматривать как совокупность ранговых градаций (см. ранговая корреляция) при числе рангов 100 и отсчете от 1-го ранга, соответствующего самому низкому результату; 50-й процентиль (PSQ) соответствует медиане (см. меры центральной тенденции) распределения результатов, Р›50 и Р‹50 соответственно представляют ранги результатов выше и ниже среднего уровня результата.
Процентили не следует смешивать с обычными процентными показателями. Последние представляют собой долю правильных решений из общего количества заданий теста в индивидуальном результате (см. первичные оценки). Ранги Р, и Р100 получают соответственно самый низкий и самый высокий результаты из наблюдавшихся в выборке, однако этим рангам могут соответствовать и далеко не нулевой (ни одного правильного решения) или абсолютный (все решения правильны) показатели (например, при общем количестве 120 заданий минимальный результат, соответствующий первому рангу, может составить 6 правильных решений, в то время как максимальный результат, соответствующий рангу Р100, будет составлять 95 правильно решенных заданий). Такая ситуация наблюдается, например, при оценке тестов скорости.
Основной недостаток процентильных шкал состоит в неравномерности единиц измерения. При нормальном распределении отдельные переменные тесно группируются в центре распределения и по мере удаления к краям рассеиваются. Поэтому равным частотам случаев вблизи центра соответствуют более короткие интервалы по оси абсцисс, расположенные по краям распределения оценок. Процентили показывают относительное положение каждого испытуемого в нормальной выборке, но не величину различий между результатами. Это создает некоторые неудобства в интерпретации индивидуальных результатов. Так, разница в первичных показателях, соответствующая интервалу Р70-Р80, может составить 10 баллов, а различие в количестве правильных решений в интервале рангов Р50-Р60 – лишь 1–3 балла.
Вместе с тем процентильные оценки обладают и рядом достоинств. Они легкодоступны пониманию пользователей психодиагностической информацией, универсальны по отношению к различным типам методик и легко рассчитываются.
Процентильные оценки не относятся к типичным шкальным показателям. Более широкое распространение в психодиагностике получили стандартные показатели
, рассчитываемые на основе линейного и нелинейного преобразования первичных показателей, распределенных по нормальному или близкому к нормальному закону. При таком расчете проводится г-преобразование оценок (см. стандартизация, нормальное распределение). Чтобы определить 2-стандартный показатель, определяют разность между индивидуальным первичным результатом и средним значением для нормальной группы, а затем делят эту разность на а нормативной выборки. Полученная таким образом шкала z имеет среднюю точку М = 0, отрицательные значения обозначают результаты ниже среднего и убывают по мере удаления от нулевой точки; положительные значения обозначают, соответственно, результаты выше среднего. Единица измерения (масштаб) в шкале z равна 1а стандартного (единичного) нормального распределения.
Для преобразования полученного при стандартизации распределения первичных нормативных результатов в стандартную z-шкалу необходимо исследовать вопрос о характере эмпирического распределения и степени его согласованности с нормальным. Поскольку для большинства случаев значения показателей в распределении умещаются в пределах М ± 3?, единицы измерения простой z-шкалы слишком велики. Для удобства оценивания применяется еще одно преобразование типа z = (x – ‹x›) / ?. Примером такой шкалы могут быть оценки тестовой батареи SAT(СЕЕВ) методики для оценки способности к обучению (см. тесты достижений). Эта r-шкала пересчитана таким образом, что средней точке соответствует значение 500, а ? = 100. Другим аналогичным примером является шкала Векслера для отдельных субтестов (см. шкала измерения интеллекта Векслера, где М = 10, ? = 3).
Наряду с определением места индивидуального результата в стандартном распределении групповых данных введение ШО направлено и на достижение другой важнейшей цели – обеспечение сопоставимости количественных результатов различных тестов, выраженных в стандартных шкалах, возможности их совместных интерпретаций, сведение оценок к единой системе.
В случае, если оба распределения оценок в сравниваемых методиках близки к нормальному, вопрос о сопоставимости оценок решается довольно просто (в любом нормальном распределении интервалам М ± n? соответствует одинаковая частота случаев). Для обеспечения сопоставимости результатов, принадлежащих к рас-пределениям другой формы, применяются нелинейные преобразования
, позволяющие придать распределению форму заданной теоретической кривой. В качестве такой кривой обычно используется нормальное распределение. Как и 160–150 в простом г-преобразовании, нормализованным стандартным показателям можно придать любую желаемую форму. К примеру, умножив такой нормализованный стандартный показатель на 10 и прибавив константу 50, получаем Т-показатель
(см. стандартизация, миннесотский многоаспектный личностный опросник).
Примером нелинейно преобразованной в стандартную шкалу является и шкала станайнов
(от англ. standart nine – «стандартная девятка»), где оценки принимают значения от 1 до 9, М = 5, ?=2.
Шкала станайнов получает все большее распространение, сочетая в себе достоинства стандартных шкальных показателей и простоту процентилей. Первичные показатели легко преобразуются в станайны. Для этого испытуемых ранжируют по возрастанию результатов и из них образуют группы с числом лиц, пропорциональным определенным частотам оценок в нормальном распределении тестовых результатов (табл. 14).
Таблица 14
Перевод первичных тестовых результатов в шкалу станайнов
При трансформации оценок в шкалу стэнов
(от англ. standart ten – «стандартная десятка») проводится аналогичная процедура с той лишь разницей, что в основании этой шкалы лежат десять стандартных интервалов. Пусть в выборке стандартизации 200 человек, тогда по 8 (4 %) испытуемых, имеющих самые низкие и самые высокие оценки, будут отнесены к 1 и 9 станайнам соответственно. Процедура продолжается до заполнения всех интервалов шкалы. Соответствующие процентным градациям баллы по тесту, таким образом, будут упорядочены в шкалу, соответствующую стандартным частотам распределения результата.
Одной из наиболее распространенных форм шкальных оценок в тестах интеллекта является стандартный IQ-показатель
(М = = 100, ? = 16). Эти параметры для стандартной шкалы оценок в психодиагностике выбраны в качестве эталонных. Существует довольно много шкал, опирающихся на стандартизацию; их оценки легко сводимы друг к другу. Шкалирование, в принципе, допустимо и желательно для широкого круга методик, применяемых в диагностических и исследовательских целях, в том числе и для методик, результаты которых выражены в качественных показателях. В этом случае для стандартизации можно использовать перевод номинативных шкал в ранговые (см. шкалы измерительные) или разработать дифференцированную систему количественных первичных оценок.
Следует отметить, что при всей простоте, наглядности шкальные показатели являются статистическими характеристиками, позволяющими лишь указать на место данного результата в выборке из множества аналогичных по характеру измерений. Шкальный показатель даже для традиционного психометрического инструмента является лишь одной из форм выражения показателей теста, используемых при интерпретации результатов обследования. Количественный анализ при этом должен всегда проводиться в комплексе с многосторонним качественным изучением причин возникновения данного тестового результата с учетом как комплекса сведений о личности испытуемого, так и данных о текущих условиях обследования, надежности и валидности методики. Гипертрофированные представления о возможности обоснованных заключений лишь по количественным оценкам приводили к многим ошибочным представлениям в теории и практике психологической диагностики.
3. Заключение
Заключение
– документ о результатах тестирования, подготовленный психологом. 3аключение должно строиться на всех доступных для исследователя данных. Стандартной формы и правил написания заключения не существует, оно видоизменяется в зависимости от цели, ситуации, в которой проводится тестирование, адресата, теоретических установок и специализации психолога. Основное в подготовке заключения – его соответствие потребностям, интересам и уровню квалификации заказчика.
Заключение должно быть ориентировано на действия, которые необходимо предпринять в связи с тем или иным психологическим диагнозом (рекомендации по программам обучения, типа лечения или коррекции, выбора профессии и т. п.). В заключении должны быть показатели заметно низкие или высокие, а не близкие к средним. Основное содержание – это интерпретация и выводы, в отдельных случаях могут прилагаться протоколы обследования. Утверждения психолога должны отражать степень надежности каждого из приводимых фактов или выводов. Следует избегать специальной терминологии. Заключение эффективно лишь в том случае, когда применимо только к данному обследуемому, а не к людям этого возраста, пола, образования, страдающим тем же заболеванием и т. д. При подготовке заключения обязательно следует руководствоваться этическими нормами психодиагностики.
|