Оценка развития по шкале z – score. Шкалирование результатов тестирования Установление проходного балла

Психодиагностика: конспект лекций Алексей Сергеевич Лучинин

2. Шкальные оценки

2. Шкальные оценки

Шкальные оценки – способ оценки результата теста путем установления его места на специальной шкале. Шкала содержит данные о внутригрупповых нормах выполнения данной методики в выборке стандартизации. Так, индивидуальные результаты выполнения заданий (первичные оценки испытуемых) сравниваются с данными в сопоставимой нормативной группе (например, результат, достигнутый учеником, сравнивается с показателями детей того же возраста или года обучения; результат исследования общих способностей взрослого сопоставляется со статистически обработанными показателями репрезентативной выборки лиц в заданных возрастных пределах).

Шкальные оценки в этом смысле имеют четко определенное количественное содержание и могут быть использованы при статистическом анализе. Одной из распространенных в психологической диагностике форм оценки результата теста путем соотнесения с групповыми данными является расчет процентилей .

Процентиль – процентная доля индивидов из выборки стандартизации, результат которых ниже данного первичного показателя. Шкалу процентилей можно рассматривать как совокупность ранговых градаций (см. ранговая корреляция) при числе рангов 100 и отсчете от 1-го ранга, соответствующего самому низкому результату; 50-й процентиль (PSQ) соответствует медиане (см. меры центральной тенденции) распределения результатов, Р ›50 и Р ‹50 соответственно представляют ранги результатов выше и ниже среднего уровня результата.

Процентили не следует смешивать с обычными процентными показателями. Последние представляют собой долю правильных решений из общего количества заданий теста в индивидуальном результате (см. первичные оценки). Ранги Р, и Р 100 получают соответственно самый низкий и самый высокий результаты из наблюдавшихся в выборке, однако этим рангам могут соответствовать и далеко не нулевой (ни одного правильного решения) или абсолютный (все решения правильны) показатели (например, при общем количестве 120 заданий минимальный результат, соответствующий первому рангу, может составить 6 правильных решений, в то время как максимальный результат, соответствующий рангу Р 100 , будет составлять 95 правильно решенных заданий). Такая ситуация наблюдается, например, при оценке тестов скорости.

Основной недостаток процентильных шкал состоит в неравномерности единиц измерения. При нормальном распределении отдельные переменные тесно группируются в центре распределения и по мере удаления к краям рассеиваются. Поэтому равным частотам случаев вблизи центра соответствуют более короткие интервалы по оси абсцисс, расположенные по краям распределения оценок. Процентили показывают относительное положение каждого испытуемого в нормальной выборке, но не величину различий между результатами. Это создает некоторые неудобства в интерпретации индивидуальных результатов. Так, разница в первичных показателях, соответствующая интервалу Р 70 -Р 80 , может составить 10 баллов, а различие в количестве правильных решений в интервале рангов Р 50 -Р 60 – лишь 1–3 балла.

Вместе с тем процентильные оценки обладают и рядом достоинств. Они легкодоступны пониманию пользователей психодиагностической информацией, универсальны по отношению к различным типам методик и легко рассчитываются.

Процентильные оценки не относятся к типичным шкальным показателям. Более широкое распространение в психодиагностике получили стандартные показатели , рассчитываемые на основе линейного и нелинейного преобразования первичных показателей, распределенных по нормальному или близкому к нормальному закону. При таком расчете проводится г-преобразование оценок (см. стандартизация, нормальное распределение). Чтобы определить 2-стандартный показатель, определяют разность между индивидуальным первичным результатом и средним значением для нормальной группы, а затем делят эту разность на а нормативной выборки. Полученная таким образом шкала z имеет среднюю точку М = 0, отрицательные значения обозначают результаты ниже среднего и убывают по мере удаления от нулевой точки; положительные значения обозначают, соответственно, результаты выше среднего. Единица измерения (масштаб) в шкале z равна 1а стандартного (единичного) нормального распределения.

Для преобразования полученного при стандартизации распределения первичных нормативных результатов в стандартную z-шкалу необходимо исследовать вопрос о характере эмпирического распределения и степени его согласованности с нормальным. Поскольку для большинства случаев значения показателей в распределении умещаются в пределах М ± 3?, единицы измерения простой z-шкалы слишком велики. Для удобства оценивания применяется еще одно преобразование типа z = (x – ‹x›) / ?. Примером такой шкалы могут быть оценки тестовой батареи SAT(СЕЕВ) методики для оценки способности к обучению (см. тесты достижений). Эта r-шкала пересчитана таким образом, что средней точке соответствует значение 500, а? = 100. Другим аналогичным примером является шкала Векслера для отдельных субтестов (см. шкала измерения интеллекта Векслера, где М = 10, ? = 3).

Наряду с определением места индивидуального результата в стандартном распределении групповых данных введение ШО направлено и на достижение другой важнейшей цели – обеспечение сопоставимости количественных результатов различных тестов, выраженных в стандартных шкалах, возможности их совместных интерпретаций, сведение оценок к единой системе.

В случае, если оба распределения оценок в сравниваемых методиках близки к нормальному, вопрос о сопоставимости оценок решается довольно просто (в любом нормальном распределении интервалам М ± n? соответствует одинаковая частота случаев). Для обеспечения сопоставимости результатов, принадлежащих к рас-пределениям другой формы, применяются нелинейные преобразования , позволяющие придать распределению форму заданной теоретической кривой. В качестве такой кривой обычно используется нормальное распределение. Как и 160–150 в простом г-преобразовании, нормализованным стандартным показателям можно придать любую желаемую форму. К примеру, умножив такой нормализованный стандартный показатель на 10 и прибавив константу 50, получаем Т-показатель (см. стандартизация, миннесотский многоаспектный личностный опросник).

Примером нелинейно преобразованной в стандартную шкалу является и шкала станайнов (от англ. standart nine – «стандартная девятка»), где оценки принимают значения от 1 до 9, М = 5, ?=2.

Шкала станайнов получает все большее распространение, сочетая в себе достоинства стандартных шкальных показателей и простоту процентилей. Первичные показатели легко преобразуются в станайны. Для этого испытуемых ранжируют по возрастанию результатов и из них образуют группы с числом лиц, пропорциональным определенным частотам оценок в нормальном распределении тестовых результатов (табл. 14).

Таблица 14

Перевод первичных тестовых результатов в шкалу станайнов

При трансформации оценок в шкалу стэнов (от англ. standart ten – «стандартная десятка») проводится аналогичная процедура с той лишь разницей, что в основании этой шкалы лежат десять стандартных интервалов. Пусть в выборке стандартизации 200 человек, тогда по 8 (4 %) испытуемых, имеющих самые низкие и самые высокие оценки, будут отнесены к 1 и 9 станайнам соответственно. Процедура продолжается до заполнения всех интервалов шкалы. Соответствующие процентным градациям баллы по тесту, таким образом, будут упорядочены в шкалу, соответствующую стандартным частотам распределения результата.

Одной из наиболее распространенных форм шкальных оценок в тестах интеллекта является стандартный IQ-показатель (М = = 100, ? = 16). Эти параметры для стандартной шкалы оценок в психодиагностике выбраны в качестве эталонных. Существует довольно много шкал, опирающихся на стандартизацию; их оценки легко сводимы друг к другу. Шкалирование, в принципе, допустимо и желательно для широкого круга методик, применяемых в диагностических и исследовательских целях, в том числе и для методик, результаты которых выражены в качественных показателях. В этом случае для стандартизации можно использовать перевод номинативных шкал в ранговые (см. шкалы измерительные) или разработать дифференцированную систему количественных первичных оценок.

Следует отметить, что при всей простоте, наглядности шкальные показатели являются статистическими характеристиками, позволяющими лишь указать на место данного результата в выборке из множества аналогичных по характеру измерений. Шкальный показатель даже для традиционного психометрического инструмента является лишь одной из форм выражения показателей теста, используемых при интерпретации результатов обследования. Количественный анализ при этом должен всегда проводиться в комплексе с многосторонним качественным изучением причин возникновения данного тестового результата с учетом как комплекса сведений о личности испытуемого, так и данных о текущих условиях обследования, надежности и валидности методики. Гипертрофированные представления о возможности обоснованных заключений лишь по количественным оценкам приводили к многим ошибочным представлениям в теории и практике психологической диагностики.

Из книги Медицинская статистика автора Ольга Ивановна Жидкова

22. Методика групповой оценки физического развития. Акселерация Оценка физического развития коллектива производится путем анализа возрастных изменений средних величин их средних квадратических отклонений, годичных приростов показателей в различные возрастные

Из книги Пропедевтика детских болезней автора О. В. Осипова

8. Цент ильный метод оценки физического развития Учитывая наблюдающееся варьирование различных показателей физического развития ребенка, нужно знать так называемое нормальное, или гаусс-лапласовское, распределение. Характеристиками этого распределения являются

Из книги Общая гигиена автора Юрий Юрьевич Елисеев

50. Методы оценки физического развития детей и подростков Метод сигмальных отклоненийПоказатели развития индивидуума сравниваются со средними показателями, характерными для соответствующей возрастно-половой группы, разница между ними выражается в долях

Из книги Общая гигиена: конспект лекций автора Юрий Юрьевич Елисеев

51. Методы оценки физического развития детей и подростков (продолжение) На втором этапе определяют морфофункциональ-ное состояние по показателям массы тела, окружности груди в дыхательной паузе, мышечной силе кистей рук и жизненной емкости легких (ЖЕЛ). В качестве

Из книги Пропедевтика детских болезней: конспект лекций автора О. В. Осипова

ЛЕКЦИЯ № 14. Физическое развитие детей и подростков, методы их оценки Показатели физического развития Для полного представления о состоянии здоровья подрастающего поколения, кроме заболеваемости, демографических данных, необходимо еще изучение ведущего критерия

Из книги Развитие базовых познавательных функций с помощью адаптивно-игровых занятий автора Ирина Константинова

Методы оценки физического развития детей и подростков При разработке и выборе методов оценки физического развития необходимо прежде всего учитывать основные закономерности физического развития растущего организма:1) гетероморфность и гетерохронность развития;2)

Из книги Стройность с детства: как подарить своему ребенку красивую фигуру автора Аман Атилов

5. Показатели физического развития детей. Центильный метод оценки физического развития Учитывая наблюдающееся варьирование различных показателей физического развития ребенка, нужно знать так называемое нормальное, или гаусс-лапласовское, распределение.

Из книги Ваш ребенок от рождения до 6 лет. Выявление отклонений в развитии и их коррекция. Книга, необходимая в каждой семье автора Леонид Ростиславович Биттерлих

Способы оценки результативности работы В работе с детьми, имеющими тяжелые нарушения развития, используется качественный анализ нарушений и происходящей динамики. Так, например, для специалиста не столько важно количество освоенных ребенком слов, сколько его умение

Из книги Формирование здоровья детей в дошкольных учреждениях автора Александр Георгиевич Швецов

Критерии оценки гибкости Для определения эффективности учебно-тренировочного процесса необходимо использовать критерии оценки гибкости с учетом ее разновидностей и проявлений. Каждому проявлению гибкости должны соответствовать определенные критерии оценки.

Из книги Психотерапия семейно-сексуальных дисгармоний автора Станислав Кратохвил

Способы оценки правильного развития недоношенного ребенка и близнецов Вы можете использовать два нижеприведенных способа для того, чтобы проверить, отстает ли ваш недоношенный ребенок в развитии от доношенного ребенка так, как это ему положено в норме, или имеется

Из книги Энциклопедия Амосова. Алгоритм здоровья автора Николай Михайлович Амосов

Методика оценки физического развития детей В настоящее время наиболее распространенным способом оценки физического развития является метод взаимосвязи антропометрических признаков (по шкалам регрессии), которые обеспечивают гармоничность, пропорциональность их

Из книги Диетология: Руководство автора Коллектив авторов

Из книги Мой инсульт был мне наукой. История собственной болезни, рассказанная нейробиологом автора Джилл Болти Тейлор

Экспертные оценки психики В социологических опросах через газеты в 1990 г. я попробовал получить модель личности конкретного респондента. Для этого ему задавались вопросы с градуальными вариантами ответов. Они позволяли определить точки на моделях: притязания, плату,

Из книги автора

Комплексные методы оценки нутриционного статуса Как следует из вышеизложенного, не существует отдельных маркеров, которые позволяют выявить наличие и степень белково-энергетической недостаточности. По рекомендациям Европейского общества парентерального и

Из книги автора

Приложение А Десять вопросов для оценки моего состояния 1. Проверили ли вы мое зрение и слух, чтобы убедиться, что я не перестала слышать и видеть?2. Различаю ли я цвета?3. Вижу ли я мир трехмерным?4. Есть ли у меня хоть какое-то чувство времени?5. Все ли части своего тела я

Показатели психометрических тестов, применяемых в практической психологии с целью постановки психологического диагноза, переводятся из первичных ("сырых" – не подвергнутых обработке) и полученных испытуемым по данному тесту в стандартные показатели, которые рассчитываются на основе линейного или нелинейного преобразования первичных показателей (при условии их распределения близкого к нормальному закону). При этом исторически сложилось наличие ряда наиболее распространённых стандартных показателей, связанных с особенностями преобразования, и отсюда – наличие "семейства" стандартных шкал, переводимых друг в друга и несводимых к Z-шкале.

Z-шкала образуется в результате центрирования, понимаемого как линейная трансформация величин признака, при которой средняя величина распределения становится равная нулю, и процедуры нормирования посредством среднеквадратических отклонений.

Z-шкала состоит из непрерывного континуума Z-показателей, определяемых в виде разности между индивидуальными первичными результатами и средним значением для генеральной совокупности, делённые на стандартное отклонение распределения.

где X – необработанные, сырые баллы,

– Среднее,

s – стандартное отклонение.

При этом полученная Z-шкала будет иметь среднюю точку M=0 и единицу измерения (масштаб) 1s стандартного (единичного) нормального распределения как показано на рисунке 2.

Z-показатель может принимать как положительные, так и отрицательные значения. Большинство случаев (99,72%) значения показателей уменьшаются в пределах -3+3 и могут принимать любые значения. К достоинствам Z-показателя относится простота интерпретации и сравнения индивидуальных результатов: чем больше показатель, тем дальше от среднего (нормы) он может находиться, при этом знак указывает (+) – выше среднего; (-) – ниже среднего. Но недостатки, особенно в области прикладной (практической) психологии, к которым относят: сложность интерпретации для испытуемого (клиента), крупность масштаба единиц измерения, оперирование отрицательными и положительными величинами, побудили разработчиков тестов использовать нормализованные преобразования по форме: , где Zp – преобразованный стандартный показатель; b – стандартное отклонение преобразованного распределения; Z – Z-показатель; A – среднее значение преобразованного распределения. Такой переход правомерен, так как стандартная шкала представляет собой интервальную шкалу, что позволяет выполнить линейные преобразования, при условии, что константы b и A – действительные числа.

Разберём процедуру получения преобразованных стандартных показателей на ряде примеров:


Было проведено эмпирическое исследование уровня уверенности в себе (опросник Рейзаса – 0-90) на выборке учителей (50 человек) из различных школ г. Н. Новгорода. В результате первичной статистической обработки были получены результаты:

1) Распределение первичных результатов ("сырых баллов") по форме близко к нормальному распределению (после процедур группировки и анализа кривой распределения – полигона частот).

2) Вычислены характеристики для данной выборки –

Предлагается провести линейное преобразование и определить для различных шкал значение одного первичного результата X=45 ("сырой балл" одного из испытуемых).

1) Преобразование в Z-показатель производится по формуле:

где Z – стандартный Z-показатель;

X – первичный результат тестового измерения;

M x – средняя величина результатов выборки (в нашем случае медиана Me);

S x – стандартное отклонение для данной выборки. Найдите полученный показатель на Z-шкале (рисунок 2) и сделайте вывод о проявлении изучаемого признака у данного испытуемого.

2) Преобразование в T-шкалу для опросников Мак-Колла производится по уже известной формуле (Zp=A+bZ), подставляя вместо констант A = M = 50; b = s = 10 – полученные Мак-Коллом в результате нормализации эмпирических распределений собственных опросников, переведём результат испытуемого (X=45) в стандартные T-баллы по формуле:

Таким образом, результат – 25 T-баллов (стандартных баллов).

3) Преобразование в шкалу станайнов Гилфорда (англ. standard nine – стандартная девятка), где оценкам присваивают целые значения от 1 до 9, при M = 5, s = 2 производятся по формуле:

В данном случае результат испытуемого будет 1 станайн (т.к. полученный результат C = 0 попал в интервал 1-го станайна).

Данная C-шкала обладает таким замечательным свойством (см. рисунок 2), что в 1 и 9 станайны попадает по 4% испытуемых всей выборки, во 2 и 8 станайны – по 7%, и т.д. Таким образом, при ранжированном упорядочивании в сторону возрастания первичных тестовых результатов и условии их нормального (или близкому к нормальному) распределения первым 4% данных присваивается 1 станайн, последующим 7% данных – 2-ой станайн, следующим 12% данных – 3-й станайн и т.д., таким образом, данные будут упорядочены в шкалу, соответствующую стандартным частотам распределения результата.

4) Преобразование в шкалу стенов Кэттела (от англ. standard ten – стандартная десятка) для опросника 16PF, где оценкам присваивают целые значения от 1 до 10, при M = 5; s = 2 производят по формуле:

В данном случае результат испытуемого попадает в интервал 1-го стена.

В тестировании интеллекта используются нормализованные шкалы:

5) Шкала Векслера представленная IQ-стандартными баллами:


6) Шкала структуры интеллекта Амтхауэра по формуле:

С целью интерпретации данных для работников образования представляет интерес шкала Линерта:

7) Шкала школьных оценок Линерта:

Рис.2. Нормальная кривая и стандартные показатели.


РАЗДЕЛ 3
Психометрические требования к психодиагностической методике.

Объективность, валидность и надёжность – это психометрические требования, которым должен удовлетворять психодиагностическая методика.

Если объективность психологического теста связана с тем, что первичные показатели по тесту, их оценка и интерпретация не зависят от поведения и субъективных суждений экспериментатора и основана на стандартизации процедуры проведения, обработки и интерпретации психологического теста, то надёжность и валидность тестовой методики это характеристики самого психодиагностического инструмента, отражающие качество и эффективность.

Надёжность и валидность теста тесно связаны между собой, но наиболее часто практикующему психологу необходимо проводить проверку лишь одной составляющей для оценки применимости теста – его надёжности.

Z-показатель или стандартизированный показатель - этопоказатель, определяющий количество стандартных отклонений, на которое отклоняется полученный результат от среднего результата в нормативной выборке.

Шкала Z-оценок (стандартизированныйZ-показатель)

Шкала стандартных отклонений

Шкала стандартных отклонений в самом простом варианте представляет собой шкалу из трех уровней, каждый из которых соответствует определенной степени выраженности диагностируемого свойства. Дадим характеристику этих уровней.

· Первый уровень соответствует левой части распределения до одной сигмы и отражает низкуюстепеньвыраженности свойства. Все сырые оценки, которые попадают в данный диапазон, независимо от первичного значения, будут свидетельствовать о низкой выраженности диагностируемого параметра.

· Второй уровень шкалы соответствует диапазону от 1 сигмы слева до одной сигмы справа. В центре этого диапазона находится среднее значение по выборке. Данный уровень отражает среднюю степень выраженности свойства. Согласно функции нормального распределения этот уровень имеют 68, 27% испытуемых в нормативной выборке.

· Третий уровень, отражающий значительную выраженность исследуемого свойства, занимает диапазон от первой сигмы справа до правого конца кривой нормального распределения.

В простом варианте описанная шкала состоит из трех уровней, однако возможны варианты и с большим количеством градаций. Как правило, в этих вариантах первый и третий уровни разбиваются на дополнительные уровни в соответствии с интервалами стандартных отклонений.

Недостатки данной шкалы очевидны. Во-первых, шкала имеет небольшое количество градаций, что обусловливает потери диагностической информации. Во-вторых, данная шкала представляет собой, по сути, рейтинговую нормализованную шкалу. Это ограничивает возможности статистического анализа полученных результатов.

На основе значений Z-показателя составляется шкала Z-оценок. Дадим ее характеристику.

· Математически Z-показатель рассчитывается как отношение разности данной сырой оценки и средней оценки в нормативной группе к величине стандартного отклонения.

· Шкала Z-оценок включает 7 или 9 меток. По своей структуре она эквивалентна шкале стандартных отклонений.

· Название «Z-показатель» соответствует представлению данных в форме нормального распределения (Z-распределения).

· Метка в середине шкалы соответствует сырому среднему значению в популяции и принимает значение «0».

· Слева и справа от средней метки находятся равные интервалы, которые соответствуют интервалам 1, 2, 3 и 4 сигм (средних квадратичных отклонений).



· Метки справа имеют соответственно значения «1», «2», «3» и «4 (в случае, если добавляется интервал от 3 сигмы до 4 сигмы).

· Метки справа от среднего значения имеют соответствующие отрицательные значения от «-1» до «-3» или «-4».

Таким образом, шкала Z-оценок включает отрицательные и положительные значения, а также оценку «0». Такая структура шкалы создает трудности для последующего анализа и интерпретации полученных данных. В связи с этим на основе Z-показателя предложены более приемлемые варианты нормализации сырых значений. Одним из таких вариантов является преобразованныйZt-показатель.

Zt-показательпредставляет собой преобразованную Z-оценку.Zt-оценкавычисляется по формуле Zt = A+BxZ, где

А – среднее значение распределения преобразованных оценок,

В – стандартное отклонение преобразованного распределения,

символ «х» - знак умножения.

Из приведенной формулы следует, что Zt учитывает не только среднее значение и среднее квадратичное отклонение распределения сырых оценок, но также среднее значение и среднее квадратичное отклонение распределения уже нормализованных оценок. Преимущество такого преобразования Z-показателя состоит в том, что статистические параметры нормализованного распределения могут выбираться произвольно. В психометрии по общему согласию специалистов в качестве среднего значения нормализованного распределения было выбрано значение «50», а значение стандартного отклонения - «10». В этом случае Zt-показатель стал называться как «Т-балл».

Шкала Т-баллов – это шкала стандартизированных оценок, в которой каждая оценка рассчитывается по формуле:

T = 50+10х(сырая оценка – средняя сырая оценка)/стандартное отклонение распределения сырых оценок.

Т-баллы всегда принимают положительные значения и имеют нормальное распределение со средним значением «50» и стандартным отклонением «10». «Нормальные» оценки по шкале Т-баллов, свидетельствующие о средней выраженности диагностируемого свойства, соответствуют диапазону в пределах 2 стандартных отклонений, обычно от 30 до 70 Т-баллов.

Как и в случае шкалы Z-оценок, основные метки Т-шкалы в целом соответствуют меткам шкалы стандартных отклонений. Например, интервал Т-баллов соответствует интервалу [среднее значение…. одна сигма] по шкале стандартных отклонений слева, или интервалу по шкале Z-оценок.

Шкала Т-баллов удобнее для интерпретации по сравнению с предыдущими шкалами. По своей форме она представляет собой шкалу интервалов и имеет непрерывный характер. С другой стороны, следует помнить, что шкала Т-баллов по сути подобна шкале стандартных отклонений и в строгом смысле она не является шкалой интервалов. В ее конструкции приняты определенные условные допущения, функция которых заключается в обеспечении удобства восприятия и трактовки диагностических данных. Поэтому при интерпретации Т-баллов не стоит переоценивать численные значения нормализованных показателей. Например, если у одного испытуемого по диагностической шкале Т=55, а другого по этой же шкале Т=60, то это совсем не означает, что у первого диагностируемое свойство имеет меньшую выраженность, чем у второго. Оценка значений Т-баллов проводится по диапазонам, эквивалентным шкале стандартных отклонений. Еще раз отметим, что преимущество Т-баллов состоит в возможности более удобного и наглядного представления результатов, например, в виде графика.

Преобразование в шкалу Т-баллов нашло применение в ряде широко используемыхвклиникеопросников, например, Миннесотском мнгогофазном личностном опроснике (MMPI).

Основным недостатком преобразования Z-оценки в Zt-показатель является привязка оценки полученных диагностических результатов к нормативным данным, точнее говоря, к среднему значению и среднему квадратичному отклонению нормативной выборки. Поскольку получить полностью репрезентативную нормативную выборку крайне трудно, нормативные данные чаще всего отражают распределение диагностируемого свойства не в популяции в целом, а лишь в выборке испытуемых, взятой для проведения нормализации. Следует учитывать, что выборканормализации может значительно отличаться от популяции, представителем которой является данный конкретный испытуемый. В результате некорректного перевода первичных оценок в стандартизированныеможетзначительно снизиться валидность и достоверность полученных диагностических данных.

С целью устранения указанного выше недостатка предложены способы перевода в стандартизированные показатели, не зависящие от выборки стандартизации. Такой способ нормализации первичных оценок используется в технологии анализа тестовых заданий . В этой технологии нормализация сырых оценок осуществляется не на основе описательной статистики, а с помощью метода максимального правдоподобия с логарифмическимшкалированием.

Способ перевода в Т-баллы на основе теории анализа тестовых заданий показал достаточно высокую эффективность в ряде психодиагностических методик в клинике.

Оценка физического развития детей по шкале Z - score

Составной частью любой программы исследования здоровья и питания детей как на популяционном уровне, так и при оценке питания и здоровья индивидуума является отслеживание антропометрических параметров детей в сравнении со стандартными кривыми роста. Всемирная Организация Здравоохранения рекомендует метод оценки состояния питания детей на основе использования показателей тотальных размеров тела (длины и массы тела). Оценка антропометрических данных заключается в расчете числа стандартных отклонений (Со или s), на которое исследуемый показатель массы или длины тела отличается от медианы стандартной популяции (международные стандарты ВОЗ рассчитаны на данных исследования антропометрических параметров детей США и Великобритании). Рассчитанную величину стандартного отклонения называют Z - score или Z-балл.

Антропометрические данные каждого ребенка характеризуются своей величиной Z - score. Если данные антропометрии ребенка меньше медианы стандарта, то Z - score будет иметь отрицательную величину, если показатели выше медианы, то Z - score будет положительным.

Величину Z - score рассчитывают для трех показателей:

1. Масса тела для возраста - Мт/В,

2. Длина тела для возраста - Дт/В,

3. Масса тела для длины тела - Мт/Дт.

Показатель Мт/Дт применяется только в возрасте до 10 лет у девочек и до 11,5 лет у мальчиков.

Для диагностики определены пограничные значения СО, которые позволяют выделить следующие варианты оцениваемых показателей:

— низкие (н), характеризующие недостаточную ДТ и МТ - устанавливаются при значениях СО менее -2;

— высокие (в) , характеризующие избыточную ДТ и МТ - устанавливаются при значениях СО более +2;

— нормальные (нм) - устанавливается при значениях СО в диапазоне от -2 до +2;

Показатель длина тела для возраста характеризует линейный рост и оценивает долгосрочную задержку роста, т.е. Z - score менее -2 может свидетельствовать о хронической недостаточности питания, приведшей к задержке роста.

Z - score масса тела для длины тела отражает пропорции тела или гармоничность развития, и он очень чувствителен к острому недоеданию.

Z - score масса тела для возраста чувствителен к острому нарушению питания и отражает недоедание ребенка в настоящее время или в ближайшем прошлом.

Для обработки антропометрических данных и расчета индексов ВОЗ разработана и распространяется бесплатно специальная компьютерная программа ANTHRO v.1.01, 1990 г. Программа автоматически учитывает возраст ребенка в месяцах. Практически при использовании программы необходима регистрация даты рождения и даты обследования ребенка.

Для группы или популяции детей может быть рассчитана и статистически оценена величина группового Z - score. Величина Z - score в стандартной популяции равна нулю. Чем больше величина Z - score в исследуемой популяции отличается от нуля, тем больше различия исследуемой группы детей от эталонной популяции. Величина группового Z - score может использоваться для сравнительного анализа детских контингентов и в системе мониторинга состояния здоровья.

Психологический диагноз (от греч. – «распознание») (ПД) – конечный результат деятельности психолога, направленный на выяснение сущности индивидуально-психологических особенностей личности с целью оценки их актуального состояния, прогноза дальнейшего развития и разработки рекомендаций, определяемых задачей психодиагностического обследования.

Предмет психологического диагноза (ПД) – установление индивидуально-психологических различий в норме и в патологии. Важнейшим элементом психологического диагноза является выяснение в каждом отдельном случае того, почему данные проявления обнаруживаются в поведении обследуемого, каковы их причины и следствия. По мере обогащения психологического знания этиологический элемент в ПД, вероятно, не будет иметь столь существенного значения, как в настоящее время, во всяком случае в текущей, практической работе. Сегодня, как правило, установив средствами психодиагностики те или иные индивидуально-психологические особенности, исследователь лишен возможности указать на их причины, место в структуре личности.

Такой уровень диагностики Л. С. Выготский назвал симптоматическим (или эмпирическим). Этот диагноз ограничивается констатацией определенных особенностей или симптомов, на основании которых непосредственно строятся практические выводы. Л. С. Выготский отмечает, что данный диагноз не является собственно научным, ибо установление симптомов никогда автоматически не приводит к диагнозу. Здесь работу психолога вполне можно заменить машинной обработкой данных.

Второй ступенью в развитии психологического диагноза является тиологический диагноз , учитывающий не только наличие определенных особенностей (симптомов), но и причины их возникновения.

Высший уровень – типологический диагноз , заключающийся в определении места и значения полученных данных в целостной, динамической картине личности. По словам Л. С. Выготского, диагноз всегда должен иметь в виду сложную структуру личности.

Диагноз неразрывно связан с прогнозом. По Л. С. Выготскому содержание прогноза и диагноза совпадает, но прогноз строится на умении настолько понять внутреннюю логику самодвижения процесса развития, что на основе прошлого и настоящего намечает путь развития. Рекомендуется разбивать прогноз на отдельные периоды и прибегать к длительным повторным наблюдениям. Развитие теории психологического диагноза в настоящее время является одной из наиболее важных задач психодиагностики.

1. Кодирование тестовых оценок

Кодирование тестовых оценок – элемент процедуры обработки данных психодиагностического обследования. Применяется в многопараметровых тестовых батареях , личностных опросниках, других методиках, предусматривающих представление результата в виде профильных оценок .

Кодирование тестовых оценок дает возможность более экономного и краткого описания совокупности шкальных оценок, профиля шкал, а также более четкой и быстрой разбивки материала на клинически (или характерологически) сходные группы. Кодирование тестовых оценок способствует выявлению в изучаемой группе наиболее общих характеристик и закономерностей. Формализация комплексных тестовых оценок является важным элементом создания банка данных и автоматизированной обработки данных обследования (см. компьютерная психодиагностика).

Примером кодирования тестовых оценок может служить процедура шифровки данных Миннесотского многоаспектного личностного опросника (MMPI). Код ММРI представляет собой обозначение профиля с последовательным перечислением шкал (начиная с самых высоких) с использованием их порядкового обозначения для шкал клинических и буквенного – для контрольных шкал. Существует несколько вариантов кодирования тестовых оценок профиля MMPI. Наиболее детальным является метод Г. Уэлша. Определение кода осуществляется в несколько этапов.

1. Все клинические шкалы перечисляются с использованием их цифрового обозначения слева направо в таком порядке, чтобы на первом месте находилась шкала, которая является в данном профиле ведущим пиком, а затем – остальные по мере снижения.

2. Обозначается высота шкал профиля в зависимости от выраженности результата в Т-баллах (табл. 13).

Таблица 13 Выражение результата по отдельным шкалам

Используя эти обозначения, можно отделить шкалы, расположенные в различных сигмах графика (сигмы разделяют на профиле десятки стандартных делений Т). Если между шкалами 2 и более сигм, то следует перечислить пропущенные сигмы. Например, если 2-я шкала находится выше 90 Т, а следующая 3-я – между 80 и 70, то следует записать 2"3" и т. д.

3. Шкалы, расположенные на одном уровне, записываются согласно порядковому номеру и подчеркиваются одной линией. Если разница показателей шкал в Т единицах не превышает 1 балла, то они также подчеркиваются, однако первой из них становится расположенная выше независимо от порядкового номера (21 – если 2-я имеет результат 68 Т, а 1-я – 67 Т).

4. Шкалы достоверности перечисляются начиная с наиболее высоко расположенной, между ними ставятся обозначения сигм.

Кроме описанного метода кодирования тестовых оценок, существует процедура, предложенная С. Хатуэем , при которой шкалы, расположенные между 46 и 54 Т, не записываются совсем, шкалы выше 70 Т отделяются знаком (С), а те, что расположены ниже 46 Т, – знаком (-). Контрольные шкалы (без шкалы «?») пишутся в порядке их расположения на графике в числовом выражении (в «сырых» баллах). При этом если результат по шкале превышает критические значения (см. контрольные шкалы), перед обозначением шкалы ставится косой крест, чтобы обратить внимание на недостоверность профиля.

Приведенные способы в соответствующей модификации могут быть перенесены на шифровку данных других методик, например тестов интеллекта. Приемы кодирования применимы в тех случаях, когда результаты отдельных субтестов выражаются в единых измерительных шкалах.

2. Шкальные оценки

Шкальные оценки – способ оценки результата теста путем установления его места на специальной шкале. Шкала содержит данные о внутригрупповых нормах выполнения данной методики в выборке стандартизации. Так, индивидуальные результаты выполнения заданий (первичные оценки испытуемых) сравниваются с данными в сопоставимой нормативной группе (например, результат, достигнутый учеником, сравнивается с показателями детей того же возраста или года обучения; результат исследования общих способностей взрослого сопоставляется со статистически обработанными показателями репрезентативной выборки лиц в заданных возрастных пределах).

Шкальные оценки в этом смысле имеют четко определенное количественное содержание и могут быть использованы при статистическом анализе. Одной из распространенных в психологической диагностике форм оценки результата теста путем соотнесения с групповыми данными является расчет процентилей .

Процентиль – процентная доля индивидов из выборки стандартизации, результат которых ниже данного первичного показателя. Шкалу процентилей можно рассматривать как совокупность ранговых градаций (см. ранговая корреляция) при числе рангов 100 и отсчете от 1-го ранга, соответствующего самому низкому результату; 50-й процентиль (PSQ) соответствует медиане (см. меры центральной тенденции) распределения результатов, Р ›50 и Р ‹50 соответственно представляют ранги результатов выше и ниже среднего уровня результата.

Процентили не следует смешивать с обычными процентными показателями. Последние представляют собой долю правильных решений из общего количества заданий теста в индивидуальном результате (см. первичные оценки). Ранги Р, и Р 100 получают соответственно самый низкий и самый высокий результаты из наблюдавшихся в выборке, однако этим рангам могут соответствовать и далеко не нулевой (ни одного правильного решения) или абсолютный (все решения правильны) показатели (например, при общем количестве 120 заданий минимальный результат, соответствующий первому рангу, может составить 6 правильных решений, в то время как максимальный результат, соответствующий рангу Р 100 , будет составлять 95 правильно решенных заданий). Такая ситуация наблюдается, например, при оценке тестов скорости.

Основной недостаток процентильных шкал состоит в неравномерности единиц измерения. При нормальном распределении отдельные переменные тесно группируются в центре распределения и по мере удаления к краям рассеиваются. Поэтому равным частотам случаев вблизи центра соответствуют более короткие интервалы по оси абсцисс, расположенные по краям распределения оценок. Процентили показывают относительное положение каждого испытуемого в нормальной выборке, но не величину различий между результатами. Это создает некоторые неудобства в интерпретации индивидуальных результатов. Так, разница в первичных показателях, соответствующая интервалу Р 70 -Р 80 , может составить 10 баллов, а различие в количестве правильных решений в интервале рангов Р 50 -Р 60 – лишь 1–3 балла.

Вместе с тем процентильные оценки обладают и рядом достоинств. Они легкодоступны пониманию пользователей психодиагностической информацией, универсальны по отношению к различным типам методик и легко рассчитываются.

Процентильные оценки не относятся к типичным шкальным показателям. Более широкое распространение в психодиагностике получили стандартные показатели , рассчитываемые на основе линейного и нелинейного преобразования первичных показателей, распределенных по нормальному или близкому к нормальному закону. При таком расчете проводится г-преобразование оценок (см. стандартизация, нормальное распределение). Чтобы определить 2-стандартный показатель, определяют разность между индивидуальным первичным результатом и средним значением для нормальной группы, а затем делят эту разность на а нормативной выборки. Полученная таким образом шкала z имеет среднюю точку М = 0, отрицательные значения обозначают результаты ниже среднего и убывают по мере удаления от нулевой точки; положительные значения обозначают, соответственно, результаты выше среднего. Единица измерения (масштаб) в шкале z равна 1а стандартного (единичного) нормального распределения.

Для преобразования полученного при стандартизации распределения первичных нормативных результатов в стандартную z-шкалу необходимо исследовать вопрос о характере эмпирического распределения и степени его согласованности с нормальным. Поскольку для большинства случаев значения показателей в распределении умещаются в пределах М ± 3?, единицы измерения простой z-шкалы слишком велики. Для удобства оценивания применяется еще одно преобразование типа z = (x – ‹x›) / ?. Примером такой шкалы могут быть оценки тестовой батареи SAT(СЕЕВ) методики для оценки способности к обучению (см. тесты достижений). Эта r-шкала пересчитана таким образом, что средней точке соответствует значение 500, а? = 100. Другим аналогичным примером является шкала Векслера для отдельных субтестов (см. шкала измерения интеллекта Векслера, где М = 10, ? = 3).

Наряду с определением места индивидуального результата в стандартном распределении групповых данных введение ШО направлено и на достижение другой важнейшей цели – обеспечение сопоставимости количественных результатов различных тестов, выраженных в стандартных шкалах, возможности их совместных интерпретаций, сведение оценок к единой системе.

В случае, если оба распределения оценок в сравниваемых методиках близки к нормальному, вопрос о сопоставимости оценок решается довольно просто (в любом нормальном распределении интервалам М ± n? соответствует одинаковая частота случаев). Для обеспечения сопоставимости результатов, принадлежащих к рас-пределениям другой формы, применяются нелинейные преобразования , позволяющие придать распределению форму заданной теоретической кривой. В качестве такой кривой обычно используется нормальное распределение. Как и 160–150 в простом г-преобразовании, нормализованным стандартным показателям можно придать любую желаемую форму. К примеру, умножив такой нормализованный стандартный показатель на 10 и прибавив константу 50, получаем Т-показатель (см. стандартизация, миннесотский многоаспектный личностный опросник).

Примером нелинейно преобразованной в стандартную шкалу является и шкала станайнов (от англ. standart nine – «стандартная девятка»), где оценки принимают значения от 1 до 9, М = 5, ?=2.

Шкала станайнов получает все большее распространение, сочетая в себе достоинства стандартных шкальных показателей и простоту процентилей. Первичные показатели легко преобразуются в станайны. Для этого испытуемых ранжируют по возрастанию результатов и из них образуют группы с числом лиц, пропорциональным определенным частотам оценок в нормальном распределении тестовых результатов (табл. 14).

Таблица 14 Перевод первичных тестовых результатов в шкалу станайнов

При трансформации оценок в шкалу стэнов (от англ. standart ten – «стандартная десятка») проводится аналогичная процедура с той лишь разницей, что в основании этой шкалы лежат десять стандартных интервалов. Пусть в выборке стандартизации 200 человек, тогда по 8 (4 %) испытуемых, имеющих самые низкие и самые высокие оценки, будут отнесены к 1 и 9 станайнам соответственно. Процедура продолжается до заполнения всех интервалов шкалы. Соответствующие процентным градациям баллы по тесту, таким образом, будут упорядочены в шкалу, соответствующую стандартным частотам распределения результата.

Одной из наиболее распространенных форм шкальных оценок в тестах интеллекта является стандартный IQ-показатель (М = = 100, ? = 16). Эти параметры для стандартной шкалы оценок в психодиагностике выбраны в качестве эталонных. Существует довольно много шкал, опирающихся на стандартизацию; их оценки легко сводимы друг к другу. Шкалирование, в принципе, допустимо и желательно для широкого круга методик, применяемых в диагностических и исследовательских целях, в том числе и для методик, результаты которых выражены в качественных показателях. В этом случае для стандартизации можно использовать перевод номинативных шкал в ранговые (см. шкалы измерительные) или разработать дифференцированную систему количественных первичных оценок.

Следует отметить, что при всей простоте, наглядности шкальные показатели являются статистическими характеристиками, позволяющими лишь указать на место данного результата в выборке из множества аналогичных по характеру измерений. Шкальный показатель даже для традиционного психометрического инструмента является лишь одной из форм выражения показателей теста, используемых при интерпретации результатов обследования. Количественный анализ при этом должен всегда проводиться в комплексе с многосторонним качественным изучением причин возникновения данного тестового результата с учетом как комплекса сведений о личности испытуемого, так и данных о текущих условиях обследования, надежности и валидности методики. Гипертрофированные представления о возможности обоснованных заключений лишь по количественным оценкам приводили к многим ошибочным представлениям в теории и практике психологической диагностики.

3. Заключение

Заключение – документ о результатах тестирования, подготовленный психологом. 3аключение должно строиться на всех доступных для исследователя данных. Стандартной формы и правил написания заключения не существует, оно видоизменяется в зависимости от цели, ситуации, в которой проводится тестирование, адресата, теоретических установок и специализации психолога. Основное в подготовке заключения – его соответствие потребностям, интересам и уровню квалификации заказчика.

Заключение должно быть ориентировано на действия, которые необходимо предпринять в связи с тем или иным психологическим диагнозом (рекомендации по программам обучения, типа лечения или коррекции, выбора профессии и т. п.). В заключении должны быть показатели заметно низкие или высокие, а не близкие к средним. Основное содержание – это интерпретация и выводы, в отдельных случаях могут прилагаться протоколы обследования. Утверждения психолога должны отражать степень надежности каждого из приводимых фактов или выводов. Следует избегать специальной терминологии. Заключение эффективно лишь в том случае, когда применимо только к данному обследуемому, а не к людям этого возраста, пола, образования, страдающим тем же заболеванием и т. д. При подготовке заключения обязательно следует руководствоваться этическими нормами психодиагностики.