ГоловнаПсихологіяВведення в професію «Психолог»
« Попередня Наступна »
Рита Л. Аткінсон, Річард С. Аткінсон, Едвард Е. Сміт, Деріл Дж. Бем, Сьюзен Нолен-Хоексема. Введення в психологію Частина 2, 2000 - перейти до змісту підручника

Оцінка індивідуальних відмінностей

У багатьох промислово-розвинених країнах широко використовується об'єктивна оцінка індивідуальних відмінностей, особливо відмінностей в когнітивних та інтелектуальних здібностях. У початкових школах дітей часто розподіляють по класах залежно від досягнутого ними успіху при проходженні тестів. Тести на обдарованість чи здібності є частиною процедури надходження в багато коледжі та більшість професійних та вищих навчальних закладів. Крім того, багато промислових та урядові агентства підбирають кадри, призначають і просувають співробітників по службі на основі даних тестування.

Тести для оцінки інтересів, схильностей і особистих якостей також знайомі більшості з нас. Допомагаючи учням вибрати професію, консультанти зможуть запропонувати кращий вибір, якщо їм щось відомо про учня крім його академічної успішності. Відбираючи кандидатів на високі пости, наймачі часто хочуть знати їх стиль спілкування, здатність справлятися зі стресом і т. д. Яке лікування буде найбільш успішним для людини з емоційними порушеннями, або як допомогти реабілітації звільненого кримінальника - для всього цього потрібна об'єктивна оцінка індивідуальних відмінностей. Крім практичних застосувань, ці методи оцінки істотні для теорії і досліджень індивідуальних відмінностей. Дійсно, деякі вчені, які вивчають особистість (див. гл. 13), розробили методи оцінки, що відповідають особливостям їх підходів.Характеристики хорошого тесту?Оскільки тести та інші засоби аналізу відіграють важливу практичну та наукову роль, необхідно, щоб вони точно вимірювали то, для чого призначені, а саме вони повинні володіти надійністю і валідність.

Тести також повинні бути стандартизовані; під цим розуміється, що умови проходження тесту повинні бути однаковими для всіх тестованих. Наприклад, інструкції, супроводжуючі тест, повинні бути однаковими для всіх тестованих осіб.

Надійність. Якщо тест або метод оцінки надійний, він повинен давати відтворювані і узгоджені результати. Якщо тест дає різні результати при застосуванні його в різних випадках або при виконанні підрахунків різними людьми, значить, він ненадійний. Проста аналогія - гумова лінійка. Якщо невідомо, наскільки вона розтягується при кожному вимірі, то результати будуть ненадійні, незалежно від того, наскільки акуратно проводилося кожне вимір.

Як правило, надійність оцінюється шляхом співвіднесення двох груп показників. Наприклад, один і той же тест можна дати тій же групі випробовуваних двічі. Якщо тест надійний, то показники випробовуваних в першому випадку повинні високо корелювати з показниками у другому. Якщо це так, то говорять, що цей тест має повторюваною надійністю або тимчасової стабільністю.

Звичайно, в реальній практиці мало хто захоче давати один і той же тест тим же людям двічі. Але є багато ситуацій, коли виникає бажання провести аналогічні види того ж тіста - наприклад, коли учні випускного класу середньої школи, мають намір вступити до коледжу, хочуть двічі пройти Тест шкільної успішності (Тест Академічних Здібностей) (Scholastic Assessment Test, SAT). Щоб переконатися, що дві форми того ж тіста дають еквівалентні показники, обидві вони пропонуються тієї ж групи людей і потім зіставляються. Якщо отримана висока кореляція між ними, то говорять, що цей тест володіє надійністю при зміні форми. Деякі з питань, що входять до SAT, насправді не пов'язані з показниками учня, але вони оцінюються статистично, щоб їх можна було використовувати в майбутньому в аналогічних формах цього ж тіста.

Інший загальною мірою надійності є внутрішня узгодженість тесту - то, якою мірою різні його питання або пункти вимірюють одне і те ж. Це можна оцінити шляхом обчислення кореляції між показниками, отриманими групою індивідів по кожному пункту і всьому тесту в цілому. Всякий пункт, не корелює із загальним показником, є ненадійним; він не вносить вклад в вимірюваний тестом параметр. Відкидання ненадійних пунктів «очищає» тест, підвищуючи його внутрішню узгодженість. Із збільшенням числа надійних елементів в тесті зростає і надійність загального показника тесту.

Результати більшості тестів і аналізів обробляються об'єктивно, найчастіше комп'ютером. Але іноді потрібно оцінити розумову діяльність або соціальну поведінку суб'єктивно. Знайомий приклад цьому - екзаменаційні випробування. Щоб оцінити надійність таких суб'єктивних суджень, за допомогою незалежних суддів отримують дві або більше груп даних, які зіставляються один з одним. Наприклад, два спостерігача можуть незалежно оцінювати групу дитсадкових дітей на агресію; або двох або більше суддів можуть попросити прочитати минулі інавгураційні звернення президента і оцінити їх з точки зору оптимістичність або кількості негативних посилань на Ірак. Якщо кореляція між оцінками суддів висока, то говорять, що даний метод має межекспертним згодою або межоценочной надійністю.

Взагалі, добре побудований, об'єктивно оброблений тест здатності повинен забезпечувати надійність не менше 0,90. Для тестів особистості і суб'єктивних суджень, застосовуваних в дослідницьких цілях, прийнятним іноді може бути коефіцієнт 0,70, але при цьому укладення про конкретну людину слід робити з великою обережністю. Як зазначалося вище, надійність загального показника тесту зростає з ростом числа надійних пунктів тесту. Це ж міркування можна застосувати до суб'єктивними оцінками і підвищити надійність методу, додавши більше суддів, оцінювачів або спостерігачів. Наприклад, якщо кореляція оцінок двох спостерігачів становить тільки 0,50, то дослідник може додати третій аналогічного спостерігача і тим самим підвищити межоценочную надійність їх сумарних оцінок до 0,75; з додаванням четвертого оцінювача надійність зросте до 0,80.

Валідність. Надійність показує, наскільки тест здатний вимірювати щось, але висока надійність не гарантує, що цей тест вимірює саме те, що потрібно; вона не гарантує валідності (адекватності) тесту. Наприклад, якщо в останньому іспиті вашого курсу психології зустрічається надто багато важких слів або хитромудрі питань, то він може виявитися тестом ваших вербальних здібностей або вашої витонченості, а не засвоєння матеріалу курсу. Такий іспит може бути надійним: при повторному проходженні учні отримають ті ж оцінки і окремі компоненти іспиту вимірюватимуть одне і те ж, - але це не буде валідним тестом досягнень в даному курсі.

Іноді валідність тесту можна оцінити, порівнявши показник тесту з деяким зовнішнім критерієм. Така кореляція називається коефіцієнтом валідності. Наприклад, відносно сильна позитивна кореляція між показниками в SAT та успіхами першокурсника в коледжі показує, що у цього тесту прийнятна валідність. Валідність такого роду називається критеріальною, або емпіричної, валидностью. Враховуючи чутливість тестів до расових і статевих відмінностей, суди все частіше вимагають від компаній та урядових агентств, які застосовують тести для відбору персоналу, щоб ці тести корелювали з показниками роботи людини, тобто щоб вони володіли критеріальною, або емпіричної, валидностью.

Валідність особливого роду, що відноситься особливо до тестів, що застосовуються у дослідженнях особистості, називається конструктивної валидностью. Якщо дослідник створює тест для вимірювання деякого поняття чи концепції, що є частиною теорії, не завжди можна обчислити єдиний коефіцієнт, який показував би його критеріальну валідність, оскільки невідомий зовнішній критерій. Наприклад, як досліднику оцінити валідність тесту на мотивацію до досягнення успіху? Тут може бути кілька можливостей. Можна дати цей тест відповідальним виконавцям фірм і подивитися, корелює він з їх зарплатою. Можливо, цей тест буде корелювати з оцінкою вчителями честолюбства своїх учнів. Проблема в тому, що немає єдиного критерію, який дослідник готовий був би прийняти за остаточний «істинний» відповідь. Якщо тест корелював із зарплатою відповідальних виконавців, це виглядало б переконливим, але якщо ні, дослідник не був би схильний оцінити цей тест як невалідний. У психології особистості це відомо як проблема критерію: не існує заходи «істини», що дозволяє визнати тест валідним. Відповідно, дослідник замість цього намагається встановити його конструктивну валідність.

Це здійснюється в самому процесі дослідження. Вчений використовує свою теорію і для побудови тесту, і для прогнозування випливають з неї наслідків. Потім проводяться дослідження з використанням цього тесту, щоб перевірити прогноз. У тій мірі, в якій результати декількох Конвергіруют досліджень підтверджують передбачення теорії, і ця теорія, і сам тест одночасно набуває валідність. Найчастіше виявляється, що змішані результати вказують на те, в якому напрямку повинні бути модифіковані та теорія і тест.

Зокрема, Мак-Клелланд (McClelland, 1987) запропонував теорію мотивації до досягнень, яка, за його задумом, повинна була виявляти честолюбних високорезультативних індивідуумів в будь-якій сфері діяльності і пояснювати їх високу мотивацію. Для перевірки цих теоретичних припущень був розроблений тест, що оцінює рівень мотивації до досягнень. Результати декількох досліджень показують, що передбачення, відповідно до даної теорії, підтверджуються для чоловіків, що займаються підприємницькою діяльністю, але не для жінок або індивідуумів, що займаються іншими видами діяльності, наприклад науковими дослідженнями. Відповідно, теорія була модифікована для використання переважно по відношенню до досягнень у галузі підприємництва, а тест був модифікований таким чином, щоб він був більш валідним і для жінок.Оцінка інтелектуальних здібностейПершу спробу створити тести інтелектуальних здібностей зробив сер Френсіс Гальтон століття тому. У натураліста й математика Гальтона інтерес до індивідуальних відмінностей виник під впливом еволюційної теорії його двоюрідного брата Чарльза Дарвіна. Гальтон думав, що деякі сім'ї володіють біологічним перевагою - вони сильніше і розумніше інших. Інтелект, міркував він, це питання виключно сенсорних і перцептивних навичок, що передаються від одного покоління до наступного. Оскільки вся інформація здобувається за допомогою органів почуттів, то чим дошкульніше і точніше перцептивний апарат індивіда, тим він розумніший.

Віра Гальтона в наследуемость інтелекту привела його до припущення, що розумові здібності людства можна підвищити за допомогою євгеніки, або селективного виробництва потомства. На щастя, він більш відомий завдяки застосуванню статистики в дослідженнях інтелекту, ніж проповідування євгеніки.

У 1884 році Гальтон застосував набір тестів (для вимірювання таких змінних, як розмір черепної коробки, час реакції, гострота зору, слуховий поріг і пам'ять на зорові форми) для обстеження більше 9000 відвідувачів Лондонській виставки. До свого розчарування, він виявив, що видатні британські вчені не відрізняються від звичайних громадян розміром черепа і що такі показники, як швидкість реакції, не особливо пов'язані з іншими заходами інтелекту. Хоча його тест виявився не дуже вдалим, Гальтон все ж винайшов коефіцієнт кореляції, який, як ми вже бачили, грає важливу роль в психології.

Перші тести, що наближаються до сучасних тестів інтелекту, розробив французький психолог Альфред Біне. У 1881 році французький уряд затвердив закон, за яким відвідування школи стало обов'язковим для всіх дітей. Раніше ті, хто не справлявся з навчанням, залишалися вдома; тепер вчителям довелося справлятися з широким діапазоном індивідуальних відмінностей. Щоб отримати користь з прийнятої шкільної програми, уряд попросив Біне створити тест, що дозволяє виявляти дітей, які занадто повільно розуміли.

Біне припустив, що інтелект слід вимірювати за допомогою завдань, що вимагають міркування і здібностей до вирішення завдань, а не перцептивно-моторних навичок. У співпраці з іншим французьким психологом Теофілом Симоном в 1905 році Біне опублікував шкалу, яку він переглянув в 1908 році і ще раз в 1911-му.

Біне міркував, що повільно міркує або тупі діти схожі на нормальних дітей із затримкою розумового розвитку. Повільно розуміє дитина повинна справлятися з тестами аналогічно нормальній дитині меншого віку, тоді як розумові здібності обдарованої дитини будуть відповідати більш старшого віку. Біне розробив шкалу тестів, що включає компоненти зростаючій складності і дозволяє вимірювати такі зміни в інтелекті, що звичайно зв'язуються зі збільшенням віку. Чим вище за шкалою піднімається дитина, правильно відповідаючи на питання тесту, тим вище його розумовий вік (УВ). Поняття розумового віку було головним у методі Біне; за допомогою цього методу можна було порівнювати УВ дитини з її хронологічним віком (ХВ), що визначаються за датою народження.

Шкала інтелекту Стенфорд-Біне. Льюїс Терман зі Стенфордського університету адаптував пункти тесту, запропоновані спочатку Біне, для американських школярів. Він стандартизував застосування тесту і розробив вікові норми, пред'являючи цей тест тисячам дітей. У 1916 році він опублікував Стенфордську версію тестів Біне, відому тепер як шкала інтелекту Стенфорд-Біне (Stanford-Binet Intelligence Scale); вона переглядалася в 1937, 1960, 1972 і останній раз - в 1986 році. Незважаючи на свій вік, тест Стенфорд-Біне - один з найбільш часто вживаних.

Терман зберіг поняття розумового віку, запропоноване Біне. Кожен пункт тесту був нормований але вікам, тобто він відповідав віку, при якому його проходить істотна більшість дітей. Розумовий вік дитини визначається шляхом підсумовування кількості пунктів, пройдених на кожному віковому рівні. Крім того, Терман прийняв зручний індекс інтелекту, запропонований німецьким психологом Вільямом Штерном. Цей індекс називається коефіцієнтом інтелекту, широко відомим як IQ (Intelligence Quotient). Він висловлює інтелект як відношення розумового віку (УВ) до хронологічного (ХВ):  Число 100 використовується як множник, так що коли УВ дорівнює ХВ, IQ буде дорівнює 100. Якщо УВ менше ХВ, IQ буде менше 100; якщо УВ більше ХВ, то IQ буде більше 100.

  В останній версії тесту Стенфорд-Біне замість показника IQ використовуються оцінки вікових стандартів. Їх можна виражати в перцентиль, що показують, скільки відсотків випробовуваних в стандартизовані групі потрапляють вище або нижче даного показника (Thorndike, Hage & Satter, 1986). І хоча концепція IQ все ще використовується в тестуванні інтелекту, останній вже не обчислюється за наведеною формулою. Замість цього використовуються таблиці переведення вихідних показників тесту в стандартні показники, які підібрані так, що в кожному віці середній показник дорівнює 100.

  Згідно з сучасним поглядом на інтелект як складається з різних здібностей, у версії 1986 всі завдання Тесту Стенфорд-Біне розбиті на 4 великі групи відповідно до областями інтелекту: вербальне мислення, абстрактне / візуальне мислення, кількісне мислення і короткочасна пам'ять (Scatter, 1988). Для кожної групи існує окремий показник; в табл. 12.2 наведені деякі приклади пунктів тесту, згруповані по областях.  Таблиця 12.2.

 Пункти тесту Стенфорд-Біне  Типові приклади пунктів шкали інтелекту Стенфорд-Біне для віку 6-8 років версії 1986 року.  <Рис. Тестові матеріали до шкалою інтелекту Стенфорд-Біне зразка 1986 року.>

  Шкали інтелекту по Векслеру. У 1939 році Девід Векслер розробив новий тест, оскільки вважав, що тест Стенфорд-Біне занадто залежить від мовних здібностей і, крім того, не годиться для дорослих. Векслеровская шкала інтелекту дорослих (Wechsler Adult Intelligence Scale, WAIS) (1939, 1955, 1981) складається з двох частин - вербальної шкали і шкали досягнень, за якими виходять роздільні показники, а також інтегральний показник IQ. Пункти тесту описані в табл. 12.3. Пізніше Векслер розробив аналогічний тест для дітей, Векслеровскую шкалу інтелекту для дітей (Wechsler Intelligence Scale for Children, WISC) (1958, 1974, 1991).  Таблиця 12.3.

 Пункти Векслеровской шкали інтелекту дорослих

 (WAIS)  Тести Векслеровской шкали інтелекту для дітей (WISC) аналогічні, з деякими змінами.  Пункти, що відносяться до шкали досягнень, вимагають маніпуляцій з кубиками, картинками та іншими матеріалами. Векслеровская шкала дозволяє також обчислювати показник по кожному з субтестів, так щоб екзаменатор мав більш ясну картину інтелектуальних сил і слабкостей індивіда. Наприклад, розбіжність показників для вербального тесту і тесту досягнень підказує екзаменатору звернутися до конкретних проблем навчання, таким як труднощі з читанням або порушення мови.

  Шкала Стенфорд-Біне і шкала Векслера дають хорошу надійність і валідність. Їх повторювана надійність становить близько 0,90, і обидві вони володіють достатньою валидностью в прогнозуванні шкільних успіхів з коефіцієнтом валідності близько 0,50 (Sattler, 1988).

  Групові тести здібностей. Шкали Стенфорд-Біне і Векслера є тестами індивідуальних здібностей; тобто вони застосовуються спеціально підготовленим екзаменатором до окремого індивіда. Групові тести здібностей, навпаки, застосовуються одним екзаменатором до великого числа людей і зазвичай у вигляді бланків, заповнюваних за допомогою ручки.

  Тест шкільної успішності (Тест Академічних Здібностей) (SAT) і Американський тест для коледжів (American College Test, ACT) - це приклади групових тестів загальних здібностей, і вони знайомі більшості студентів коледжів у США. Практично у всіх коледжах з 4-річним навчанням від абітурієнтів вимагають пройти один з таких тестів; це робиться для того, щоб встановити загальний стандарт для учнів середніх шкіл з різними програмами і випускними оцінками. SAT піддався серйозному перегляду в 1994 році, і крім інших змін, тепер у ньому є новий розділ і математичні питання відкритого типу (а не тільки з вибором з можливих варіантів, як раніше). Ці зміни, як і деякі з нещодавніх змін, внесених до ACT, стали реакцією на нові напрями в шкільних програмах, що віддають перевагу більш складним навичкам читання, письма та математичного мислення.

  Кореляція між показниками SAT і середніми відмітками першокурсників варіюється в різних дослідженнях, причому середня величина складає 0,38 для вербального розділу SAT і 0,34 для математичного розділу (Linn, 1982). Коли ці кореляції коригуються з урахуванням того, що багато учнів з дуже низькими показниками, які не зараховуються до коледжу (і значить, їх не можна включати в підрахунок валидной кореляції), в результаті виходять кореляції в діапазоні 0,50. Це означає, що 44% учнів з верхньої п'ятої частини розподілу показників SAT потраплять також і у верхню п'яту частину розподілу середніх позначок першокурсників, порівняно всього з 4% учнів, що потрапляють у нижню п'яту частину розподілу показників в SAT. Таким чином, показники SAT значно покращують прогнозованість, але ясно також і те, що відмітки першокурсників, що мали ідентичні показники в SAT, сильно відрізняються.

  <Рис. Оцінки Тecmy шкільної навченості (Scholastic Aptitude Test, SAT) використовуються для передбачення академічної успішності в коледжі. Кореляція між оцінками SAT і середніми відмітками учнів молодших курсів складає близько 0,50.>

  Факторний підхід. Деякі психологи вважають, що інтелект є деяка загальна здатність розуміння і мислення, що проявляє себе в різних формах. Так вважав і Біне. Хоча в його тесті були найрізноманітніші розділи, він зауважив, що обдаровані діти перевершують тупих за всіма показниками. Тому він припустив, що різні завдання дозволяють отримати вибірки показників для узагальненої базової здібності. Подібним чином, незважаючи на те що Векслер склав свою шкалу з різних подшкал, він також вважав, що «інтелект є сукупної або глобальної здатністю індивіда діяти цілеспрямовано, мислити раціонально і ефективно справлятися зі своїм оточенням» (Wechsler, 1958).

  Інші психологи, однак, сумніваються в існуванні «загального інтелекту». Вони вважають, що тести на інтелект вимірюють ряд розумових здібностей, відносно незалежних один від одного. Одним з методів отримання більш точної інформації про здібності, що визначають успішність виконання тесту на інтелект, є факторний аналіз. Цей математичний метод використовується для визначення мінімальної кількості факторів, чи здібностей, що лежать в основі патерну кореляцій, отриманих для деякого масиву різних тестів. Основна ідея полягає в тому, що два тести, які дуже сильно корелюють один з одним, можливо, вимірюють одну і ту ж здатність. Факторний аналіз даних, отриманих за допомогою набору тестів, показує, скільки в наявному наборі кореляцій є помітних факторів, а також вагу або вплив кожного з них.

  Творець факторного аналізу Чарльз Спірман (Spearman, 1904) першим припустив, що всі індивіди володіють різними факторами загального інтелекту (g). Людину можна охарактеризувати як загалом талановитий чи тупого залежно від того, яким g він володіє. Згідно Спірману, фактор g - основна детермінанта успішності виконання пунктів тесту на інтелект. Крім цього, для окремих здібностей чи тестів специфічні особливі фактори, звані s. Наприклад, арифметичні тести або тести на просторові відносини будуть кожен мати свій s. Виміряний у індивіда інтелект буде відображати величину g плюс величину різних s-факторів. Успіхи індивіда в математиці визначатимуться його загальним інтелектом плюс математичними здібностями.

  Пізніше Луїс Терстоун (Thurstone, 1938) заперечував проти ідеї Спірмана про загальний інтелекті, вважаючи, що за допомогою факторного аналізу його можна розділити на ряд первинних здібностей. Після багаторазових застосувань тестів, факторного аналізу даних, очищення шкал і повторного тестування Терстоун виділив 7 факторів, з яких він склав свій тест первинних розумових здібностей (Test of Primary Mental Abilities).

  Переглянуті варіанти цього тесту все ще широко використовуються, але його прогнозованість не вище, ніж у тестів загального інтелекту, таких як шкали Векслера. Терстоун сподівався шляхом факторного аналізу відкрити першоелементи інтелекту, але ця надія реалізувати не повністю з кількох причин. Обчислені їм первинні здібності не є абсолютно незалежними; дійсно, значні взаімокорреляціі між ними говорять на користь концепції фактора загального інтелекту, що лежить в основі окремих здібностей. Крім того, ряд первинних здібностей, виділених шляхом факторного аналізу, залежить від характеру самих пунктів тесту. Інші дослідники, використовуючи різні за змістом пункти тестів і інші методи факторного аналізу, виділяли від 20 до 150 чинників, що відбивають діапазон інтелектуальних здібностей (Guilford, 1982; Ekstrom, French & Harman, 1979; Ekstrom et al, 1976).

  Це відсутність згоди в кількості і характері факторів викликає сумніву в цінності факторного підходу. Проте факторний аналіз продовжує залишатися основним методом вивчення інтелектуальної діяльності (Comrey & Lee, 1992; Carrol, 1988), і ми зустрінемося з ним знову при обговоренні рис особистості.  Оцінка особистості  Особистість можна визначити як відмітний і характерний патерн мислення, емоцій і поведінки, що формує особистий стиль взаємодії індивіда з його фізичним і соціальним оточенням. Коли у повсякденному житті нас просять описати чиюсь особистість, ми схильні користуватися термінами, що описують риси особистості, - такими прикметниками, як розумний, екстравертівний, сумлінну і т. д. Фахівці з психології особистості з давніх часів намагалися розробити формальні методи опису та вимірювання особистості, систематизуючи способи опису нами особистісних рис, використовувані в повсякденному житті. Зокрема, вони намагаються вийти за межі життєвих понять про риси особистості трьома шляхами. По-перше, вони прагнуть скоротити потенційний набір термінів, що позначають межі, до розумного невеликого набору, який охоплював би все розмаїття людської особистості. По-друге, вони намагаються переконатися, що їхні методи вимірювання характеристик особистості надійні і валидни. Нарешті, по-третє, вони проводять емпіричні дослідження, щоб розкрити зв'язки між різними рисами особистості, а також між особистісними характеристиками і конкретними видами поведінки.

  Щоб скласти вичерпний, але розумний перелік особистісних якостей, можна заглянути в словник. Адже в процесі своєї еволюції мову кодує більшість, якщо не всі важливі відмінності між індивідами, що мають значення у повсякденному житті. Мова втілює досвід, накопичений культурою, і повний словник є письмовим відображенням цього досвіду. У 30-х роках два фахівця з психології особистості дійсно зробили таку спробу і пройшлися по повному словником. Вони відшукали приблизно 18 000 слів, що позначають особливості поведінки, - майже 5% англійської лексики. Потім вони скоротили цей список до приблизно 4500 термінів, відкинувши неясні слова і синоніми. Нарешті, вони розділили цей список на психологічно значущі підмножини (Allport & Odbert, 1936).

  У подальшому вчені використовували ці терміни для отримання особистісних оцінок індивіда. Однолітків, які добре знають індивіда, просили оцінити його за певною ознакою методом шкалювання. Оцінює могли попросити, наприклад, оцінити людину за ознакою дружності, використовуючи 7-бальну шкалу в діапазоні від «зовсім не дружній» до «дуже дружній». Часто такі шкали позначалися двома точками, які дають зрозуміти протилежні риси, наприклад «владний-покірний» або «добросовісний-ненадійний». Індивідів могли також просити оцінити за цими шкалами самих себе.

  Наприклад, Реймонд Кеттел (Cattel, 1966, 1957) спочатку скоротив список Оллпорта-Одберта до менш ніж 200 термінів і потім отримав оцінки однолітків і самооцінки. Після цього він застосував метод факторного аналізу, описаний нами вище, щоб визначити, скільки особистісних факторів дозволяють описати отриману картину кореляцій між оцінками. Його аналіз дав 16 факторів. Подібну процедуру використовував британський психолог Ханс Айзенк, що взяв два особистісних фактора: інтроверсію-екстраверсію (параметр, вперше введений психоаналітиком Карлом Юнгом) і емоційну стійкість-нестійкість, яку він назвав невротизмом (Eysenck, 1953). (Айзенк запропонував також третій параметр, але він не настільки прийнятий і досліджений, як інші два [Eysenck & Eysenck, 1976]). Інтроверсія-екстраверсія означає те, наскільки людина в основному орієнтований всередину, на самого себе, або - назовні, на зовнішній світ. На інтроверсівном полюсі цієї шкали знаходяться індивіди, які сором'язливі й краще працювати поодинці; вони схильні йти в себе, особливо під час емоційного стресу або конфлікту. На екстраверсівном полюсі знаходяться індивіди, які товариські і воліють рід занять, що дозволяє їм безпосередньо працювати з іншими людьми; під час стресу вони шукають компанію. Невротизм (стійкість-нестійкість) - це параметр емоційності, на невротичний, або нестійкому, полюсі якого знаходяться індивіди похмурі, тривожні, темпераментні і погано пристосовані, а на іншому, стабільному, полюсі - спокійні, добре пристосовані індивіди. На рис. 12.1 показано, як з цих двох параметрів утворюється ряд подпрізнаков, пов'язаних з цими факторами.

  Рис. 12.1.

 Особистісні фактори, за Айзенком

 . На малюнку показані два основних фактори, виявлених Айзенком та іншими в дослідженнях взаімокорреляціі особистісних рис шляхом факторного аналізу. Вісь «стійкий-нестійкий» відображає фактор невротизма; вісь «інтроверт-екстраверт» відображає фактор екстраверсії. Інші розташовані по колу терміни показують ставлення інших особистісних якостей до цих двох чинників (по: Eysenck & Rachman, 1965).  Скільки ж існує основних факторів особистості? Навіть така сувора процедура, як факторний аналіз, не дає певної відповіді. Так, Кеттел нарахував їх 16, а Айзенк - 2 (або 3). У інших дослідників ці цифри відрізняються ще більше. З аналогічною ситуацією ми вже зустрічалися раніше, коли відзначали, що число чинників, що визначають поняття інтелекту, може бути 1 (g - загальний фактор інтелекту у Спірмана), 7 (первинні розумові здібності у Терстоуна) або цілих 150 (Guilford, 1982).

  Розбіжності частково виникають через те, що в аналізі закладається різна кількість особистісних рис; частково тому, що аналізуються різні типи даних (наприклад оцінки однолітків і самооцінки), а частково - через застосування різних методів факторного аналізу. Але значна частина цих розбіжностей - з області смаку. Дослідник, що віддає перевагу більш диференційоване або докладний опис особистості, встановлює для фактора більш низький критерій і таким чином отримує більше факторів, стверджуючи, що якщо збільшити число змішуються факторів, то загубляться важливі відмінності. Інші дослідники, подібно Айзенку, воліють змішувати кілька факторів нижнього рівня і брати більш загальні, стверджуючи, що результуючі фактори вийдуть більш стабільними (з більшою ймовірністю знову виникнуть в іншому аналізі). Наприклад, коли 16 факторів Кеттела самі піддаються факторному аналізу, два фактори Айзенка з'являються як сверхфактори. Можна сказати, що це ієрархія особистісних рис, в якій кожна широка і загальна риса складається з декількох підлеглих, більш вузьких рис.

  Незважаючи на ці розбіжності, багато дослідників приходять зараз до того, що 5 особистісних характеристик можуть стати найкращим компромісом (John, 1990). Хоча ці 5 факторів, званих тепер «великою п'ятіркою», спочатку складалися в списку Оллпорта-Одберта, отриманому шляхом факторного аналізу (Norman, 1963), вони ж тепер з'являються в найрізноманітніших тестах особистості (McCrae & Costa, 1987; Digman & Inouye, 1986). Усе ще немає згоди в тому, як найкраще називати і інтерпретувати ці фактори, однак представляється можливим об'єднати їх абревіатурою «OCEAN» (OCEAN: Openness to experience, Conscientiousness, Extraversion, Agreableness, and Neurotizm; відкритість досвіду, сумлінність, екстравертність, поступливість і невротизм.) У табл. 12.4 наведені деякі приклади шкал для вимірювання особистісних якостей, які характеризують кожну з цих п'яти чинників. Багато фахівців з психології особистості визнають відкриття і підтвердження валідності «великої п'ятірки» чинників одним з найголовніших досягнень сучасної психології особистості.  Таблиця 12.4.

 П'ять особистісних факторів

  У таблиці наведено 5 особистісних факторів, надійно з'являються при факторному аналізі даних, одержуваних при найрізноманітніших методах оцінки. Пари прикметників служать прикладами шкал, що характеризують кожен фактор (по: McCrae & Costa, 1987).  Особистісні опитувальники. У більшості особистісних тестів індивіда насправді не просять безпосередньо оцінювати себе за особистісним параметрами. Замість цього йому задають ряд питань про те, як він реагує на ті чи інші ситуації. Його, наприклад, можуть попросити вказати, наскільки він згоден або не згоден з твердженням: «Я часто пробую нову і імпортну їжу» або: «Мені дійсно подобається більшість людей, яких я зустрічаю». Такі опитувальники - їх називають особистісними опитувальниками - схожі на структуровані інтерв'ю тим, що в них кожній людині ставлять одні і ті ж питання, а відповіді зазвичай даються у вигляді, зручному для обчислень, часто з обробкою на комп'ютері. Кожен пункт особистісного опитувальника складений так, щоб бути прикладом певної риси особистості, а підмножини показників для близьких за змістом пунктів підсумовуються для отримання оцінки по кожному шкаліруемому ознакою. Наприклад, пункт «Я часто пробую нову і імпортну їжу» відноситься до шкали «Відкритість досвіду», яка входить в один з опитувальників, розроблених для вимірювання «великої п'ятірки»; пункт «Мені дійсно подобається більшість людей, яких я зустрічаю» відноситься до шкали «Екстравертність».

  Пункти більшості особистісних опитувальників спочатку складаються згідно з теоретичними поглядами розробника на кожну рису особистості, а потім в остаточному опитувальнику їх залишають або відкидають залежно від того, корелюють вони чи не корелюють з іншими пунктами для тієї ж шкали. Часто в попередній варіант опитувальника, що направляється багатьом людям, поміщають безліч пробних пунктів. Потім відповіді індивідів піддають факторному аналізу з тим, щоб визначити, які підмножини пунктів взаімокорреліруют і чи дійсно ці підмножини відносяться до тієї шкалою, для якої вони були спочатку розроблені.

  Зовсім інший метод побудови тестів, званий методом прив'язки до критерію, був використаний в розробці найбільш популярного з усіх опитувальників особистості - Миннесотского багатопрофільного опитувальника особистості (Minnesota Multiphasic Personality Inventory, MMPI). Спочатку тест MMPI розроблявся як варіант психіатричного інтерв'ю бланкового тина (Hathaway & McKinley, 1943). Він містить понад 550 тверджень, що стосуються схильностей, емоційних реакцій, фізичних і психічних симптомів і переживань. На кожне твердження випробовуваний відповідає «вірно», «невірно» або «не знаю».

  Ось 4 типових пункту:

  - Я ніколи не робив чогось небезпечного для того, щоб прийти від цього в хвилювання.

  - Я рідко мрію.

  - Мої батько і мати часто змушували мене підкорятися, навіть коли я вважав це необгрунтованим.

  - Часом мої думки пробігають швидше, ніж я встигаю проговорити їх.

  Замість формулювання пунктів на основі теоретичних міркувань розробники MMPI дали групам індивідів сотні тестових пунктів, подібних цим. Про кожній групі було відомо, що вона відрізняється від норми за певним критерієм. Наприклад, щоб розробити шкалу, що дозволяє відрізняти нормальних індивідів від параноїдних, одні й ті ж питання були дані двох груп. Психіатрична група складалася з індивідів, госпіталізованих з діагнозом параної; в контрольну групу входили люди, подібні з людьми психіатричної групи за віком, статтю, соціоекономічні положенню і іншим важливим змінним, але у яких ніколи не було діагнозу психічного розладу. В остаточний опитувальник увійшли тільки ті питання, які дозволили відрізнити психіатричну групу від контрольної. Питання, які, здавалося б, за своєю суттю служать відмінності нормальних індивідів від параноїдних (наприклад: «Я думаю, що більшість людей збрешуть, щоб отримати перевагу»), можуть такими і не бути при включенні їх в емпіричний тест. Насправді пацієнти з діагнозом параної значно рідше відповідають на це питання ствердно, ніж нормальні індивіди. При остаточному тестуванні відповіді на кожен пункт оцінюються по їх відповідності відповідям, даними в групах з іншим критерієм.

  Крім змістовних шкал, в MMPI вперше були включені кілька шкал валідності. Ці шкали призначені для того, щоб визначати, чи чесно і чи уважно людина відповідала на затвердження тесту. Якщо показник індивіда по будь-якій з шкал валідності занадто високий, значить, його показники по змістовним шкалами слід інтерпретувати з особливою обережністю або ігнорувати зовсім. Ці шкали виявилися корисними, але не цілком успішними при виявленні невалідний показників. У табл. 12.5 наведено 3 шкали валідності та 10 змістовних шкал, показники по яких звичайно враховуються в MMPI.  Таблиця 12.5.

 Шкали MMPI

  Перша трійка - шкали валідності, що допомагають визначити, чи відповідав людина на затвердження тесту уважно і чесно. Наприклад, шкала Ч (частота) вимірює ступінь, з якою даються рідко зустрічаються або нетипові відповіді. Високий показник по цій шкалі зазвичай говорить про те, що індивід був недбалий або плутався у відповідях. (Однак високий показник по Ч часто супроводжує високий показник за шкалою шизофренії, що вимірює дивацтва мислення.) Решта «клінічні» шкали спочатку називалися по класах психічних захворювань, але тепер при їх інтерпретації акцент робиться на особливостях особистості, а не на діагностичних поняттях.  Оскільки висновки з MMPI робилися на основі відмінностей між критеріальною [Критеріальна група тестованих відрізняється від контрольної за деяким критерієм (наприклад, захворювання на шизофренію). - Прим. перев.] і контрольною групами, насправді неважливо, чи є правдою те, що відповідає випробуваний. Важливо те, що він говорить це. Якщо на затвердження «Моя мати ніколи мене не любила» шизофреніки відповідають: «вірно», а контрольні випробовувані відповідають: «хибно», то їхні відповіді служать ознакою відмінності цих груп, незалежно від того, як насправді поводилися їх матері. У цьому перевага тесту, заснованого на прив'язці до критерію, перед тестами, заснованими на припущенні їх творців, що деякі відповіді вказують на конкретні риси особистості. Недолік його - в дійсному відсутності теоретичного розуміння зв'язку між відповідями на тест і обумовленими їм особливостями особистості.

  Тест MMPI, опублікований в 1943 році, заснований на дослідженні, що почався в 1939-му. До сьогоднішнього дня по MMPI опубліковано більше 8000 дослідницьких робіт, і цей тест переведений більш ніж на 15 мов. Існує кілька приватних фірм, що пропонують комп'ютерну обробку показників і інтерпретацію цього опитувальника.

  Протягом років MMPI критикувався за слабку надійність і валідність деяких його шкал. Стало також очевидним, що початковий опитувальник починає застарівати і його пора переглядати. Але величезна кількість даних по оригінальній версії відбивало охоту у більшості дослідників взагалі братися за настільки страхітливу задачу. Проте це було зроблено. Тест MMPI-2 був опублікований в 1989 році, і в ньому є ряд істотних змін, хоча і збережені основні риси первинного варіанту, включаючи велику частину тестових пунктів оригіналу. Нова версія була стандартизована на більш великою і більш різноманітною вибірці, краще відбиває населення Сполучених Штатів (Graham, 1990). Вже ведеться важка робота з оцінки порівнянності показників старого і нового варіантів.

  В цілому MMPI виявився найбільш цінним засобом загального розрізнення нормальних і аномальних груп і може використовуватися для оцінки загальної тяжкості тих чи інших порушень особистості (Meehl & Dahlstrom, 1960). Однак він не настільки успішний в проведенні тонких відмінностей між різними формами психопатології (Kleinmutz, 1982).

  Хоча спочатку MMPI розроблявся для визначення людей із серйозними розладами особистості, він широко використовувався і для вивчення нормальних груп. Але оскільки MMPI не містить адекватної вибірки особистісних якостей, застосовуваних для опису нормальної особистості, був розроблений Каліфорнійський психологічний опитувальник (CPI: California Psychological Inventory), що використовує в чому ті ж пункти. Шкали CPI вимірюють такі риси особистості, як домінування, товариськість, самооцінка, відповідальність і соціалізіруемость. Щоб набрати порівнювані групи для деяких шкал, учнів середніх шкіл і коледжів просили вказати однокласників, у яких сильно або слабо виражена та чи інша риса особистості. Так, у разі шкали домінування критеріальна група складалася з учнів, за якими їх однолітки визнавали сильне домінування (агресивність, впевненість, самовпевненість), а контрольна група складалася з учнів, у яких їх однолітки визнавали слабке домінування (сором'язливість, недолік самовпевненості, загальмованість). Пункти тесту, що виявили статистично значуща відмінність між критеріальною і контрольною групами, включалися в шкалу домінування. CPI все ще залишається одним з найбільш валідних опитувальників особистості, придатних для застосування до нормальних групам (Megagree, 1972).

  Q-класифікація. Є один особливий метод вимірювання особистісних якостей, званий Q-класифікацією (Q-sort; буква Q у назві вибрана довільно і нічого не означає). У цьому методі оцінює, чи сортувальник, складає опис особистості індивіда шляхом сортування приблизно 100 карт по купках. Кожна карта містить твердження про особистості (наприклад: «Має широке коло інтересів» або «Він сам собі ворог»). Оцінюючий сортує карти на 9 купок, поміщаючи ті карти, які найменше ставляться до індивіда, в купку 1 зліва, а ті, які характеризують його найкраще, - в купку 9 справа. Інші карти розподіляються за проміжними купках, причому ті, які й характерні, і нехарактерні, відкладаються в середню купку (купку 5). Таким чином, кожному твердженню Q присвоюється число в діапазоні від 1 до 9, причому більше число означає, що це твердження більш характерно для даної людини. (У деяких Q-класифікаціях використовується менше або більше 9 купок, але принцип той же.)

  На перший погляд здається, що тут немає відмінностей від процедури, в якій оцінює ранжує набір особистісних якостей за 9-бальною шкалою. І справді, за бажанням дослідника таке ранжирування можна застосувати. Але є важлива відмінність. При заповненні оціночних шкал оцінює неявно порівнює даного індивіда з іншими (наприклад, оцінка «дуже дружній» означає, що даний індивід є дуже дружнім порівняно з іншими індивідами). При проведенні ж Q-класифікації оцінює явним чином порівнює кожну якість з іншими якостями того ж індивіда (наприклад, приміщення картки «дружній» в купку 9 означає, що в порівнянні з іншими якостями дружність виділяється як особливо характерна для даного індивіда).

  Дві Q-класифікації можна порівняти один з одним кількісно, ??обчисливши між ними кореляцію і тим самим оцінивши, наскільки два індивіда подібні між собою за загальної конфігурації особистості. Якщо дві Q-класифікації зроблені для одного індивіда в різний час, тоді кореляція між ними дозволяє оцінити повторну надійність Q-класифікації або збереження загального профілю особистості даного індивіда в часі. Якщо дві Q-класифікації є описами одного індивіда, зробленими двома оцінювачами, то наявність кореляції між ними показує межоценочную надійність Q-класифікації, тобто те, наскільки однаково ці два оцінювача сприймають даного індивіда. (Наприклад, при консультуванні з питань шлюбу буває корисно оцінити, наскільки члени подружньої пари сходяться чи розходяться у своїх сприйняттях один одного.) Нарешті, якщо одна Q-класифікація є описом деякого гіпотетичного типу особистості, то кореляція між Q-класифікацією для деякого індивіда і гіпотетичної класифікацією дозволяє оцінити, наскільки даний індивід близький до типу гіпотетичної особистості. Наприклад, на прохання дослідника клінічний психолог побудував Q-класифікацію гіпотетичної «оптимально пристосованої особистості». Тоді кореляцію між Q-класифікацією для деякого людини і цієї гіпотетичної класифікацією можна прямо інтерпретувати як показник пристосованості (Block, 1961/1978, 1971).

  Оригінальна використання методи Q-сортування (класифікації) обговорюється в рубриці «На передньому краї психологічних досліджень». Ми розглянемо інші приклади методів тестування особи в главі 13, де будемо обговорювати теорії особистості. У частині даної глави ми повернемося до питань інтелекту і досліджуємо деякі нові теорії, що втілюють новий підхід до досліджень інтелекту. 
« Попередня Наступна »
= Перейти до змісту підручника =
 Інформація, релевантна "Оцінка індивідуальних відмінностей"
 1.  ЛІКУВАННЯ
    Лікування гіпертонічної хвороби становить серйозну проблему, ще дуже далеку до свого вирішення. У міру розвитку медичної науки, постійно змінюються підходи до терапії цього стану, кінцеві цілі лікування, створюються нові прогресивні революційні лікарські засоби з надзвичайно складними механізмами корекції АТ. У багатьох країнах світу були прийняті федеральні
 2.  ХРОНІЧНИЙ ПІЄЛОНЕФРИТ
    У більшості випадків хронічний пієлонефрит є наслідком неизлеченного гострого і може виявлятися різноманітною клінікою. У одних хворих він протікає латентно, супроводжується лише помірним болем і лейкоцитурією. У інших же пацієнтів захворювання періодично загострюється, і процес поширюється на нові ділянки паренхіми нирки, викликаючи склероз не тільки канальців, але і клубочків.
 3.  Хронічна серцева недостатність
    Спроби дати повноцінне визначення даному стану робилися протягом декількох десятиліть. У міру розвитку медичної науки змінювалися уявлення про сутність серцевої недостатності, про причини призводять до її розвитку, патогенетичних механізмах, процеси, які відбуваються в самій серцевому м'язі і різних органах і тканинах організму в умовах неадекватного кровопостачання
 4.  ЗНЕБОЛЮВАННЯ ПОЛОГІВ
    Студентам нагадують про зміни в організмі в ході вагітності. Швидке зростання вагітної матки супроводжується високим стоянням діафрагми і печінки, що, в свою чергу, призводить до зміщення серця, відтискування догори легенів і обмежує їх екскурсію. Основними змінами гемодинаміки, пов'язаними із збільшенням терміну вагітності, є збільшення до 150% вихідного ОЦК, помірне підвищення
 5.  Структура вірусу грипу
    П. В. ШОППІН І Р. В. КОМПАНС (PW CHOPPIN, Я. W. COMPANS) I. ВСТУП Вивчення вірусу грипу протягом тривалого часу перебувало «а передовому рубежі структурних досліджень у вірусології. Вірус грипу одним з перших був вивчений: допомогою електронної мікроскопії (Taylor et al., 1943), і при використанні саме цього об'єкта в якості моделі було "вчинено, що деякі віруси
 6.  Біологічно активні білки вірусу грипу. Гемаглютинін
    І. Т. ШУЛЬЦ (I. Т. SCHULZE) I. ВСТУП ТОЙ факт, що віруси грипу мають здатність агглютинировать еритроцити, відіграв велику роль у розвитку наших уявлень про ці інфекційних частинках. Гемаглютинація виявилася вкрай зручним методом для ідентифікації, очищення і визначення. Концентрації вірусів. Крім того, з (моменту виявлення явища гемагглю-тінаціп 35 років тому
 7.  РНК вірусів грипу
    М. В. Лонсі (М. W. PONS) I. ВСТУП Вірус грипу має унікальний в порівнянні з іншими вірусами тварин спектр біологічних властивостей. Він має здатність. До множинної реактивації (Hoyle, Liu, 1951), утворення неповних вірусних частинок (von Magnus, 1954), чутливий до антіноміціну D (Barry et al., 1962), його нуклеїнова кислота неінфекційні-і він має здатність до
 8.  Репродуктивні органи репродуктивної системи
    1.3.1. Анатомо-фізіологічна і гістофізіологіческая характеристика статевих органів жінки в репродуктивному періоді 1.3.1.1. Яєчники Яєчники статевозрілої жінки розташовані в малому тазу (рис. 1.6), кілька асиметрично на задньому листку широкої зв'язки. Положення яєчників в порожнині малого таза в цьому віці відносно непорушне. Зсув їх у черевну порожнину спостерігається
 9.  Нейрогуморальна регуляція і стан репродуктивної системи в період її становлення
    Відомо, що реалізація репродуктивної функції може бути здійснена тільки при досягненні організмом статевої зрілості. Для правильного уявлення про функціонування зрілої репродуктивної системи необхідно знати, які процеси відбуваються в репродуктивній системі на етапі її становлення, які особливості характеризують функціональну активність її структурних елементів, якими є
 10.  Нейрогуморальна регуляція і стан репродуктивної системи в період її активного функціонування
    Останнє двадцятиріччя відзначено значними досягненнями в аналізі механізмів ендокринного контролю менструального циклу жінки. Численні клінічні та експериментальні дослідження дали можливість істотно розширити уявлення про основні закономірності процесів росту фолікула, овуляції і розвитку жовтого тіла, охарактеризувати особливості гонадотропной і гіпоталамічної
© medbib.in.ua - Медична Бібліотека