загрузка...
« Попередня

Додаток

Статистичні методи та вимірювання



Значна частина роботи психолога складається з проведення вимірювань - або в лабораторії, або в польових умовах. Це можуть бути вимірювання рухів очей немовляти при першому впливі нового стимулу; реєстрація шкірно-гальванічної реакції людей під час стресу; підрахунок числа спроб, необхідних для обуславливания мавпи з префронтальної лоботомію; визначення показників вступних оцінок серед учнів, що використовують комп'ютеризоване навчання, або підрахунок кількості пацієнтів , у яких настало поліпшення після того чи іншого виду психотерапії. У всіх цих прикладах операція вимірювання дає числа; завдання психолога - інтерпретувати їх і прийти до деякого спільного висновку. Основний інструмент для цього завдання - статистика, дисципліна, що має справу зі збором числових даних та проведенням висновків на їх основі. Мета цього Додатка - розглянути деякі статистичні методи, які відіграють важливу роль в психології.

Ця програма написано в припущенні, що проблеми, що виникають у студентів зі статистикою, по суті є проблеми ясного уявлення про отриманих даних. Вступне знайомство зі статистикою не виходить за рамки можливостей будь-якого, хто досить розбирається в алгебрі, щоб використовувати знаки «плюс» і «мінус», а також підставляти числа замість букв в рівняннях.





Описова статистика



Статистика служить насамперед для скороченого опису великих обсягів даних. Припустимо, нам треба вивчити показники на вступних іспитах до коледжу для 5000 учнів, записані на картках в реєстратурі. Ці показники є сирими даними. Перегортання карток вручну дасть нам деяке враження про показники учнів, але втримати все це в голові буде неможливо. Тому ми робимо з цих даних свого роду резюме, усереднюючи всі показники або знаходячи максимальну і мінімальну величину. Ці статистичні резюме полегшують запам'ятовування і обмірковування даних. Такі резюмирующие висловлювання називають описової статистикою.



Частотний розподіл



Елементи сирих даних стають збагненна, коли вони згруповані в частотний розподіл. Щоб згрупувати дані, ми повинні спочатку поділити шкалу, за якою вони вимірювалися, на інтервали, і потім порахувати, скільки елементів припадає на кожен інтервал. Інтервал, у якому групуються величини, називається груповим інтервалом. Рішення про те, на скільки групових інтервалів треба розбити дані, не визначається будь-яким правилом, а виходить від рішення дослідника.

У табл. П1 показана вибірка сирих даних, що відображають показники 15 учнів на вступних іспитах до коледжу. Показники наведено в тому порядку, в якому учні складали іспит (у першого учня показник був 84, у другого - 61 і т. д.). У табл. П2 ці ж дані представлені у вигляді частотного розподілу, для якого груповий інтервал був встановлений рівним 10. На інтервал від 50 до 59 припадає один показник, на інтервал від 60 до 69 - два і т. д. Зауважте, що більшість показників припадають на інтервал від 70 до 79 і що жоден показник не нижче інтервалу 50-59 або вище інтервалу 90 -99.



Таблиця П1. Сирі показники



84, 61, 72, 75, 77, 75, 75, 87, 79, 51, 91, 67, 79, 83, 69

( Показники 15 учнів на вступних іспитах до коледжу, наведені в тому порядку, в якому учні складали іспит.)



Таблиця П2.

Частотний розподіл





Показники з табл. П1, розбиті на групові інтервали.



Частотний розподіл легше зрозуміти, коли воно представлено графічно. Найбільш широко застосовувана графічна форма - це частотна гістограма; її приклад показаний у верхній частині рис. П1. Гістограми складаються шляхом малювання смуг, підстави яких задаються груповими інтервалами, а висота - відповідними частотами груп. Ще один спосіб представлення частотного розподілу в графічній формі - огинає частоти, приклад якої показаний в нижній частині малюнка П1. При побудові обвідної частоти груп відзначаються навпроти середини інтервалу груп, а потім ці точки з'єднуються прямими лініями. Для завершення картини на кожному кінці розподілу додається ще один клас; оскільки у цих класів частота нульова, обидва кінці вийшла фігури опиняться на горизонтальній осі. Що огинає частоти дає ту ж інформацію, що і частотна гістограма, але складається з ряду з'єднаних відрізків, а не із смужок.





Рис. П1.

Частотні графіки

. Тут відображені дані з табл. П2. Вгорі - частотна гістограма, внизу - огинає частоти.



На практиці число елементів виходить набагато більшим, ніж те, що відображено на рис. П1, але на всіх малюнках цього додатка показано мінімальну кількість даних, так щоб ви могли легко перевірити етапи розміщення в таблиці і на графіку.



Заходи середнього



Міра середнього - це просто показова точка на шкалі, стисло відображає особливість наявних даних. Зазвичай використовуються три заходи середнього: середнє значення, медіана і мода.

Середнє значення (або просто середнє) - це знайоме нам арифметичне середнє, що виходить при додаванні всіх величин і розподілі отриманої суми на їх кількість. Сума сирих величин з табл. П1 дорівнює 1125. Якщо поділити її на 15 (загальна кількість величин), то середнє буде 75.

Медіана - позначка середнього елемента послідовності, отриманої шляхом розташування всіх величин по порядку і потім відліку до середини, починаючи з будь-якого кінця. Якщо 15 величин з табл. П1 розташувати по порядку від найбільшого до самого малому 8-я величина з будь-якого кінця дорівнюватиме 75. Якщо вихідна кількість величин буде парних, то ми просто вважаємо середнє від тих двох, які опиняються в середині.

Мода - це самий часто зустрічається показник в даній вибірці. Найчастіша величина в табл. П1 - це 75, отже, мода цього розподілу дорівнює 75.

При нормальному розподілі, коли величини розподілені порівну з кожного боку від середини (як на рис. П1), середнє, медіана і мода однакові. Це не так для скошених, або несиметричних, розподілів. Припустимо, нам треба проаналізувати часи відправлення ранкового поїзда. Зазвичай поїзд відправляється вчасно; трапляється, він відправляється пізніше, але він ніколи не йде завчасно. У потяга з відправленням за розкладом о 08:00 час відправлення протягом тижня може виявитися таким:

Пн: 08:00

Вт: 8:04

Ср: 8:02

Чт: 8:19

Пт: 8:22

Сб: 8:00

Нд: 8:00

Цей розподіл часів відправлення є скошеним через двох запізнілих відправлень; вони збільшують середній час відправлення, але не сильно впливають на медіану і моду.

Важливо зрозуміти сенс скошеного розподілу, оскільки інакше різницю між медіаною і середнім іноді важко вловити (рис. П2). Якщо, наприклад, керівництво фірми і її профспілка сперечаються через добробуту працівників, середня величина витрат на зарплату та їх медіана можуть зрушити в протилежних напрямках. Припустимо, фірма піднімає зарплату більшості співробітників, але урізує зарплату вищим управлінцям, які були занадто високо на шкалі оплати; тоді медіана зарплати може піднятися вгору, тоді як середня величина зарплати знизиться. Сторона, яка прагне показати, що зарплата зросла, вибере як індикатор медіану, а сторона, яка прагне показати зниження зарплати, вибере середнє.





Рис. П2.

Крива скошеного розподілу

. Зауважте, що скіс розподілу має той напрямок, в якому спадає його хвіст. Зауважте також, що у скошеного розподілу середнє, медіана і мода не збігаються; медіана зазвичай знаходиться між модою і середнім.



Заходи варіації



Як правило, про розподіл потрібно знати більше, ніж можуть показати заходи середнього. Потрібна, наприклад, міра, яка може сказати, чи розташований пучок величин близько до їх середнім або широко розкиданий. Міра розкиду величин щодо середнього називається мірою варіації.

Показник варіації корисний як мінімум у двох відношеннях. По-перше, він показує репрезентативність середнього. Якщо варіація невелика, то відомо, що окремі величини будуть близькі до середнього. Якщо варіація велика, то таке середнє не можна з великою впевненістю використовувати як репрезентативною величини. Припустимо, що шиється партія готової одягу без зняття конкретних мірок. Для цього корисно знати середній розмір цієї групи людей, але також важливо знати і розкид їх розмірів. Знаючи варіацію, можна сказати, наскільки повинні варіюватися виготовляються розміри.

Для ілюстрації подивимося на дані рис. П3, де наведені частотні розподілу показників вступних іспитів для двох класів з 30 учнів. В обох класах середній показник один і той же - 75, але вони очевидно розрізняються за ступенем варіації. Показники всіх учнів з класу А розташовані близько до середнього, тоді як показники учнів з класу Б розкидані в широкому діапазоні. Потрібні якісь заходи, щоб точніше визначити, чим розрізняються ці розподілу. Психологи часто використовують три заходи варіації: розмах, дисперсія і стандартне відхилення.





Рис. П3.

Приклад різної варіації розподілів

. Як легко бачити, пучок показників у класу А ближче до середнього, ніж показники класу Б, хоча саме середнє в обох класах ідентично - 75. У класу А всі показники потрапляють між 60 і 89, причому більшість з них припадає на інтервал від 70 до 79. У класу Б показники розподілені відносно рівномірно по всьому діапазону від 40 до 109. Ця відмінність між двома розподілами в розкиданості можна оцінити за показником стандартного відхилення, яке у класу А менше, ніж у класу Б.



Щоб спростити арифметичні обчислення, припустимо, що п'ять учнів з кожного класу захотіли вступити до коледж і що їх сумарні оцінки на вступних іспитах були такі:

Показники учнів із класу А:

73, 74, 75, 76, 77 (середнє=75)

Показники учнів із класу Б:

60, 65, 75, 85, 90 (середнє=75)

Тепер підрахуємо для цих двох вибірок заходи варіації.

Розмах - це розкид між найвищою і найнижчою величиною. Розмах показників у п'яти учнів із класу А дорівнює 4 (від 73 до 77); розмах показників учнів класу Б дорівнює 30 (від 60 до 90).

Розмах легше підрахувати, але дисперсія і стандартне відхилення використовуються частіше. Це більш чутливі заходи варіації, оскільки вони враховують всі величини, а не тільки крайні величини, як розмах. Дисперсія показує, наскільки складові розподіл величини відстоять від середньої величини цього розподілу. Щоб обчислити дисперсію, спочатку підрахуємо відхилення кожної величини (d) від середнього, вирахувавши з середнього кожну величину (табл. П3). Потім треба кожну різницю звести в квадрат, щоб не було негативних чисел. Нарешті, ці відхилення складаються разом і діляться на загальну кількість відхилень, даючи в результаті середній квадрат відхилення. Середній квадрат відхилення називається дисперсією. Проробивши це з даними з рис. П3, ми виявимо, що дисперсія у класу А дорівнює 2,0, а у класу Б - 130. Очевидно, що у класу Б варіативність показників значно сильніше.



Таблиця П3. Обчислення дисперсії і стандартного відхилення

Оцінки Класу А (Середнє=75)

Сума d2=10

Дисперсія=середнє по d2=10/5=2,0

Стандартне відхилення (?)=

=1,4



Оцінки Класу Б (Середнє=75)

Сума d2=650

Дисперсія=середнє по d2=650/5=130

Стандартне відхилення (?)=

=11,4



Незручність дисперсії полягає в тому, що вона виражена в одиницях виміру, зведених в квадрат. Тому величина дисперсії, рівна 2 у класу А, не означає, що його усереднені показники відрізняються від середнього на 2 пункти. Вона показує, що 2 - це результат усереднення зведених в квадрат значень, на які показники відрізняються від середнього. Щоб отримати міру відхилення, виражену в початкових одиницях виміру (в даному випадку це кількість одиниць, набраних на іспиті), треба просто витягти з дисперсії квадратний корінь. Результат називають стандартним відхиленням. Воно позначається грецькою буквою? (Сигма), використовуваної також в деяких інших статистичних обчисленнях, які ми обговоримо коротко.
трусы женские хлопок
Стандартне відхилення обчислюється за такою формулою:



Приклад обчислення стандартного відхилення. (Табл. П3). Показники вибірок з двох класів представлені у вигляді, зручному для обчислення стандартного відхилення. На першому етапі віднімаємо середнє з кожного показника (середнє=75 в обох класах). В результаті отримуємо позитивні величини d для показників, які більше середнього, і негативні для тих, які менше його. Коли отримані величини будуть зведені в квадрат, знак мінус пропаде (наступна колонка в табл. П3). Зведені в квадрат різниці складаються і діляться на N - кількість елементів вибірки, в нашому випадку N=5. Витягуючи квадратний корінь, одержуємо стандартне відхилення. [У цьому ознайомчому викладі ми скрізь будемо використовувати? (Сигма). Однак у науковій літературі для позначення стандартного відхилення вибірки використовується маленька буква s, а через а позначають стандартне відхилення для всієї групи. Крім того, при обчисленні стандартного відхилення для вибірки (s) сума всіх d2 поділяється не на N, а на N-1. У випадку досить великих вибірок, однак, використання N-1 замість N мало впливає на величину стандартного відхилення. Для спрощення пояснень ми не будемо розрізняти тут стандартне відхилення вибірки та групи і використовуємо для них одну і ту ж формулу. Обговорення цього моменту см. в: Phillips (1992).]





  Статистичні висновки



  Тепер, познайомившись із статистикою як способом опису даних, ми готові звернутися до інтерпретації даних - тому, як з них роблять висновки.



  Група і вибірки



  Насамперед, необхідно розрізняти групу і вибірку з цієї групи. Бюро перепису Сполучених Штатів намагається описати населення в цілому шляхом отримання описового матеріалу за віком, сімейним станом і т. д. про всіх жителів країни. Слово група (population) годиться для бюро перепису, оскільки воно представляє всіх людей, що живуть в США.

  У статистиці слово «група» не обмежена людьми, тваринами або предметами. Групою можуть бути всі величини температур, зареєстровані термометром протягом останнього десятиліття, всі слова англійської мови або будь-який інший певний запас даних. Часто у нас немає доступу до всієї групи, і тоді ми намагаємося представити її за вибіркою, взятої у випадковому (неупередженому) порядку. Можна задатися яким питанням про випадково відібраної частини людей, як це зробило Бюро перепису в деяких недавніх переписах; можна вивести середню температуру, знімаючи показання термометра в певний час і не ведучи безперервного запису; можна оцінити кількість слів в енциклопедії, підрахувавши слова на випадково обраних сторінках. У всіх цих прикладах робиться вибірка з групи. Якщо будь-які з цих процесів повторити, результати будуть злегка різні внаслідок того, що вибірка в повному обсязі відбиває групу в цілому і, отже, містить помилки вибірки. Саме тут вступають в гру статистичні висновки.

  Вибірку даних з групи збирають, щоб зробити висновок про цю групу. Можна вивчити вибірку даних перепису, щоб дізнатися, чи старіє населення, наприклад, і чи існує тенденція міграції в приміські зони. Подібним чином, експериментальні результати вивчаються, щоб визначити, який вплив експериментальні маніпуляції надали на поведінка - чи вплинула гучність на поріг сприйняття висоти звуку, або надають чи особливості виховання істотний вплив на подальше життя. Щоб робити статистичні висновки, треба оцінити відносини, на які вказують дані вибірки. Такі висновки завжди мають деяку ступінь невизначеності через помилки вибірки. Якщо статистичні випробування показують, що величина ефекту, виявлена ??в даній вибірці, досить велика (щодо оцінки помилки вибірки), то можна бути впевненим, що спостережуваний в даній вибірці ефект існує і у групи в цілому.

  Таким чином, статистичний висновок пов'язаний з необхідністю зробити висновок чи судження щодо деякої характеристики групи, грунтуючись тільки на інформації, отриманої про вибірку з цієї групи. В якості знайомства зі статистичними висновком ми розглянемо нормальний розподіл і його застосування при інтерпретації стандартного відхилення.



  Нормальний розподіл



  Коли велика кількість даних збирають, представляють в табличному вигляді і відображають у вигляді гістограми або обвідної, вони часто утворюють дзвіноподібний симетричний розподіл, відоме як нормальний розподіл. Більшість його елементів розташовуються поблизу середнього (верхня точка дзвони), і цей дзвін різко спадає у найбільшій і у самої малої величини. Така форма кривої представляє особливий інтерес, оскільки вона виникає і тоді, коли результат процесу заснований на безлічі випадкових подій, всі з яких відбуваються незалежно. Демонстраційне пристрій, показане на рис. П4, дозволяє побачити, як з випадкових подій складається нормальний розподіл. Випадковий фактор - чи впаде сталева кулька вліво або вправо щоразу, коли він потрапляє в розвилку, - наводить до симетричного розподілу: більше кульок падають прямо посередині, але час від часу один з них досягає одного з крайніх відділень. Це зручна візуалізація того, що мається на увазі під випадковим розподілом, близьким до нормального розподілу.





  Рис. П4.

 Пристрій для демонстрації нормального розподілу випадкової величини

 . Пристрій тримають догори ногами, поки всі сталеві кульки не скотитися в резервуар. Потім пристрій перевертають і тримають вертикально, поки кульки, пройшовши по полю зі штирями, не скотитися в 9 колонок-виїмок внизу. Точна кількість кульок, що потрапили в кожну колонку, в різних демонстраціях буде неоднаковим. Проте в середньому висота колонок з кульок буде приблизно повторювати нормальний розподіл, коли найвища колонка буде в центрі, а висоти інших колонок будуть знижуватися в напрямку до країв.



  Нормальний розподіл (рис. П5) - це математичне представлення ідеалізована розподілу, наближено створюваного пристроєм, показаним на рис. П4. Нормальний розподіл показує ймовірність того, що елементи в групі з нормальним розподілом відрізнятимуться від середнього на будь-яку задану величину. У відсотках на рис. П5 показана частка площі, що лежить під кривою між зазначеними величинами шкали; загальна площа під кривою відповідає групі в цілому. Приблизно дві третини всіх випадків (68%) потрапляють в інтервал між плюс і мінус одним стандартним відхиленням від середнього (± 1?); 95% всіх випадків - в інтервал ± 2?; І практично всі випадки (99,7%) - у ± 3?.





  Рис. П5.

 Нормальний розподіл

 . Криву нормального розподілу можна побудувати, використовуючи стандартне відхилення і середнє. Площею під кривою, що лівіше -3? і правіше +3?, можна знехтувати.



  Більш докладний список площ під частинами кривої нормального розподілу наведено в табл. П4.



  Таблиця П4.

 Площа ділянок під кривою нормального розподілу як частина загальної площі під нею





  Давайте за допомогою табл. П4 простежимо, як виходять величини 68% і 95%, показані на рис. П5. У табл. П4 в третій колонці знаходимо, що між -1? і середнім лежить 0,341 загальної площі і між +1? і середнім теж 0,341 загальної площі. У сумі ці величини дають 0,682, що на рис. П5 показано як 68%. Подібним чином площу від -2? до +2? складе 2 х 0,477=0,954, показані як 95%.



  Шкалирование даних



  Щоб інтерпретувати показник, часто потрібно знати, високий він чи низький по відношенню до інших показників. Якщо людині, що здає водійський іспит, потрібно 0,500 сек, щоб натиснути на гальмо після сигналу небезпеки, як визначити, швидко це чи повільно? Чи вважати, що студент здав курс з фізики, якщо його показник на іспиті дорівнює 60? Для відповіді на такі питання треба вивести шкалу, з якою ці показники можна порівнювати.

  Ранжування даних. Маючи в своєму розпорядженні показники за рангом від високого до низького, ми отримуємо одну з таких шкал. Окремий показник інтерпретується по тому, на якому місці він розташовується серед групи показників. Наприклад, курсанти військової академії Вест Пойнт знають, де вони знаходяться в своєму класі - можливо, 35-ми або 125-ми в класі з 400.

  Стандартний показник. Стандартне відхилення - зручна одиниця шкалювання, оскільки ми можемо оцінити, наскільки далеко від середнього розташовуються 1? або 2? (Табл. П4). Величину твору, в якому один співмножник - стандартне відхилення, називають стандартним показником. Багато шкали, застосовувані в психологічних вимірах, засновані на принципі стандартного показника.

  Приклад обчислення стандартного показника. У табл. П1 наведені показники, отримані 15 студентами на вступних іспитах. Не маючи додаткової інформації, ми не знаємо, чи є ці показники репрезентативними для групи всіх надходили. Однак припустимо, що середній показник на цих іспитах був 75, а стандартне відхилення 10.

  Яким же буде стандартний показник у студента, який набрав на іспитах 90 балів? Наскільки вище середнього лежить цей показник, треба висловити в кількості стандартних відхилень:

  Стандартний показник для студента, з оцінкою 90 дорівнює:



  Як другий приклад візьмемо учня з оцінкою 53.

  Стандартний показник для оцінки 53 дорівнює:



  У цьому випадку показник учня лежить нижче середнього на 2,2 стандартних відхилення. Таким чином, знак стандартного показника (+ чи -) говорить про те, вище або нижче середнього знаходиться даний показник, а його величина показує, наскільки далеко від середнього він розташований в одиницях стандартних відхилень.



  Наскільки репрезентативно середнє?



  Наскільки добре середнє вибірки відображає середній всієї групи? Якщо вимірювати зріст у випадкової вибірки з 100 студентів коледжу, наскільки добре середнє цієї вибірки пророкує істинне середнє групи (тобто середній зріст усіх студентів коледжу)? Це все питання, пов'язані з виведенням про групу на основі даних вибірки.

  Точність такого висновку залежить від помилок вибірки. Припустимо, ми зробили дві випадкових вибірки з однієї і тієї ж групи і для кожної з них підрахували середнє. Якого відмінності між одним і іншим середнім можна очікувати внаслідок випадку?

  Наступні випадкові вибірки з тієї ж групи будуть давати різні середні, утворюючи розподіл вибірки середніх навколо істинного середнього даної групи. Ці вибірки середніх самі по собі є величинами, для яких можна підрахувати стандартне відхилення. Це стандартне відхилення називається стандартною помилкою середнього; воно позначається sM і обчислюється за такою формулою:



  де? - Стандартне відхилення вибірки, а N - кількість випадків, за якими обчислюється кожне середнє.

  Відповідно до цієї формули, величина стандартної помилки середнього зменшується із збільшенням величини вибірки; тому середнє, засноване на більш великої вибірці, є більш достовірним (воно швидше виявиться ближче до істинного середньому всієї групи). Цього можна було очікувати і на основі здорового глузду. Стандартна помилка середнього ясно показує, наскільки невизначено отримане середнє. Чим більше об'єм вибірки, тим менше невизначеність середнього.



  Значимість відмінності



  У багатьох психологічних експериментах дані збираються за двома групами досліджуваних; одна група піддається специфічним експериментальним впливам, а інша служить контрольної. Питання в тому, чи існує відмінність між середніми показниками цих груп, і якщо є, то витримується воно для всієї групи, з якої були взяті ці дві вибірки. Простіше кажучи, чи відображає відмінність між двома групами справжнє відмінність або воно виникло внаслідок помилки вибірки.

  В якості прикладу порівняємо показники іспиту з читання у вибірки хлопчиків-першокласників з показниками у вибірки дівчаток-першокласниць. Що стосується середніх показників, то вони у хлопчиків нижче, але тут є значне перекриття; деякі хлопчики справляються виключно добре, а деякі дівчатка - вкрай погано. Тому ми не можемо прийняти це розходження середніх, не провівши тест на статистичну значущість. Тільки тоді можна буде вирішити, чи відображають спостерігаються відмінності у вибірці справжні відмінності в групі або ж вони пояснюються помилкою вибірки. Якщо деякі більш обдаровані дівчинки і деякі більш тупі хлопчики виявилися обрані по чистій випадковості, то розходження можна пояснити помилкою вибірки.


  В якості ще одного прикладу припустимо, що ми провели експеримент порівняно фортеці рукостискання у чоловіків правшів і лівшів. У верхній частині табл. П5 показані гіпотетичні дані такого експерименту. Вибірка з 5 чоловіків-правшів в середньому на 8 кг сильніше вибірки з 5 чоловіків лівшів. Що взагалі можна вивести з таких даних про чоловіків лівш і правша? Чи можна стверджувати, що правші сильніше? Очевидно, ні, оскільки середнє, отримане у більшості правшів, не відрізнялося б від середнього у більшості лівшів; один примітно відрізняється показник величиною 100 говорить про те, що ми маємо справу з невизначеною ситуацією.



  Таблиця П5. Значимість відмінності

  Приклад 1



  Приклад 2



  Два приклади, що показують розходження між середніми. Різниця середніх однакова (8 кг) у верхній і нижній частині таблиці. Однак, дані нижній частині вказують на більш надійне відмінність середніх, ніж дані у верхній частині таблиці.



  Тепер припустимо, що в результаті експерименту отримані результати, показані в нижній частині тієї ж табл. П5. Ми знову бачимо те ж саме відмінність середніх, рівне 8 кг, але тепер ці дані викликають більшу довіру, оскільки показники у лівшів вийшли систематично нижче, ніж у правшів. Статистика дозволяє дуже точно врахувати надійність відмінностей середнього, так щоб при визначенні, яке з двох відмінностей більш надійно, не залежати тільки від інтуїції.

  Ці приклади показують, що значимість отриманого відмінності залежить і від його величини, і від варійованих порівнюваних середніх. Знаючи стандартну помилку середнього, можна обчислити стандартну помилку відмінності між двома середніми? DM. Потім можна оцінити отримане відмінність за допомогою критичного відносини - відносини отриманої різниці середніх (DM) до стандартної помилку відмінності між середніми:

  Критичне ставлення=



  Це відношення дозволяє оцінити значимість відмінності між двома середніми. Як найпростіше правило, критичне ставлення має бути не менше 2,0, щоб різниця середніх вважалася значущою. У всій цій книзі вислів про «статистичної значущості» різниці середніх означає, що критичне ставлення у них не менше такого.

  Чому як статистично значимого вибрано критичне ставлення, рівне 2.0? Просто тому, що така або велика величина може випасти випадково тільки в 5% випадків. Звідки взялися ці 5%? Критичне ставлення можна вважати стандартним показником, оскільки це просто різниця двох середніх, виражена в числі стандартних помилок. Звертаючись до 2-й колонці табл. П4, помічаємо, що ймовірність того, що стандартне відхилення становить 2,0 при випадковому збігу, дорівнює 0,023. Оскільки ймовірність відхилення в протилежну сторону теж дорівнює 0,023, загальна ймовірність складе 0,046. Це означає що коли середні груп однакові, критичне ставлення може випадково виявитися рівним 2,0 (або більше) в 46 випадках з 1000, або в 5% випадків.

  Елементарне правило, яке говорить, що критичне ставлення має бути не менше 2,0, саме таке - це довільне, але зручне правило, задає 5%-вий рівень значущості. Слідуючи цьому правилу, ймовірність помилкового рішення про те, що різниця середніх існує, тоді як насправді це не так, буде менше 5%. Не обов'язково користуватися 5%-ним рівнем; в деяких експериментах може знадобитися більш висока значимість, залежно від того, наскільки допустима помилка ув'язнення.

  Приклад обчислення критичного ставлення. Для обчислення критичного ставлення треба визначити стандартну помилку різниці двох середніх за такою формулою:



  У цій формулі? М1 і? М2 - стандартні помилки двох порівнюваних середніх.

  В якості ілюстрації припустимо, що нам треба порівняти досягнення першокласників - хлопчиків і дівчаток на іспиті з читання в США. Береться випадкова вибірка хлопчиків і дівчаток і піддається тестуванню. Припустимо, що середній показник у хлопчиків дорівнює 70 при стандартній помилку середнього 0,40, а середній показник у дівчаток - 72 при стандартній помилку середнього 0,30. На основі цих вибірок треба вирішити, чи є це реальне відмінність між успіхами хлопчиків і дівчаток у читанні у групі в цілому, Дані вибірки показують, що оцінки у дівчаток більше, ніж у хлопчиків, але чи можна укласти, що ми отримали б те ж саме , протестувавши всіх першокласників США? Вирішити це дозволяє критичне ставлення.



  Критичне ставлення=



  Оскільки критичне ставлення значно вище 2,0, можна стверджувати, що спостережуване середнє розходження статистично значимо на 5%-му рівні. Тому можна зробити висновок, що між хлопчиками і дівчатками існує надійне відмінність в успіхах з читання. Зауважте, що критичне ставлення може бути позитивним і негативним, залежно від того, яке середнє з якого віднімається; при інтерпретації критичного ставлення враховується тільки його величина, але не знак.

  Коефіцієнт кореляції



  Кореляцією називають паралельну варіацію двох величин. Припустимо, що розробляється тест для передбачення успішності в коледжі. Якщо це хороший тест, високі показники в ньому повинні зв'язуватися з високою успішністю в коледжі, а найнижчі - з низькою успішністю. Коефіцієнт кореляції дозволяє точніше встановити ступінь цього зв'язку.



  Кореляція як добуток моментів



  Найчастіше коефіцієнт кореляції визначається методом твори моментів; отримується в результаті індекс зазвичай позначається маленькою буквою r. Обчислений через твір моментів коефіцієнт r варіюється між повною позитивної кореляцією (r=+1,00) і повною негативною кореляцією (r=-1,00). Відсутність будь-якого зв'язку дає r=0,00.

  Кореляція обчислюється через твір моментів за формулою:



  Тут одну з парних заходів називають x-показником, а іншу y-показником, dx і dy - це відхилення кожного показника від середнього; N - кількість парних величин, а? X і? Y - стандартні відхилення x-показників і y-показників.

  Для визначення коефіцієнта кореляції треба визначити суму творів (dx) x (dy). Цю суму разом з обчисленими стандартними відхиленнями для х-показників і y-показників можна потім підставити у формулу.

  Приклад обчислення кореляції через твір моментів. Припустимо, ми зібрали дані, показані в табл. П6. Для кожного випробуваного отримано два показника; перший - оцінка на вступних іспитах (її ми довільно назвемо x-показником), а другий - оцінки за перший курс (y-показник).



  Таблиця П6. Обчислення кореляції через твір моментів



  ? X=4,? Y=6





  На рис. П6 показаний точковий графік цих даних. Кожна точка відображає x-показник і y-показник даної людини; наприклад, верхня точка праворуч означає Андрія. Дивлячись на ці дані, легко виявити, що між х-і у-показниками існує деяка позитивна кореляція. Андрій отримав найвищу оцінку на вступному іспиті і також отримав найвищу позначку за 1-й курс; Дмитро отримав і там, і там найнижчу позначку. У показниках інших студентів є трохи нерегулярності, так що ми знаємо, що кореляція не полная; отже, r менше 1,00.





  Рис. П6.

 Точкова діаграма

 . Кожна точка відображає х-і у-показники певного учня.



  Ми підрахуємо кореляцію, щоб проілюструвати цей метод, хоча на практиці жоден дослідник не стане вважати кореляцію для такої малої кількості показників. Подробиці наведено в табл. П6. Згідно з процедурою, наведеною в табл. П3, ми обчислюємо стандартне відхилення x-показників, а потім стандартне відхилення y-показників. Потім ми обчислюємо твір (dx) x (dy) для кожної людини і для 5 випадків в загальному. Підставляючи отримані числа в рівняння, отримуємо r=+0.85.



  Інтерпретація коефіцієнта кореляції



  Кореляцію можна використовувати для прогнозування. Наприклад, якщо з досвіду відомо, що певний вступний тест корелює з відмітками першокурсників, можна передбачити позначки на іспитах за перший курс у тих початківців студентів, які цей тест проходили. Якщо кореляція повна, їх позначки можна передбачити безпомилково. Але, як правило, r менше 1,00 і в прогнозі є певні помилки; чим ближче r до 0, тим більше помилка прогнозу.

  Ми не зможемо розглянути технічні проблеми прогнозування оцінок першокурсників, виходячи з оцінок на вступному іспиті або інших аналогічних прогнозів, але можна розглянути сенс різної величини коефіцієнта кореляції. Очевидно, що якщо кореляція між х і у дорівнює 0, то знання х не допоможе передбачити у. Якщо вага людини не пов'язаний з інтелектом, то знання про вагу нічого не дає для передбачення інтелекту. Інша полярне значення - повна кореляція - означало б 100%-ную ефективність прогнозу: знаючи х, можна було б абсолютно точно передбачити у. Але що значать проміжні величини r? Певне уявлення про значення проміжної величини коефіцієнта кореляції можна отримати з точкових діаграм на рис. П7.





  Рис. П7.

 Точкові діаграми, що ілюструють різну величину кореляції

 . Кожна точка зображує оцінки однієї людини в двох іспитах, х і у. На графіку А всі випадки падають на діагональ, і кореляція є повною (r=+1,00); якщо відома оцінка людини по х, значить вона буде такою ж і по в. На графіку Б кореляція дорівнює 0; знаючи оцінку людини по х, ми не зможемо сказати, чи буде вона у нього такий же, вище або нижче по в. Наприклад, з чотирьох осіб зі однаковою середньою оцінкою, рівний х (dx=0), один отримує дуже високу позначку по у (dy=+2), один - дуже низьку (dy=-2), а два отримують середню. На графіках В і Г існує діагональна тенденція відміток, так що висока оцінка з х має зв'язок з високою відміткою по у, а низька оцінка з х має зв'язок з найнижчою позначкою за у, але зв'язок ця неповна. Якщо на осях НЕ БУДЕ звичайних шкал, це ніяк не вплине на інтерпретацію. Наприклад, якби ми координатам х та у привласнили величини від 5 до 10 і потім підрахували б r для цих нових величин, коефіцієнт кореляції вийшов би тим же самим.



  У попередньому обговоренні ми не звертали особливої ??уваги на знак коефіцієнта кореляції, оскільки він не говорить про силу зв'язку. Єдина відмінність між коефіцієнтами кореляції +0,70 і -0,70 - це те, що в першому випадку збільшення х супроводжується збільшенням у: а в другому збільшення х супроводжується зменшенням у.

  Коефіцієнт кореляції - один з найбільш часто вживаних статистичних інструментів в психології, але водночас це одна з тих процедур, які найчастіше невірно використовуються. Ті, хто ним користується, часто не беруть до уваги, що r не вказує на причинно-наслідковий зв'язок між х і у. Коли два набору показників корелюють, можна припустити, що у них є певний загальний причинний фактор, але не можна вважати, що один з них просто викликає інший.

  Кореляція іноді виглядає парадоксально. Наприклад, було виявлено, що кореляція між часом, що витрачається на навчання, і оцінками в коледжі має злегка негативну величину (-0,10). Якщо використовувати причинний інтерпретацію, то довелося б укласти, що кращий спосіб поліпшити позначки - перестати вчитися. Насправді ж негативна кореляція виникає тут просто тому, що у деяких студентів є перевага над іншими в отриманні високих позначок (можливо тому, що вони краще були підготовлені до коледжу), так що ті, хто витрачає більше часу на навчання, - це часто ті, кому високі позначки даються важче інших.

  Цей приклад служить достатнім попередженням проти причинного розуміння коефіцієнта кореляції. Трапляється, однак, що дві змінних корелюють і одна з них дійсно є причиною іншої. Пошук причини - справа логіки, і кореляція може направляти експериментаторів при перевірці причинно-наслідкових відносин. 
« Попередня
= Перейти до змісту підручника =
 Інформація, релевантна "Додаток"
  1.  ЛІКУВАННЯ
      повинно бути спрямоване на усунення етіологічного фактора; нормалізацію функціонального стану кишечника (відновлення еубіоза і нормальної моторики); зменшення запального процесу в кишечнику; дезинтоксикацию і корекцію метаболічних порушень, вплив на алергічні реакції, психопатологічні і вегетативні прояви. Крім того, в лікувальну програму включаються
  2.  ЛІКУВАННЯ
      докладання їх дії на 3 групи: 1. Препарати, які надають переважне дію на тонус вен (нітрати, молсидомин). 2. Препарати, що діють переважно на тонус артеріол (фентоламін та інші a-блокатори, апрессин). 3. Змішані вазодилятатори (нітропрусид натрію, празозин, трімазозін, каптоприл). Існують відносні показання застосування вазоділята-торів
  3.  Хронічна серцева недостатність
      додатком їх дій. У цих препаратів спостерігається чіткий дозозалежний ефект. Максимальні дози фуросеміду 2000 мг на добу. При призначенні етакріновоі кислоти, враховуючи ототоксическое дію, доза не повинна перевищувати 150-200 мг на добу. Після в / в введення ефект настає через 5-15 хвилин, зберігається протягом години, при пероральному застосуванні, відповідно 30 хвилин і 5-6 годин.
  4.  8.1. ТРИВОГА І ДЕПРЕСІЯ
      додаток) лікар-терапевт самостійно призначає Коаксил табл. 12,5 мг № 30 по 1 табл. 3 р / добу. внутрішньо до їди. Курс лікування - 30 днів і більше. При припиненні лікування рекомендується поступово зменшувати дозу препарату протягом 7-4 днів. Одночасне призначення коаксила з інгібіторами МАО неприпустимо (піразидол, іналамід). При заміні терапії інгібіторами МАО на лікування коаксилом необхідно
  5.  Література
      Алергічні захворювання / За ред. В.І. Пицкого.-М.: «Тріада-Х», 1999.-470 с. 2. Алергологія - 2006: Клінічні рекомендації / Ред. P.M. Хаитов, Н.І. Ільіна.-М.: «ГЕОТАР-Медіа», 2006.-227 с. 3. Ардашев В.Н. Лікування порушень серцевого ритму / В.Н.Ардашев, А.В. Ардашев, В.І.Стеклов / / М.: Медпрактика, 2005.-224 с. 4. Верткин А.Л. Рекомендації з ведення порушень ритму на етапі
  6.  ПОЛОГОВОЇ АКТ.
      докладання його дії є гладком'язових клітина міометрія. Через спеціальні білки-рецептори на мембрані цитоплазми за участю АТФ, естрогенів і кальцію він знижує потенціал спокою клітини, генерується потенціал дії, з'являється здатність до спонтанного збудження і скорочення. Подібно окситацин діють простагландини, брадикінін і серотонін. 3 рівень -
  7.  ОРГАНІЗАЦІЯ РОБОТИ ЖІНОЧОЇ КОНСУЛЬТАЦІЇ Диспансерне спостереження ВАГІТНИХ
      додаток № 2). Вагітних навчають правилам особистої гігієни та готують до майбутнього материнства в "Школах материнства", організованих в жіночих консультаціях з використанням демонстративних матеріалів, наочних посібників, технічних засобів і предметів догляду за дитиною. До відвідування "Школи материнства" слід залучати всіх жінок з ранніх термінів вагітності. Вагітним слід роз'яснювати
  8.  Акушерських щипців І ВАКУУМ-ЕКСТРАКЦІЯ
      прикладання сили при її введенні. Першою вводять ліву ложку щипців. Стоячи, лікар вводить в піхву чотири пальці правої руки (полуруку) в ліву половину таза, відокремлюючи голівку плоду від м'яких тканин родового каналу. Великий палець залишається зовні. Взявши лівою рукою ліву гілку щипців, рукоятку відводять в праву сторону, встановлюючи її майже паралельно правому паховому згину. Верхівку ложки
  9.  6. Новинки лікувально-проффілактіческіх засобів.
      додаток). - впливу на меридіани Чун Май і Жень Май. Китайські цілителі вважають статеві органи країнами життя, з'єднаними з усіма іншими залозами і органами, особливо з гіпофізом, з нирками, печінкою, легенями і серцем. Щоденні гігієнічні прокладки мають наступні властивості: - нормалізують рН-баланс слизової і шкіри зовнішніх статевих органів; - знижують рівень
  10.  1.2. Внепродуктівние органи репродуктивної системи
      додатки модулюючого дії статевих гормонів. Можливо, для предовуляторного підйому гонадотропінів необхідний різкий викид ГОЛ. Це припущення підтверджується демонстрацією раптового падіння концентрації рецепторів ГЛ, яке збігається з передовуляторним підйомом гонадотропінів [94]. Є докази і предовуляторного підйому ГЛ [93]. Останній був недавно продемонстрований в
загрузка...

© medbib.in.ua - Медична Бібліотека
загрузка...