Чи можна відмітити стандартне відхилення необоротних балів як стандартне відхилення відсотків?

Freya 10/04/2017. 1 answers, 398 views
mean standard-deviation percentage

Припустимо, у нас є тест, що складається з 30 питань, і 10 людей приймають цей тест. Середня оцінка тестів для цих 10 людей становить 17, а стандартне відхилення всіх балів у зразку - 4. При поданні описової статистики в школі ми використовуємо ці необоротні оцінки і пишемо ( M = 17, SD = 4); але в деяких випадках я відчуваю, що відсоток звітування буде кращим. Тому що я думаю, що ми маємо більш інтуїтивне розуміння того, що означає забивати 56,7 за 100, ніж забити 17 за 30 (напевно, тому що ми звикли до десяткової системи).

Отже, для прикладу, наведеного вище, чи можна було б повідомити середнє та стандартне відхилення як ( M = 56,7%, SD = 13,3%)?

Чи має сенс сказати, що іспитові оцінки в зразку мають стандартне відхилення 13,3%?

Ці відсотки є арифметичним еквівалентом незавершених оцінок, які склав і наведений вище, але я не впевнений, що це хороша практика, щоб безпосередньо конвертувати їх у такі відсотки.

5 Comments
IWS 10/04/2017
AFAIK ви можете перетворити безперервні змінні на інший масштаб і показати розподіл в цьому масштабі, якщо ви зрозуміли, як ви там перейшли. Однак у вашому випадку ви можете задатися питанням, чи відповідає сироваткова оцінка, отримана з 30 питань, достатньо інформації для перетворення на безперервний масштаб в межах від 0 до 100% (оскільки дані підтримують лише збільшення на 3,33%).
Freya 10/04/2017
Так, це правда. Оцінка понад 30 не є настільки інформативною, як конвертована оцінка (понад 100), оскільки збільшення на 100 менше (1), і тому тест понад 100 балів буде більш "чутливим" за умови, що всі оцінки є цілими числами. Тим не менш, якщо врахувати вашу відповідь, я думаю, що в моєму випадку це не буде розглядатися як "зловживання", щоб повідомити про це таким чином. (Я насправді готую завдання до школи, і я буду повідомляти про сирі ознаки і SD в тексті, але я просто вважаю, що буде більше сенсу показати ці оцінки як відсотки у таблицях і графіках). З того, що я розумію, це буде здійснено.
Freya 10/04/2017
І дуже дякую за вашу відповідь.
IWS 10/04/2017
Просто для завершення: пам'ятайте, що деякі перетворення можуть фактично змінити форму дистрибутиву, тому не слід застосовувати перетворення, які потрібно застосувати до даних, безпосередньо до місця розміщення та розповсюдження. Замість цього застосовуйте перетворення до ваших даних, а потім оцініть розміри місця розташування та розповсюджуйте, як якщо б це були оригінальні дані (тобто перевизначте середнє значення та SD у вашому випадку).
James 10/04/2017
Технічно, як міра відстані, а не місця розташування, SD буде відсотковим пунктом (pp), а не відсотком. Я також буду насторожити, щоб інтерпретувати це в цьому контексті, оскільки модель помилки повинна враховувати, що шкала є дискретною, як згадував @freya.

1 Answers


Hugh Perkins 10/04/2017.

Стандартне відхилення - це просто статистична властивість, яку ви можете виміряти для набору точок даних. Стандартне відхилення не дає жодних припущень про те, що ваші дані, як правило, поширюються або не пройшли жодних перетворень, лінійних або іншим чином.

Тому абсолютно прийнятно використовувати стандартне відхилення від будь-яких даних, включаючи відсоткові оцінки.

Зауважте, що у вашому конкретному випадку перетворення, яке ви застосовуєте, є лінійним перетворенням форми:

$ $ y = Ax + b $ $

тобто афінним перетворенням. Таким чином, ви можете обчислити стандартне відхилення оригінальних, неперенормованих даних, а потім помножити на A щоб отримати стандартне відхилення після перетворення. Здається, немає особливої ​​переваги для цього, а не просто обчислення стандартного відхилення вже перетворених даних, але це може бути обнадійливим.

Ми бачимо, що афінне перетворення перетворить стандартне відхилення лінійно на $ A $ таким чином:

Якщо ввести дані $ \ (X_1, X_2, ..., X_n \) $, то вихідне стандартне відхилення $ \ sigma $ буде задано:

$$ \ sigma_X ^ 2 = \ frac (1) (n) \ sum_ (i = 1) ^ n \ left (X_i - \ frac (1) (n) \ sum_ (j = 1) ^ n X_j \ right) ^ 2 $$

Давайте застосуємо перетворення $ Y = AX + b $. Тоді ми маємо

$$ \ sigma_Y ^ 2 = \ frac {1} {n} \ sum_ (i = 1) ^ n \ left (AX_i + b - \ frac {1} {n} \ sum_ (j = 1) ^ n \ left (AX_j + b \ right) \ right) ^ 2 $ $

$$ = \ frac {1} {n} \ sum_ (i = 1) ^ n \ left (AX_i + b - n \ frac {1} {n} b - \ frac {1} {n} \ sum_ {j = 1} ^ n \ left (AX_j \ right) \ right) ^ 2 $$

$$ = \ frac {1} {n} \ sum_ (i = 1) ^ n \ left (AX_i - \ frac {1} {n} \ sum_ (j = 1) ^ n \ left (AX_j \ right) \ праворуч) ^ 2 $ $

$$ = A ^ 2 \ left (\ frac {1} {n} \ sum_ (i = 1) ^ n \ left (X_i - \ frac {1} {n} \ sum_ (j = 1) ^ n \ left (X_j \ right) \ right) ^ 2 \ right) $ $

$$ = A ^ 2 \ sigma_X ^ 2 $$

Тому

$ $ \ sigma_Y = A \ sigma_X. $ $

2 comments
Freya 10/04/2017
Це насправді дуже корисно і висвітлює. Дякую.
1 Hugh Perkins 10/05/2017
@ фрея спасибо! Не думайте ... якщо ви відчуваєте, що ця відповідь є в порядку, чи не натискаєте зелений галочок ліворуч від відповіді, щоб позначити його як "прийнятий"?

Related questions

Hot questions

Language

Popular Tags