Измерения. Типы данных
Задачи для самостоятельного решения по теме 3
«Измерения. Типы данных
1. Выстройте иерархию и упорядочение шкал. Представьте это при помощи графа.
2. Приведите пример величин, допускающих измерение в порядковой, линейной и абсолютной шкалах.
3. Приведите пример величины, для которой неприемлемо измерение в и абсолютной шкале.
4. Какие средние по Коши не являются средними по Колмогорову?
Средней величиной по Коши является любая функция такая, что при всех возможных значениях аргументов значение этой функции не меньше, чем минимальное из чисел
, и не больше, чем максимальное из этих чисел. Среднее по Колмогорову для действительных чисел
— величина вида
где — непрерывная строго монотонная функция,
— функция, обратная к
.
При получают среднее арифметическое, при
— среднее геометрическое, при
— среднее гармоническое, при
— среднее квадратическое, при
— среднее степенное. Такая функция
обладает свойствами непрерывности, монотонности по каждому
, симметричности. Среднее от одинаковых чисел равно их общему значению.
В соответствии с теорией измерений для усреднения данных, измеренных в шкале интервалов, из всех средних Колмогорова можно использовать только среднее арифметическое, а для усреднения данных, измеренных в шкале отношений, из всех средних Колмогорова можно использовать только степенные средние и среднее геометрическое
5. Для значений 2,5; 4,1; 5; 5; 7,2; 11; 14; 19; 23 найти моду, медиану, квартили. Проранжируем ряд. Для этого сортируем его значения по возрастанию.
Таблица для расчета показателей.
x |
|x - xср| |
(x-xср)2 |
2.5 |
7.6 |
57.6 |
4.1 |
6 |
35.9 |
5 |
5.1 |
25.9 |
5 |
5.1 |
25.9 |
7.2 |
2.9 |
8.3 |
11 |
0.9 |
0.8 |
14 |
3.9 |
15.3 |
19 |
8.9 |
79.4 |
23 |
12.9 |
166.7 |
90.8 |
53.3 |
415.8 |
Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения.
Простая средняя арифметическая
Мода – наиболее часто встречающееся значение признака у единиц данной совокупности. Значение ряда 5 встречается всех больше (2 раз). Следовательно, мода равна x = 5.
Медиана – значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных.
Находим середину ранжированного ряда: h = (n+1)/2 = (9+1)/2 = 5. Этому номеру соответствует значение ряда 7.2. Следовательно, медиана Me = 7.2
В симметричных рядах распределения значение моды и медианы совпадают со средней величиной (xср=Me=Mo), а в умеренно асимметричных они соотносятся таким образом: 3(xср-Me) ≈ xср-Mo
Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1, 25% будут заключены между Q1 и Q2, 25% - между Q2 и Q3. Остальные 25% превосходят Q3.
Находим 1/4 ранжированного ряда: h = (n+1)/4 = (9+1)/4 = 2. Этому номеру соответствует значение ряда 4.1. Следовательно, квартиль Q1 = 4.1
Находим 3/4 ранжированного ряда: h = 3(n+1)/4 = 3(9+1)/4 = 7. Этому номеру соответствует значение ряда 14. Следовательно, квартиль Q3 = 14
6. Докажите, что для двух положительных чисел среднее арифметическое не меньше среднего геометрического. Докажите, что равенство их возможно только тогда, когда оба числа совпадают.
Оказывается, среднее арифметическое нескольких неотрицательных чисел не меньше их среднего геометрического:
(1) причём равенство в (1) достигается лишь в случае a1 = a2 = . . . = an. Неравенство (1) называется неравенством Коши.
Для двух чисел неравенство Коши имеет вид: (2)
Для доказательства составим разность и преобразуем:
Очевидно, что , причём равенство достигается лишь при a = b.
7. Дана выборка: {68; 57; 85; 22; 45; 50; 16; 53; 63; 63; 64; 55; 65; 89; 4; 51; 58; 76; 35; 57; 59; 39; 91; 41; 22; 57; 36; 77; 86; 38; 46; 61; 33; 80; 65; 10; 84; 97; 24; 81; 38; 32; 23; 9; 68}. Найдите среднее выборочное, моду и медиану. Проранжируем ряд. Для этого сортируем его значения по возрастанию.
Таблица для расчета показателей.
x |
|x - xср| |
(x-xср)2 |
4 |
48.733333333333 |
2374.9377777778 |
9 |
43.733333333333 |
1912.6044444444 |
10 |
42.733333333333 |
1826.1377777778 |
16 |
36.733333333333 |
1349.3377777778 |
22 |
30.733333333333 |
944.53777777778 |
22 |
30.733333333333 |
944.53777777778 |
23 |
29.733333333333 |
884.07111111111 |
24 |
28.733333333333 |
825.60444444444 |
32 |
20.733333333333 |
429.87111111111 |
33 |
19.733333333333 |
389.40444444444 |
35 |
17.733333333333 |
314.47111111111 |
36 |
16.733333333333 |
280.00444444444 |
38 |
14.733333333333 |
217.07111111111 |
38 |
14.733333333333 |
217.07111111111 |
39 |
13.733333333333 |
188.60444444444 |
41 |
11.733333333333 |
137.67111111111 |
45 |
7.7333333333333 |
59.804444444444 |
46 |
6.7333333333333 |
45.337777777778 |
50 |
2.7333333333333 |
7.4711111111111 |
51 |
1.7333333333333 |
3.0044444444444 |
53 |
0.26666666666667 |
0.071111111111111 |
55 |
2.2666666666667 |
5.1377777777778 |
57 |
4.2666666666667 |
18.204444444444 |
57 |
4.2666666666667 |
18.204444444444 |
57 |
4.2666666666667 |
18.204444444444 |
58 |
5.2666666666667 |
27.737777777778 |
59 |
6.2666666666667 |
39.271111111111 |
61 |
8.2666666666667 |
68.337777777778 |
63 |
10.266666666667 |
105.40444444444 |
63 |
10.266666666667 |
105.40444444444 |
64 |
11.266666666667 |
126.93777777778 |
65 |
12.266666666667 |
150.47111111111 |
65 |
12.266666666667 |
150.47111111111 |
68 |
15.266666666667 |
233.07111111111 |
68 |
15.266666666667 |
233.07111111111 |
76 |
23.266666666667 |
541.33777777778 |
77 |
24.266666666667 |
588.87111111111 |
80 |
27.266666666667 |
743.47111111111 |
81 |
28.266666666667 |
799.00444444444 |
84 |
31.266666666667 |
977.60444444444 |
85 |
32.266666666667 |
1041.1377777778 |
86 |
33.266666666667 |
1106.6711111111 |
89 |
36.266666666667 |
1315.2711111111 |
91 |
38.266666666667 |
1464.3377777778 |
97 |
44.266666666667 |
1959.5377777778 |
2373 |
881.33333333333 |
25188.8 |
Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения.
Простая средняя арифметическая
Мода – наиболее часто встречающееся значение признака у единиц данной совокупности. Значение ряда 57 встречается всех больше (3 раз). Следовательно, мода равна x = 57.
Медиана – значение признака, которое делит единицы ранжированного ряда на две части. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медиана служит хорошей характеристикой при ассиметричном распределении данных, т.к. даже при наличии "выбросов" данных, медиана более устойчива к воздействию отклоняющихся данных.
Находим середину ранжированного ряда: h = (n+1)/2 = (45+1)/2 = 23. Этому номеру соответствует значение ряда 57. Следовательно, медиана Me = 57
В симметричных рядах распределения значение моды и медианы совпадают со средней величиной (xср=Me=Mo), а в умеренно асимметричных они соотносятся таким образом: 3(xср-Me) ≈ xср-Mo
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации - разность между максимальным и минимальным значениями признака первичного ряда. R = xmax - xmin = 97 - 4 = 93
Среднее линейное отклонение - вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
Каждое значение ряда отличается от другого в среднем на 20
Дисперсия - характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
Среднее квадратическое отклонение.
Каждое значение ряда отличается от среднего значения 53 в среднем на 23.659
Выводы:
Каждое значение ряда отличается от среднего значения 53 в среднем на 23.659. Среднее значение примерно равно моде и медиане, что свидетельствует о нормальном распределении выборки.
8. Дана последовательность чисел: {84; 25; 47; 4; 33; 52; 13; 77; 53; 50; 98; 16; 72; 18; 76; 93; 37; 79; 52; 33; 34; 3; 74; 34; 79; 14; 70; 2; 80; 92; 44; 5; 53; 65; 29; 77; 97; 13; 18; 79; 64; 88; 41; 25; 43; 9; 87; 4; 23; 82; 29; 61}. Составьте вариационный ряд, разбив область изменения на 10 интервалов. Найдите среднее вариационного ряда.
Таблица для расчета показателей.
xi |
Кол-во, fi |
xi·fi |
Накопленная частота, S |
|x-xср|·fi |
(x-xср)2·fi |
Относительная частота, fi/f |
2 |
1 |
2 |
1 |
46.654 |
2176.581 |
0.0192 |
3 |
1 |
3 |
2 |
45.654 |
2084.274 |
0.0192 |
4 |
2 |
8 |
4 |
89.308 |
3987.932 |
0.0385 |
5 |
1 |
5 |
5 |
43.654 |
1905.658 |
0.0192 |
9 |
1 |
9 |
6 |
39.654 |
1572.428 |
0.0192 |
13 |
2 |
26 |
8 |
71.308 |
2542.393 |
0.0385 |
14 |
1 |
14 |
9 |
34.654 |
1200.889 |
0.0192 |
16 |
1 |
16 |
10 |
32.654 |
1066.274 |
0.0192 |
18 |
2 |
36 |
12 |
61.308 |
1879.317 |
0.0385 |
23 |
1 |
23 |
13 |
25.654 |
658.12 |
0.0192 |
25 |
2 |
50 |
15 |
47.308 |
1119.009 |
0.0385 |
29 |
2 |
58 |
17 |
39.308 |
772.547 |
0.0385 |
33 |
2 |
66 |
19 |
31.308 |
490.086 |
0.0385 |
34 |
2 |
68 |
21 |
29.308 |
429.47 |
0.0385 |
37 |
1 |
37 |
22 |
11.654 |
135.812 |
0.0192 |
41 |
1 |
41 |
23 |
7.654 |
58.581 |
0.0192 |
43 |
1 |
43 |
24 |
5.654 |
31.966 |
0.0192 |
44 |
1 |
44 |
25 |
4.654 |
21.658 |
0.0192 |
47 |
1 |
47 |
26 |
1.654 |
2.735 |
0.0192 |
50 |
1 |
50 |
27 |
1.346 |
1.812 |
0.0192 |
52 |
2 |
104 |
29 |
6.692 |
22.393 |
0.0385 |
53 |
2 |
106 |
31 |
8.692 |
37.778 |
0.0385 |
61 |
1 |
61 |
32 |
12.346 |
152.428 |
0.0192 |
64 |
1 |
64 |
33 |
15.346 |
235.504 |
0.0192 |
65 |
1 |
65 |
34 |
16.346 |
267.197 |
0.0192 |
70 |
1 |
70 |
35 |
21.346 |
455.658 |
0.0192 |
72 |
1 |
72 |
36 |
23.346 |
545.043 |
0.0192 |
74 |
1 |
74 |
37 |
25.346 |
642.428 |
0.0192 |
76 |
1 |
76 |
38 |
27.346 |
747.812 |
0.0192 |
77 |
2 |
154 |
40 |
56.692 |
1607.009 |
0.0385 |
79 |
3 |
237 |
43 |
91.038 |
2762.667 |
0.0577 |
80 |
1 |
80 |
44 |
31.346 |
982.581 |
0.0192 |
82 |
1 |
82 |
45 |
33.346 |
1111.966 |
0.0192 |
84 |
1 |
84 |
46 |
35.346 |
1249.351 |
0.0192 |
87 |
1 |
87 |
47 |
38.346 |
1470.428 |
0.0192 |
88 |
1 |
88 |
48 |
39.346 |
1548.12 |
0.0192 |
92 |
1 |
92 |
49 |
43.346 |
1878.889 |
0.0192 |
93 |
1 |
93 |
50 |
44.346 |
1966.581 |
0.0192 |
97 |
1 |
97 |
51 |
48.346 |
2337.351 |
0.0192 |
98 |
1 |
98 |
52 |
49.346 |
2435.043 |
0.0192 |
Итого |
52 |
2530 |
1338 |
44593.769 |
1 |
xi |
Кол-во, fi |
2 - 5 |
5 |
9 -16 |
5 |
18 - 29 |
7 |
33 - 41 |
6 |
43 - 50 |
4 |
52 - 64 |
6 |
65 - 74 |
4 |
76 - 80 |
7 |
82 -88 |
4 |
92 - 98 |
4 |
Итого |
52 |
9. Для последовательности примера 8 найдите средне выборочное. Сравните его со средним вариационного ряда.
Таблица для расчета показателей.
xi |
Кол-во, fi |
xi·fi |
Накопленная частота, S |
|x-xср|·fi |
(x-xср)2·fi |
Относительная частота, fi/f |
2 |
1 |
2 |
1 |
46.654 |
2176.581 |
0.0192 |
3 |
1 |
3 |
2 |
45.654 |
2084.274 |
0.0192 |
4 |
2 |
8 |
4 |
89.308 |
3987.932 |
0.0385 |
5 |
1 |
5 |
5 |
43.654 |
1905.658 |
0.0192 |
9 |
1 |
9 |
6 |
39.654 |
1572.428 |
0.0192 |
13 |
2 |
26 |
8 |
71.308 |
2542.393 |
0.0385 |
14 |
1 |
14 |
9 |
34.654 |
1200.889 |
0.0192 |
16 |
1 |
16 |
10 |
32.654 |
1066.274 |
0.0192 |
18 |
2 |
36 |
12 |
61.308 |
1879.317 |
0.0385 |
23 |
1 |
23 |
13 |
25.654 |
658.12 |
0.0192 |
25 |
2 |
50 |
15 |
47.308 |
1119.009 |
0.0385 |
29 |
2 |
58 |
17 |
39.308 |
772.547 |
0.0385 |
33 |
2 |
66 |
19 |
31.308 |
490.086 |
0.0385 |
34 |
2 |
68 |
21 |
29.308 |
429.47 |
0.0385 |
37 |
1 |
37 |
22 |
11.654 |
135.812 |
0.0192 |
41 |
1 |
41 |
23 |
7.654 |
58.581 |
0.0192 |
43 |
1 |
43 |
24 |
5.654 |
31.966 |
0.0192 |
44 |
1 |
44 |
25 |
4.654 |
21.658 |
0.0192 |
47 |
1 |
47 |
26 |
1.654 |
2.735 |
0.0192 |
50 |
1 |
50 |
27 |
1.346 |
1.812 |
0.0192 |
52 |
2 |
104 |
29 |
6.692 |
22.393 |
0.0385 |
53 |
2 |
106 |
31 |
8.692 |
37.778 |
0.0385 |
61 |
1 |
61 |
32 |
12.346 |
152.428 |
0.0192 |
64 |
1 |
64 |
33 |
15.346 |
235.504 |
0.0192 |
65 |
1 |
65 |
34 |
16.346 |
267.197 |
0.0192 |
70 |
1 |
70 |
35 |
21.346 |
455.658 |
0.0192 |
72 |
1 |
72 |
36 |
23.346 |
545.043 |
0.0192 |
74 |
1 |
74 |
37 |
25.346 |
642.428 |
0.0192 |
76 |
1 |
76 |
38 |
27.346 |
747.812 |
0.0192 |
77 |
2 |
154 |
40 |
56.692 |
1607.009 |
0.0385 |
79 |
3 |
237 |
43 |
91.038 |
2762.667 |
0.0577 |
80 |
1 |
80 |
44 |
31.346 |
982.581 |
0.0192 |
82 |
1 |
82 |
45 |
33.346 |
1111.966 |
0.0192 |
84 |
1 |
84 |
46 |
35.346 |
1249.351 |
0.0192 |
87 |
1 |
87 |
47 |
38.346 |
1470.428 |
0.0192 |
88 |
1 |
88 |
48 |
39.346 |
1548.12 |
0.0192 |
92 |
1 |
92 |
49 |
43.346 |
1878.889 |
0.0192 |
93 |
1 |
93 |
50 |
44.346 |
1966.581 |
0.0192 |
97 |
1 |
97 |
51 |
48.346 |
2337.351 |
0.0192 |
98 |
1 |
98 |
52 |
49.346 |
2435.043 |
0.0192 |
Итого |
52 |
2530 |
1338 |
44593.769 |
1 |
Для оценки ряда распределения найдем следующие показатели:
Средняя взвешенная (выборочная средняя)
Среднее квадратическое отклонение.
Каждое значение ряда отличается от среднего значения 49 в среднем на 29.284.
10. Для выборки примера 7 найдите квартили. Квартили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 25% единиц совокупности будут меньше по величине Q1, 25% будут заключены между Q1 и Q2, 25% - между Q2 и Q3. Остальные 25% превосходят Q3. Находим 1/4 ранжированного ряда: h = n/4 = 52/4 = 13. Ранжированный ряд включает четное число единиц, следовательно квартиль Q1 определяется как среднее из двух значений: (23 + 25)/2 = 24. Находим 3/4 ранжированного ряда: h = 3n/4 = 3*52/4 = 39. Q3 = (77 + 77)/2 = 77
11. Для выборки примера 8 найдите децили.
12. Пусть несколько человек по Вашей просьбе независимо друг от друга напишут на бумаге значение, которое соответствует его представлению термина «много» («большое число»). Результаты обсудите. Все респонденты сошлись во мнении, что много - большое количество, значительное число кого-либо, чего-либо. В числовом значении были такие варианты: 1 000 000, 1 000 000, 10000000000000000000000000000000000000000000000
13. Повторите опыт задачи 12 с другой формулировкой: «большая зарплата». Сравните с результатом задачи 12. Объясните различие результатов.
Большая зарплата – 100000.
Большая зарплата – 1 000 000.
Большая зарплата – 500 000.
В данном случае респонденты в основном указывали меньшее значение чем в предыдущем.
14. Число m принадлежит интервалу (1,9; 2,2). Число n − интервалу (2,95; 3,05). Каким интервалам принадлежат числа m + n; m − n; m∙n; m / n.
m + n принадлежит интервалу (4, 95; 5,25);
m – n принадлежит интервалу (0,85; 1,15);
m∙n принадлежит интервалу (5,605; 6,71);
m / n принадлежит интервалу (1,55; 1,39).
15. Сделайте по своему усмотрению упорядоченные метки для определения расстояния. Сопоставьте им числовые значения. Тем самым определена лингвистическая переменная.
16. Пусть несколько человек по Вашей просьбе независимо друг от друга напишут на бумаге упорядоченные метки расплывчатого понятия «Скоро сессия» и сопоставят им числовые значения (сколько именно месяцев, недель, дней соответствует каждой метке). Результаты сравните и обсудите.