Терминология таблицы распределения частот
Прежде чем перейти к обсуждению того, как создать таблицу распределения частот в Excel, сначала я хочу познакомить вас с терминологией таблицы распределения частот.
Посмотрите на следующие цифры. Это оценки по математике 20 студентов на экзамене.
40, 43, 54, 62, 88, 31, 94, 83, 81, 75, 62, 53, 62, 83, 90, 67, 58, 100, 74, 59
Просто представьте себя учителем этих студентов.
Вы должны следовать следующей политике оценки, чтобы оценивать студентов:
Числовые оценки | Буквенная оценка |
>=80 | A |
70-79 | A- |
60-69 | B |
50-59 | C |
40-49 | D |
<40 | F |
Ваша задача — классифицировать приведенные выше оценки, чтобы выяснить –
- Сколько студентов получили
- Сколько студентов получили-
- Сколько студентов получили B
- Сколько студентов получили C
- Сколько студентов получили D
- И сколько студентов провалили экзамен (оценка F).
Подробнее: Как использовать формулу сложных процентов в Excel
Поскольку число учащихся составляет всего 20 человек, вы можете создать таблицу https://goo-table.ru/ распределения частот вручную, не используя никаких формул или сложных инструментов (например, сводную таблицу) в Excel. Но если вы статистик или работаете с большими данными, вам, возможно, придется иметь дело с тысячами чисел, если не с миллионами чисел. И одно можно сказать наверняка: вы не сможете избежать ошибок, которые могут возникнуть в результате ручного процесса.
На следующем рисунке вы видите, что я создал таблицу распределения частот. Я сделал это вручную, и это просто для того, чтобы познакомить вас с терминами, связанными с таблицей распределения частот.
- Ячейка: на изображении выше есть 6 ячеек. Они >=80, 70-79, 60-69, 50-59, 40-49, и < 40.
- Размер ячейки: размер первой ячейки (> = 80) равен 21. Как от 80 до 100, есть 21 число. Размер второй ячейки (70-79), третьей ячейки (60-69), четвертой ячейки (50-59) и пятой ячейки (40-49) равен 10, поскольку в каждой ячейке 10 чисел. Размер последней ячейки (<40) равен 40, так как от 0 до 39 имеется 40 значений.
- Частота: Частота — это количество значений, подсчитываемых для ячейки. Например, для ячейки 70-79 мы нашли 2 оценки. Таким образом, частота ячейки 70-79 равна 2. Для ячейки 50-59 мы нашли 4 балла. Таким образом, частота ячейки 50-59 равна 4.
- Совокупная частота: вы получаете совокупную частоту из стандартной частоты. На приведенном выше изображении вы видите столбец с совокупной частотой. Первая частота равна 7, что совпадает со стандартной частотой 7 слева. Следующая совокупная частота равна 9. 9 получается суммированием стандартной частоты 7 и 2 (7 + 2 = 9). Таким же образом вы можете найти следующую совокупную частоту 13 (7+2+4 ), следующий 17 ( 7+2+4+4), следующая совокупная частота 19 ( 7+2+4+4+2), и последний 20 ( 7+2+4+4+2+1 ).
Итак, теперь вы знаете терминологию, связанную с таблицей распределения частот.
Сначала подготовьте свои данные
Прежде чем создавать таблицу распределения частот в Excel, необходимо подготовить данные следующими способами:
- Сначала найдите наименьшее и наибольшее значение из вашего набора данных. Вы можете использовать функции Excel MIN () и MAX (), чтобы узнать наименьшее и наибольшее значение соответственно. Или вы можете использовать функции Excel: сортировать наименьшее по величине, сортировать наибольшее по наименьшему или сортировать для сортировки данных, а затем находить наименьшее и наибольшее значения из набора данных. Я предпочитаю, чтобы вы использовали MIN () и MAX () . Эти два не изменят ваше расположение данных.
- Затем решите, сколько ячеек вы хотите создать. Лучше сохранить количество ячеек в диапазоне от 5 до 15. Идеально подходит 10 ячеек.
- Размер ячейки будет зависеть от того, сколько ячеек вы хотите создать. Допустим, наименьшее значение равно 23, а наибольшее значение равно 252. И вы хотите создать 10 ячеек. Ваш размер ячейки будет: (Наибольшее значение – наименьшее значение) / Размер ячейки = (252-23)/10=22.9. 22.9 или 23 — это неподходящий размер ячейки. Я делаю это 25.
- Теперь пришло время решить, с чего вы начнете свои ячейки. Для приведенного выше примера не рекомендуется начинать с номера 23. Давайте начнем с номера 21. Итак, ячейки будут: 21-45, 46-70, 71-95, 96-120, 121-145, 146-170, 171-195, 196-220, 221-245, и 246-270. [если вы используете шаблон FreqGen Excel, вам не нужно беспокоиться о создании этих ячеек вручную, шаблон создает эти ячейки для вас автоматически.]
- В функции Frequency () есть параметр bins_array. Чтобы найти этот bins_array, вы должны использовать наибольшее значение из ячеек. Например, для вышеуказанных ячеек bins_array будет: 45, 70, 95, 120, 145, 170, 195, 220, 245, и 270. Просто запомните эту информацию. Если вы не понимаете, не волнуйтесь. Концепция станет для вас более понятной, когда вы закончите этот урок.