Unit 6 Measures of Central Tendency focus points notes only
A measure of central tendency will represent whole of the distribution i.e..
measure of central tendency summarises data in a single value which represent
the entire data.
കേന്ദ്ര പ്രവണതയുടെ അളവ് വിതരണത്തെ മുഴുവനായും പ്രതിനിധീകരിക്കും അതായത്. കേന്ദ്ര പ്രവണതയുടെ അളവ്, മുഴുവൻ ഡാറ്റയെയും പ്രതിനിധീകരിക്കുന്ന ഒരൊറ്റ മൂല്യത്തിൽ ഡാറ്റ സംഗ്രഹിക്കുന്നു.
Importance of Measures of central tendency
- To find representative value
- To condense data
- To make comparison
- Helpful in further statistical analysis
- പ്രതിനിധി മൂല്യം കണ്ടെത്താൻ
- ഡാറ്റ സംഗ്രഹിക്കാൻ
- താരതമ്യം ചെയ്യാൻ
- കൂടുതൽ സ്ഥിതിവിവര വിശകലനത്തിന് സഹായകമാണ്
Qualities of a good average
- It should be rigidly defined
- It should be representative of the entire data
- It should be based of all observation
- It should be easily calculated
- It should be capable of easy interpretation.
- It should be capable of further mathematical calculation
- It should not be influenced by the extreme value
- അത് കർശനമായി നിർവചിക്കേണ്ടതാണ്
- ഇത് മുഴുവൻ ഡാറ്റയുടെയും പ്രതിനിധിയായിരിക്കണം
- അത് എല്ലാ നിരീക്ഷണങ്ങളുടെയും അടിസ്ഥാനത്തിലായിരിക്കണം
- ഇത് എളുപ്പത്തിൽ കണക്കാക്കണം
- അത് എളുപ്പത്തിൽ വ്യാഖ്യാനിക്കാവുന്നതായിരിക്കണം.
- ഇത് കൂടുതൽ ഗണിതശാസ്ത്രപരമായ കണക്കുകൂട്ടലിന് പ്രാപ്തമായിരിക്കണം
- അത് അങ്ങേയറ്റത്തെ മൂല്യത്താൽ സ്വാധീനിക്കപ്പെടരുത്
Types of Averages
- Arithmetic Mean ഗണിത ശരാശരി
- Median മീഡിയൻ
- Mode മോഡ്
- Arithmetic Mean
It is defined as the sum of the values of all items divided by the number of items. It is denoted by x¯ Arithmetic mean maybe of two types; Simple Arithmetic Mean and Weighted Arithmetic Mean.
എല്ലാ ഇനങ്ങളുടെയും മൂല്യങ്ങളെ ഇനങ്ങളുടെ എണ്ണം കൊണ്ട് ഹരിച്ചാൽ ലഭിക്കുന്ന തുകയാണ് അരിത്മെറ്റിക് അർത്ഥം. ഇത് x¯ ഗണിത ശരാശരി കൊണ്ട് സൂചിപ്പിക്കുന്നു, രണ്ട് തരത്തിലായിരിക്കാം; ലളിതമായ ഗണിത ശരാശരിയും തൂക്കമുള്ള ഗണിത ശരാശരിയും.
Weighted Arithmetic Mean വെയ്റ്റഡ് അരിത്മെറ്റിക് ശരാശരി
Combined Mean സംയോജിത ശരാശരി
The Mean age of 40 students is 16 years and the mean age of another group of 60students is 20 years. Find out the mean age of 100 students combined together.
Correction in mean തിരുത്തൽ
The average marks secured by 50 students was 44 . Later on it was discovered thatscore of 36 was takenas56. Correct the mean.
Total value of observation ( incorrect value) = 44 × 50 =2200
Correct total value = 2200 – 56 + 36 = 2180 ;
Correct Mean =2180/50 =43.6
Median
Median is
the middle value. It divides the series into two parts. This is the value that
comes in the middle when arranged in ascending or descending order according to
magnitude.
മീഡിയൻ മധ്യ മൂല്യമാണ്. ഇത് പരമ്പരയെ രണ്ട് ഭാഗങ്ങളായി വിഭജിക്കുന്നു. മാഗ്നിറ്റ്യൂഡ് അനുസരിച്ച് ആരോഹണക്രമത്തിലോ അവരോഹണത്തിലോ ക്രമീകരിക്കുമ്പോൾ മധ്യത്തിൽ വരുന്ന മൂല്യമാണിത്.
1.Individual series
N=Total number of items
Calculate Median from the following
15, 20, 25, 28, 16, 18, 17, 9, 11
Ascending Order 9, 11, 15, 16, 17, 18, 20, 25, 28
2.Discrete series
Arrange the series in ascending or descending order according to
magnitude.
മാഗ്നിറ്റ്യൂഡ് അനുസരിച്ച് സീരീസ് ആരോഹണ അല്ലെങ്കിൽ അവരോഹണ ക്രമത്തിൽ ക്രമീകരിക്കുക.
When the data is continuous and in the form of a frequency distribution, the median is found as shown below:
ഡാറ്റ തുടർച്ചയായും ഫ്രീക്വൻസി ഡിസ്ട്രിബ്യൂഷന്റെ രൂപത്തിലും ആയിരിക്കുമ്പോൾ, ചുവടെ കാണിച്ചിരിക്കുന്നതുപോലെ മീഡിയൻ കാണപ്പെടുന്നു:
where,
- L = lower limit of median class
- cf = cumulative frequency of the class preceding the median class
- f = frequency of the median class
- i = class size
- L = മീഡിയൻ ക്ലാസ്സിന്റെ താഴ്ന്ന പരിധി
- cf = മീഡിയൻ ക്ലാസ്സിന് മുമ്പുള്ള ക്ലാസ്സിന്റെ ക്യുമുലേറ്റീവ് ഫ്രീക്വൻസി
- f = മീഡിയൻ ക്ലാസ്സിന്റെ ആവൃത്തി
- i = ക്ലാസ് വലിപ്പം
Let's consider the following example to understand this better.
Example: Find the median marks for the following distribution:
Classes | 0-10 | 10-20 | 20-30 | 30-40 | 40-50 |
Frequency | 2 | 12 | 22 | 8 | 6 |
Solution:
We need to calculate the cumulative frequencies to find the median.
Calculation table:
Classes | Number of students | Cumulative frequency |
0-10 | 2 | 2 |
10-20 | 12 | 2 + 12 = 14 |
20-30 | 22 | 14 + 22 = 36 |
30-40 | 8 | 36 + 8 = 44 |
40-50 | 6 | 44 + 6 = 50 |
N = 50
N/2 = 50/2 = 25
Median Class = (20 - 30)
L = 20, f = 22, cf = 14, i = 10
Using Median formula:
= 20 + (25 - 14)/22 × 10
= 20 + (11/22) × 10
= 20 + 5 = 25
∴ Median = 25
Mode
Mode is defined as the value which occurs maximum number of times in a series. Mode is the most frequently observed data value. So it is value with highest frequency.
ഒരു ശ്രേണിയിൽ പരമാവധി തവണ സംഭവിക്കുന്ന മൂല്യമായി മോഡ് നിർവചിക്കപ്പെടുന്നു. ഏറ്റവും കൂടുതൽ നിരീക്ഷിക്കപ്പെടുന്ന ഡാറ്റ മൂല്യമാണ് മോഡ്. അതിനാൽ ഇത് ഏറ്റവും ഉയർന്ന ആവൃത്തിയിലുള്ള മൂല്യമാണ്.
A. Individual series
Nonindividual series mode can be the value which occurs maximum number of times in a series.
Find Mode 41, 42, 45, 44, 45, 48, 50, 45, 47, 50, 56 45 occurs 3 times in the series.
Thus 45 is Mode.
When there are two or more values, having the same maximum frequency, mode is said to be ill-defined. In such case, mode is calculated by the following formula.
Mode=3Median –2Mean
B. Discrete series
In discrete series , value with the highest frequency is taken as mode
C. Continuous series
In a continuous series mode lies in the class having the highest frequency.
L= lower limit of the model class
D 1 = The difference between the frequency of
the model class and the frequency of the pre-model class
D 2 = the difference
between the frequency of the model class and the frequency of the post model
class
i = the class intervals of the model class.
L= മോഡൽ ക്ലാസ്സിന്റെ താഴ്ന്ന പരിധി
D 1 = മോഡൽ ക്ലാസ്സിന്റെ ഫ്രീക്വൻസിയും പ്രീ-മോഡൽ ക്ലാസ്സിന്റെ ആവൃത്തിയും തമ്മിലുള്ള വ്യത്യാസം D 2 = മോഡൽ ക്ലാസ്സിന്റെ ഫ്രീക്വൻസിയും പോസ്റ്റ്
മോഡൽ ക്ലാസ്സിന്റെ ആവൃത്തിയും തമ്മിലുള്ള വ്യത്യാസം.
= മോഡൽ ക്ലാസിന്റെ ക്ലാസ് ഇടവേളകൾ.
Let's consider the following example to understand this better.
Example: Find the mode marks for the following distribution:
value with highest frequency is 15, therefore model class is 50-60
Location of Mode Graphically
Mode can be located graphically with the help of histogram. Steps:
- Draw a histogram of the given data
- Draw two lines diagonally in the inside of the model class bar, starting from each corner of the bar to the upper corner of the adjacent bar
- Then draw a perpendicular line from the point of intersection to the X-axis, which gives us the model value.
- നൽകിയിരിക്കുന്ന ഡാറ്റയുടെ ഒരു ഹിസ്റ്റോഗ്രാം വരയ്ക്കുക
- മോഡൽ ക്ലാസ് ബാറിന്റെ ഉള്ളിൽ ഡയഗണലായി രണ്ട് വരകൾ വരയ്ക്കുക, ബാറിന്റെ ഓരോ കോണിൽ നിന്നും അടുത്തുള്ള ബാറിന്റെ മുകൾ മൂലയിലേക്ക്
- തുടർന്ന് കവലയുടെ പോയിന്റിൽ നിന്ന് എക്സ്-ആക്സിസിലേക്ക് ഒരു ലംബ രേഖ വരയ്ക്കുക, അത് നമുക്ക് മോഡൽ മൂല്യം നൽകുന്നു.
Partition Values വിഭജന മൂല്യങ്ങൾ
Partition values are values that divide a series into several equal parts. ഒരു ശ്രേണിയെ പല തുല്യ ഭാഗങ്ങളായി വിഭജിക്കുന്ന മൂല്യങ്ങളാണ് പാർട്ടീഷൻ മൂല്യങ്ങൾ.
They are
- Median
- Quartiles
- Deciles
- Percentiles
അവ
- മീഡിയൻ
- ക്വാർട്ടിലുകൾ
- ഡെസിലുകൾ
- ശതമാനം
1.Median മീഡിയൻ
2. Quartiles ക്വാർട്ടിലുകൾ
Quartiles are values that divide a series into four equal parts. 3 Quartiles Q1, Q2, Q3. Q2 is equal to the median. ഒരു ശ്രേണിയെ നാല് തുല്യ ഭാഗങ്ങളായി വിഭജിക്കുന്ന മൂല്യങ്ങളാണ് ക്വാർട്ടൈലുകൾ. 3 ക്വാർട്ടൈൽസ് Q1, Q2, Q3. Q2 മീഡിയന് തുല്യമാണ്.
3.Deciles
Deciles are values that divide a series into ten equal parts. 9 Deciles.D1, D2,, D3 ........... D9. D5 is equal to the median. ഒരു ശ്രേണിയെ പത്ത് തുല്യ ഭാഗങ്ങളായി വിഭജിക്കുന്ന മൂല്യങ്ങളാണ് ഡെസിലുകൾ. 9 ഡെസിലുകൾ.D1, D2,, D3 ........... D9. D5 മീഡിയന് തുല്യമാണ്
4.Percentiles ശതമാനം
Percentiles are values that divide a series into hundred equal parts. 99 Percentiles P1, P2,, P3 ........... P99 .P50 is equal to the median. ഒരു ശ്രേണിയെ നൂറ് തുല്യ ഭാഗങ്ങളായി വിഭജിക്കുന്ന മൂല്യങ്ങളാണ് ശതമാനം. 99 ശതമാനം P1, P2,, P3 ........... P99 .P50 ശരാശരിക്ക് തുല്യമാണ്.
Partition Values in Individual series
1.Quartiles
2.Deciles
3.Percentiles