ତଥ୍ୟ ସଂଗ୍ରହ ଓ ତଥ୍ୟ ଉପସ୍ଥାପନା
ପରିସଂଖ୍ୟାନ ହେଉଛି ତଥ୍ୟ ସଂଗ୍ରହ, ଏହାର ବିଶ୍ଳେଷଣ ଓ ବ୍ୟାଖ୍ୟା ସମ୍ବନ୍ଧୀୟ ବିଜ୍ଞାନ। ଏହା କୃଷି, ଶିଳ୍ପ, ସ୍ୱାସ୍ଥ୍ୟ, ଶିକ୍ଷା, ଶାସନ ଆଦି ବହୁ କ୍ଷେତ୍ରରେ ବ୍ୟବହୃତ ହୁଏ। ପରିସଂଖ୍ୟାନର ମୂଳଭିତ୍ତି ହେଉଛି ସାଂଖ୍ୟକ ତଥ୍ୟ (Numerical data)। "ବହୁତ" କିମ୍ବା "କମ୍" ଭଳି ଶବ୍ଦ ସ୍ପଷ୍ଟ ଧାରଣା ଦିଏ ନାହିଁ, କିନ୍ତୁ ସଂଖ୍ୟା ମାଧ୍ୟମରେ ପ୍ରକାଶିତ ତଥ୍ୟ ସ୍ପଷ୍ଟ ଧାରଣା ଦେଇଥାଏ।
ତଥ୍ୟ ସଂଗ୍ରହ (Data Collection)
ତଥ୍ୟ ସଂଗ୍ରହ ମୁଖ୍ୟତଃ ଦୁଇ ପ୍ରକାରର:
- ପ୍ରାଥମିକ ତଥ୍ୟ (Primary data): କୌଣସି ନିର୍ଦ୍ଦିଷ୍ଟ ଲକ୍ଷ୍ୟକୁ ଆଖିରେ ରଖି ଅନୁସନ୍ଧାନକାରୀମାନେ ପ୍ରତ୍ୟକ୍ଷ ଭାବରେ ସଂଗ୍ରହ କରିଥିବା ତଥ୍ୟକୁ ପ୍ରାଥମିକ ତଥ୍ୟ କୁହାଯାଏ।
- ପରୋକ୍ଷ ତଥ୍ୟ (Secondary data): ସମୟ, ସୁବିଧା ବା ଅର୍ଥାଭାବରୁ ପୁସ୍ତକାଗାର, ସରକାରୀ କାଗଜପତ୍ର ବା ଖବରକାଗଜ ଭଳି କୌଣସି ସୂତ୍ରରୁ ସଂଗୃହୀତ ତଥ୍ୟକୁ ପରୋକ୍ଷ ତଥ୍ୟ କୁହାଯାଏ।
ସଂଗୃହୀତ ତଥ୍ୟକୁ ଲବ୍ଧାଙ୍କ (Score) କୁହାଯାଏ।
ସଂଗୃହୀତ ତଥ୍ୟର ଉପସ୍ଥାପନା (Presentation of data)
ସଂଗୃହୀତ ତଥ୍ୟକୁ ଉପଯୁକ୍ତ ପ୍ରଣାଳୀରେ ଉପସ୍ଥାପିତ କରିବା ଆବଶ୍ୟକ, ନହେଲେ ଏଥିରୁ କୌଣସି ସୂଚନା ମିଳିବ ନାହିଁ। ପ୍ରଥମେ ସଂଗୃହୀତ ତଥ୍ୟକୁ ଅପକ୍ଵ ତଥ୍ୟ (Raw data) କୁହାଯାଏ, ଯାହା ସଂଗୃହୀତ କ୍ରମରେ ଥାଏ। ଏଥିରୁ ସର୍ବାଧିକ, ସର୍ବନିମ୍ନ, କିମ୍ବା ଏକ ନିର୍ଦ୍ଦିଷ୍ଟ ନମ୍ବର ଠାରୁ ଅଧିକ ବା କମ୍ ଲବ୍ଧାଙ୍କ ରଖିଥିବା ଛାତ୍ରସଂଖ୍ୟା ଭଳି ପ୍ରଶ୍ନର ଉତ୍ତର ପାଇବା କଷ୍ଟକର।
ପୌନଃପୁନ୍ୟ ବିତରଣ ସାରଣୀ (Frequency distribution table)
ତଥ୍ୟକୁ ସହଜରେ ବିଶ୍ଳେଷଣ କରିବା ପାଇଁ ପୌନଃପୁନ୍ୟ ବିତରଣ ସାରଣୀ ପ୍ରସ୍ତୁତ କରାଯାଏ। ଏଥିରେ ଦୁଇଟି ପ୍ରକ୍ରିୟା ସମ୍ପାଦନ କରାଯାଏ:
-
ବିନ୍ୟାସ (Array): ଅପକ୍ଵ ତଥ୍ୟ ବା ଲବ୍ଧାଙ୍କଗୁଡ଼ିକୁ ଉର୍ଦ୍ଧକ୍ରମ (ascending order) ବା ଅଧଃକ୍ରମ (descending order) ରେ ସଜାଇ ରଖିବା।
- ଉଦାହରଣ: 30 ଜଣ ପରୀକ୍ଷାର୍ଥୀଙ୍କ ପ୍ରାପ୍ତାଙ୍କ (ଅପକ୍ଵ ତଥ୍ୟ):
- ଉର୍ଦ୍ଧକ୍ରମରେ ସଜାଇଲେ (ବିନ୍ୟାସ):
-
ପୌନଃପୁନ୍ୟ ବା ବାରମ୍ବାରତା (Frequency): ଏକାଧିକବାର ରହିଥିବା ଲବ୍ଧାଙ୍କଗୁଡ଼ିକୁ ବାରମ୍ବାର ନ ଲେଖି ସେମାନଙ୍କର ସଂଖ୍ୟାକୁ ପୌନଃପୁନ୍ୟ ରୂପେ ପ୍ରକାଶ କରିବା। ଏଥିପାଇଁ ଟାଲି ଚିହ୍ନ (Tally marks) ବ୍ୟବହାର କରାଯାଏ।
- ଟାଲି ଚିହ୍ନ ଉଦାହରଣ: ଥର ପାଇଁ
HH, ଥର ପାଇଁHH /, ଥର ପାଇଁHH HH।
- ଟାଲି ଚିହ୍ନ ଉଦାହରଣ: ଥର ପାଇଁ
ବାରମ୍ବାରତା ବିତରଣ ସାରଣୀ (ଉଦାହରଣ):
| ଲବ୍ଧାଙ୍କ (Score) | ବାରମ୍ବାରତା (Frequency) | | :--------------- | :-------------------- | | 5 | 1 | | 7 | 1 | | 10 | 2 | | 12 | 3 | | 14 | 4 | | 19 | 6 | | 22 | 1 | | 24 | 5 | | 25 | 1 | | 29 | 2 | | 34 | 2 | | 38 | 1 | | 40 | 1 | | ମୋଟ | 30 |
ଭାଗ-ବିଭକ୍ତ ବାରମ୍ବାରତା ସାରଣୀ (Grouped Frequency Distribution Table)
ଯେତେବେଳେ ତଥ୍ୟର ପରିସର ବଡ଼ ଥାଏ, ସେତେବେଳେ ଲବ୍ଧାଙ୍କଗୁଡ଼ିକୁ ସଂଭାଗ (Class interval) ରେ ବିଭକ୍ତ କରି ବାରମ୍ବାରତା ସାରଣୀ ପ୍ରସ୍ତୁତ କରାଯାଏ। ପ୍ରତ୍ୟେକ ସଂଭାଗରେ ଥିବା ଲବ୍ଧାଙ୍କର ମୋଟ ସଂଖ୍ୟା ହେଉଛି ଉକ୍ତ ସଂଭାଗର ବାରମ୍ବାରତା।
ଉଦାହରଣ (ସଂଭାଗୀକରଣ - A ପ୍ରଣାଳୀ):
| ସଂଭାଗ (Class Interval) | ଟାଲି ଚିହ୍ନ (Tally Marks) | ବାରମ୍ବାରତା (Frequency) |
| :--------------------- | :----------------------- | :-------------------- |
| 10-20 | HH | 5 |
| 30-40 | HH // | 7 |
| 40-50 | HH // | 7 |
| 50-60 | HH // | 7 |
| 60-70 | HH | 5 |
| 70-80 | //// | 4 |
| ମୋଟ | | 40 |
ରାଶିକୃତ ବାରମ୍ବାରତା (Cumulative frequency)
ଏକ ତଥ୍ୟାବଳୀର ସର୍ବନିମ୍ନ ଲବ୍ଧାଙ୍କଠାରୁ କୌଣସି ଏକ ନିର୍ଦ୍ଦିଷ୍ଟ ଲବ୍ଧାଙ୍କ ପର୍ଯ୍ୟନ୍ତ ସମସ୍ତ ଲବ୍ଧାଙ୍କର ବାରମ୍ବାରତାର ଯୋଗଫଳକୁ ଉକ୍ତ ନିର୍ଦ୍ଦିଷ୍ଟ ଲବ୍ଧାଙ୍କର ରାଶିକୃତ ବାରମ୍ବାରତା କୁହାଯାଏ।
- ସୂତ୍ର: କୌଣସି ଲବ୍ଧାଙ୍କର ରାଶିକୃତ ବାରମ୍ବାରତା = ତା'ର ଠିକ୍ ପୂର୍ବବର୍ତ୍ତୀ ଲବ୍ଧାଙ୍କର ରାଶିକୃତ ବାରମ୍ବାରତା + ସେହି ଲବ୍ଧାଙ୍କର ବାରମ୍ବାରତା।
ଉଦାହରଣ: ଯଦି 6 ବର୍ଷର ପିଲାଙ୍କ ବାରମ୍ବାରତା 30 ଓ 7 ବର୍ଷର ପିଲାଙ୍କ ବାରମ୍ବାରତା 32, ତେବେ 7 ବର୍ଷ ବା ତା'ଠାରୁ କମ୍ ବୟସର ପିଲାଙ୍କ ସଂଖ୍ୟା = । ଏଠାରେ ଲବ୍ଧାଙ୍କ 7 ର ରାଶିକୃତ ବାରମ୍ବାରତା ।