স্ট্যান্ডার্ড ডেভিয়েশন এবং স্ট্যান্ডার্ড ত্রুটি মধ্যে পার্থক্য

Anonim

ভূমিকা

স্ট্যান্ডার্ড ডি ইভটিজিং (এসডি) এবং S ট্যারেন্ট > ই রার (এসই) অপেক্ষাকৃত অনুরূপ পরিভাষা; তবে, তারা ধারণাগতভাবে এত বৈচিত্র্যপূর্ণ যে তারা স্ট্র্যাটেজি সাহিত্যের প্রায় একচেটিয়াভাবে ব্যবহার করা হয়। উভয় পদ সাধারণত একটি প্লাস-মাইনাস চিহ্ন (+/-) দ্বারা অগ্রসর হয় যা সেগুলি প্রতীয়মান হয় যে তারা একটি সমমিত মূল্য সংজ্ঞায়িত করে বা মানগুলির একটি পরিসীমা প্রকাশ করে। অনিবার্যভাবে, উভয় পদগুলি পরিমিত মানগুলির একটি সেটের গড় (গড়) সঙ্গে প্রদর্শিত হয়।

স্পষ্টতই, একটি এসই মান, ত্রুটি সহ, অথবা বৈজ্ঞানিক তথ্য যোগাযোগের সাথে কিছুই করার নেই।

মূল এবং এসডি এবং এসইএর বিশদ বিবরণটি প্রকাশ করবে, কেন পেশাজীবী স্ট্যাটিস্টিক্স এবং যারা এটি কার্সরিতভাবে ব্যবহার করে, উভয়ই ভুল পথে চলে।

স্ট্যান্ডার্ড ডেভিয়েশন (এসডি)

একটি এসডি একটি

বর্ণনামূলক একটি ডিস্ট্রিবিউশন বিস্তারের বর্ণনা করে। মেট্রিক হিসাবে, ডেটা সাধারণত বিতরণ করা হয় যখন এটি দরকারী। তবে, ডেটা অত্যন্ত তিক্ত বা বিমোডাল কারণ এটি খুব উপকারী কারণ এটি খুব ভালভাবে বিতরণের আকৃতি বর্ণনা করে না। সাধারণভাবে, আমরা নমুনাগুলির বৈশিষ্টগুলির প্রতিবেদন করার সময় SD ব্যবহার করি, কারণ আমরা বর্ণনা করি গড়ের পরিবর্তে কতগুলি তথ্য পরিবর্তিত হয়। তথ্য ছড়িয়ে দেওয়ার জন্য অন্যান্য দরকারী পরিসংখ্যানগুলি আন্তঃ-চতুর্থাংশের পরিসর, 25 তম এবং 75 তম শতক এবং তথ্যগুলির পরিসর।

চিত্র 1. এসডি তথ্য বিস্তৃত একটি পরিমাপ। যখন ডেটা সাধারণত বন্টিত বিতরণ থেকে একটি নমুনা হয়, তখন একটি অর্থের দুই-তৃতীয়াংশ মানে 1 স্ট্যান্ডার্ড ডেভিয়েশনের মধ্যে থাকা উচিত।

পার্থক্য হল একটি

বর্ণনামূলক পরিসংখ্যান, এবং এটি মান বিচ্যুতির বর্গ হিসাবে সংজ্ঞায়িত করা হয়। ফলাফল বর্ণনা করা হয় যখন এটি সাধারণত রিপোর্ট করা হয় না, কিন্তু এটি একটি আরও গাণিতিকভাবে tractable সূত্র (একটি। স্কোয়ার্ড বিচ্যুতি সমষ্টি) এবং পরিসংখ্যান গণনা একটি ভূমিকা পালন করে। উদাহরণস্বরূপ, যদি আমরা দুটি পরিসংখ্যান

P

& Q পরিচিত পার্থক্যগুলির সাথে var (পি) এবং < var (Q) , তারপর যোগফলের বিয়োগ P + Q বৈচিত্রের যোগফলের সমান: var (পি) + > Var (প্রশ্ন) । এটা এখন স্পষ্ট যে পরিসংখ্যানবিদরা পার্থক্য সম্পর্কে কথা বলতে পছন্দ করেন। কিন্তু আদর্শ বিচ্যুতিগুলি স্প্রেডের জন্য একটি গুরুত্বপূর্ণ অর্থ বহন করে, বিশেষ করে যখন ডেটা সাধারণত বিতরণ করা হয়: ব্যবধান +/- 1 এসডি নমুনার 2/3, এবং ব্যবধানের গড় + - 2 এসডি

নমুনা 95% ক্যাপচার প্রত্যাশিত হতে পারে। এসডি একটি প্রশ্ন করে কিভাবে একটি প্রশ্নের স্বতন্ত্র প্রতিক্রিয়া পরিবর্তিত হয় বা গড় থেকে "বিচ্যুত"এসডির গবেষকরা বলছেন প্রতিক্রিয়া কীভাবে ছড়িয়ে পড়েছে - তারা গড়ের দিকে মনোনিবেশ করেছেন, অথবা ছড়িয়ে ছিটিয়ে রয়েছেন? আপনার উত্তরদাতারা আপনার স্কেলের মাঝখানে আপনার পণ্যটি কি রেট দিয়েছেন, বা কি কেউ এটি অনুমোদন করেছে এবং অনেকে এটি অস্বীকার করেছে? একটি পরীক্ষা বিবেচনা করুন যেখানে উত্তরদাতাদের একটি 5-বিন্দু স্কেল উপর একটি সিরিজের বৈশিষ্ট্য একটি পণ্য রেট জিজ্ঞাসা করা হয়। "অর্থের জন্য ভাল মূল্য" জন্য দশ উত্তরদাতাদের একটি দল (নিচের 'জে' এর মাধ্যমে 'লেগেছে' লেবেল) এর অর্থ 3। ২. এসডি 4 দিয়ে 4। এবং "পণ্য নির্ভরযোগ্যতা" মানে 3। 4 একটি এসডি 2 সঙ্গে 2. 1. প্রথম নজরে (শুধুমাত্র উপায় এ খুঁজছেন) এটি নির্ভরযোগ্যতা মূল্য বেশী রেট দেওয়া হবে বলে মনে হবে। কিন্তু বিশ্বস্ততার জন্য উচ্চতর ডিসিটি (নিম্নবর্ণিত বন্টন হিসাবে দেখানো হয়েছে) উল্লেখ করতে পারে যে প্রতিক্রিয়াগুলি খুব পোলারাইজড ছিল, যেখানে অধিকাংশ উত্তরদাতাদের কোন নির্ভরযোগ্যতা বিষয় ছিল না (বৈশিষ্ট্যটি একটি "5"), কিন্তু উত্তরদাতাদের একটি ছোট কিন্তু গুরুত্বপূর্ণ অংশ ছিল একটি নির্ভরযোগ্যতা সমস্যা এবং বৈশিষ্ট্যটি "1" রেট দিয়েছে কেবলমাত্র এই কথাটিই কেবল গল্পের অংশ বলে মনে করে, তবে প্রায়ই এটির তুলনায় বেশি কিছু হয় না, এটিই গবেষকরা কীভাবে ফোকাস করেন প্রতিক্রিয়া বিতরণ করা বিবেচনা করা গুরুত্বপূর্ণ এবং এসডি এই একটি মূল্যবান বর্ণনামূলক পরিমাপ উপলব্ধ করা হয়। উত্তরদাতা

অর্থের জন্য ভাল মান

পণ্য নির্ভরযোগ্যতা

3 1 বি
3 1 C
3 < 1 ডি 3
1 4
5 এফ 4
5 জি 3
5 শু 3
5 আমি 3
5 জে 3
5 মিন 3। 2
3। 4 এসটিডি। দেব। 0। 4
2। 1 প্রথম সার্ভে: উত্তরদাতারা 5-পয়েন্ট স্কেলে একটি পণ্য নির্ধারণ করে 5-পয়েন্ট রেটিং স্কেলের প্রতিক্রিয়াগুলির দুটি ভিন্ন ভিন্ন বিতরণের একই অর্থ উৎপন্ন করতে পারে। দুটি ভিন্ন রেটিংগুলির জন্য প্রতিক্রিয়া মান দেখানো নিম্নোক্ত উদাহরণ বিবেচনা করুন।
প্রথম উদাহরণে (রেটিং "এ"), এসডি শূন্য হয় কারণ সমস্ত প্রতিক্রিয়াগুলি অবশ্যই গড় মান ছিল। পৃথক প্রতিক্রিয়া গড় থেকে সব এ পথভ্রষ্ট হয়নি। রেটিং "B" এ, যদিও গ্রুপ মানে একই (3. 0) প্রথম বন্টন হিসাবে, স্ট্যান্ডার্ড বিভাজন উচ্চতর। 1. 1.5 এর মান বিচ্যুতি দেখায় যে, পৃথক প্রতিক্রিয়া, গড় *, গড় থেকে 1 পয়েন্ট দূরে ছিল। উত্তরদাতা

রেটিং "এ"

রেটিং "বি"

3

1 বি 3
সি 3
2 ডি 3
3 3
3 এফ 3
3 জি 3 > 3
শু 3 4
আমি 3 4
জে 3 5
মিন 3। 0 3। 0
এসটিডি। দেব। 0। 00 1। 15
দ্বিতীয় সার্ভে: উত্তরদাতারা 5-বিন্দুর স্কেলে একটি পণ্য নির্ধারণ করে এসডি দেখার অন্য উপায় হল প্রতিক্রিয়া একটি হিস্টোগ্রাম হিসাবে বন্টনকে অঙ্কন করে। একটি নিম্ন এসডি সঙ্গে একটি বন্টন একটি লম্বা সংকীর্ণ আকৃতি হিসেবে প্রদর্শিত হবে, যখন একটি বৃহৎ এসডি একটি বৃহত্তর আকৃতি দ্বারা নির্দেশিত হবে। এসডি সাধারণত "সঠিক বা ভুল" বা "ভাল বা খারাপ" নির্দেশ করে না - একটি নিম্ন এস ডি অগত্যা আরো পছন্দনীয় নয়। এটি কেবল একটি বর্ণনামূলক পরিসংখ্যান হিসেবে ব্যবহার করা হয়। এটি অর্থের সাথে সম্পর্কিত বিতরণের বর্ণনা।
টি এসডি সংক্রান্ত ইকনিকাল দাবিত্যাগ এস.ডি.কে "গড় বিচ্যুতির" হিসাবে বিবেচনা করা হচ্ছে ধারণাগতভাবে তার অর্থ বোঝার একটি চমৎকার উপায়। যাইহোক, এটি আসলে গড় হিসাবে গণনা করা হয় না (যদি এটি হয়, আমরা এটি "গড় বিচ্যুতি" বলব)। পরিবর্তে, এটি "প্রমিত করা হয়", স্কয়ারগুলির সমষ্টি ব্যবহার করে মান গণনা করার কিছুটা জটিল পদ্ধতি।

ব্যবহারিক উদ্দেশ্যে, গণনা গুরুত্বপূর্ণ নয়। অধিকাংশ ট্যাবুলেশন প্রোগ্রাম, স্প্রেডশীট বা অন্যান্য ডেটা ম্যানেজমেন্ট সরঞ্জাম আপনার জন্য SD গণনা করবে। আরো গুরুত্বপূর্ণ পরিসংখ্যান বহন কি বুঝতে হয়।

স্ট্যান্ডার্ড ত্রুটি

একটি আদর্শ ত্রুটি হল একটি

অভিগমন পরিসংখ্যান যে সারাংশ জুড়ে নমুনা মানে (গড়) তুলনা করা হয়। এটি একটি পরিমাপ

স্পষ্টতা

নমুনা গড় এর। নমুনা অর্থ একটি পরিসংখ্যান যা এমন একটি ডেটা থেকে প্রাপ্ত হয় যার একটি অন্তর্নিহিত বিতরণ রয়েছে। আমরা তথ্য হিসাবে একই ভাবে চিত্তাকর্ষক করতে পারি না, কারণ আমরা একটি একক পরীক্ষা করেছি এবং শুধুমাত্র একটি মান আছে। পরিসংখ্যানগত তত্ত্ব আমাদেরকে বলে যে নমুনা মানে (একটি বৃহত "যথেষ্ট" নমুনার জন্য এবং কয়েকটি নিয়মিততার অধীনে) প্রায়শই বিতরণ করা হয়। এই স্বাভাবিক বন্টনের মান বিচ্যুতি হল আমরা কি স্ট্যান্ডার্ড ত্রুটি কল।

চিত্র 2.

নিচের রেফারেন্সে বিতরণ ডেটার বিতরণ বণ্টন করে, তবে উপরের ডিস্ট্রিবিউশন হল নমুনা অর্থের তাত্ত্বিক বন্টন। 20 এর এসডি তথ্য বিস্তৃত একটি পরিমাপ হয়, যখন 5 এর SE নমুনা গড় কাছাকাছি একটি অনিশ্চয়তা একটি পরিমাপ। আমরা চিকিত্সা এ বনাম চিকিত্সা বি একটি দুটি নমুনা পরীক্ষার ফলাফলের ফলাফল তুলনা করতে চান, তাহলে আমরা উপায়ে পরিমাপ কিভাবে সঠিকভাবে অনুমান করা প্রয়োজন। প্রকৃতপক্ষে, আমরা দুটো উপায়ে আমরা পার্থক্য কতটুকু পরিমাপ করেছি তা আমরা আগ্রহী। আমরা এই পরিসংখ্যান পার্থক্য স্ট্যান্ডার্ড ত্রুটি কল। আপনি জানতে পারেন যে নমুনা মানে পার্থক্যের মান ত্রুটি মানে হল স্ট্যান্ডার্ড ত্রুটিগুলির একটি ফাংশন: এখন আপনি বুঝেছেন যে মান (SE) এবং এর স্ট্যান্ডার্ড ত্রুটি বণ্টনের আদর্শ বিচ্যুতি (এসডি) দুটি ভিন্ন প্রাণী, আপনি প্রথম স্থানে ভ্রান্ত কিভাবে তারা আশ্চর্য হতে পারে। যদিও তারা ধারণাগতভাবে ভিন্ন, তাদের গাণিতিকভাবে সাধারণ সম্পর্ক রয়েছে:

, যেখানে n হলো ডাটা পয়েন্টের সংখ্যা। লক্ষ্য করুন যে স্ট্যান্ডার্ড ত্রুটিটি দুটি উপাদানগুলির উপর নির্ভর করে: নমুনার আদর্শ বিচ্যুতি, এবং নমুনার আকার n

এটি স্বজ্ঞাত অর্থে তৈরি করে: নমুনার আদর্শ বিচ্যুতি বৃহত্তর, সত্যিকারের প্রকৃত অর্থ আমাদের অনুমানের বিষয়ে আমরা কম সুনির্দিষ্টভাবে বলতে পারি।

উপরন্তু, বৃহত্তর নমুনা আকার, জনসংখ্যার সম্পর্কে আমাদের আরও তথ্য এবং আরো সঠিকভাবে আমরা প্রকৃত অর্থ অনুমান করতে পারি।

এসই মানে নির্ভরযোগ্যতার একটি ইঙ্গিত। একটি ছোট SE হল একটি ইঙ্গিত যে নমুনা মানে হল প্রকৃত জনসংখ্যার অর্থ আরও নির্ভুল প্রতিফলন।একটি বড় নমুনা আকার সাধারণত একটি ছোট SE (যখন SD সরাসরি নমুনা আকার দ্বারা প্রভাবিত হয় না) ফলে হবে

অধিকাংশ জরিপ গবেষণা জনসংখ্যার থেকে একটি নমুনা অঙ্কন জড়িত থাকে। আমরা তারপর যে নমুনা থেকে প্রাপ্ত ফলাফল থেকে জনসংখ্যার সম্পর্কে তথ্য তুলে ধরুন। যদি একটি দ্বিতীয় নমুনা টানা হয়, তাহলে সম্ভবত ফলাফলগুলি প্রথম নমুনার সঙ্গে মেলে না। যদি একটি রেটিং অ্যাট্রিবিউটের গড় মান ছিল 3। এক নমুনার জন্য 2, এটি 3 হতে পারে। 4 একই আকারের দ্বিতীয় নমুনার জন্য। যদি আমরা আমাদের জনসংখ্যার থেকে একটি অসীম সংখ্যক নমুনা (সমান আকারের) আঁকতে থাকি, তবে আমরা বিতরণ পদ্ধতি হিসাবে একটি বিতরণ হিসাবে প্রদর্শন করতে পারি। তারপর আমরা আমাদের নমুনা উপায়ে সব গড় হিসাব করতে পারে। এই অর্থ সত্য জনসংখ্যার গড় সমান হবে। আমরা নমুনা মানে বন্টনের এসডি গণনা করতে পারেন। নমুনার এই বন্টনের SD হল প্রতিটি পৃথক নমুনা মানে এর এসই মানে।

এইভাবে, আমাদের সবচেয়ে উল্লেখযোগ্য পর্যবেক্ষণ আছে: এসই হচ্ছে জনসংখ্যার SD মানে গড়। নমুনা

মিন

1 ম

3। 2

2nd 3। 4

3 য় 3। 3
4th 3। 2
5 ম 3। 1
…। …।
…। …।
…। …।
…। …।
…। …।
মিন 3। 3
এসটিডি। দেব। 0। 13
সিডি এবং এসই এর মধ্যে সম্পর্কের উদাহরণের ছকচিত্রটি এখন স্পষ্ট যে যদি এই ডিস্ট্রিবিউটেড ডিজিটরিটি আমাদের বুঝতে সাহায্য করে যে প্রকৃত জনসংখ্যার মানে কতটা নমুনা মানে, তাহলে আমরা এটিকে কিভাবে বুঝতে পারি সঠিক যে কোনো পৃথক নমুনা মানে সত্য অর্থের সাথে সম্পর্কযুক্ত। এটা এসই এর সারাংশ
প্রকৃতপক্ষে, আমরা কেবলমাত্র আমাদের জনসংখ্যার থেকে একটি একক নমুনা আঁকছি, তবে আমরা এই ফলাফলটি আমাদের পর্যবেক্ষণকৃত নমুনা অর্থের নির্ভরযোগ্যতার অনুমান প্রদান করতে পারি।
প্রকৃতপক্ষে, এসই আমাদের বলে যে আমরা আমাদের 95% আত্মবিশ্বাসী হতে পারি যে আমাদের পর্যবেক্ষিত নমুনা মানে প্লাস বা বিয়োগ প্রায় 2 (আসলে 1. 96) জনসংখ্যার অর্থ থেকে স্ট্যান্ডার্ড ত্রুটি। নিচের সারণি আমাদের গবেষণার জন্য ব্যবহৃত আমাদের প্রথম (এবং শুধুমাত্র) নমুনা থেকে প্রতিক্রিয়ার বিতরণ দেখায়। 0. 13 এর SE, অপেক্ষাকৃত ছোট, আমাদের একটি ইঙ্গিত দেয় যে আমাদের অর্থ আমাদের সামগ্রিক জনসংখ্যার প্রকৃত অর্থের তুলনায় নিকটতম। আমাদের অর্থের জন্য ত্রুটি (95% আস্থা) এর মার্জিন (মোটামুটিভাবে) দ্বিগুণ (+/- 0.২6), আমাদের বলছে যে প্রকৃত অর্থ ২ 94 এবং 3 এর মধ্যে সম্ভবত সবচেয়ে বেশি। 46.

উত্তরদাতা

নির্ধারণ

একটি

3

b

3
সি 3
ডি 3
4
এফ 4
জি 3
শু 3
আমি 3
জে 3
মিন > 3। 2 এসটিডি।
0 ভুল। 13
সারাংশ অনেক গবেষক স্ট্যান্ডার্ড ডেভিয়েশন এবং স্ট্যান্ডার্ড ত্রুটি মধ্যে পার্থক্য বুঝতে ব্যর্থ, যদিও তারা সাধারণত তথ্য বিশ্লেষণ অন্তর্ভুক্ত করা হয়। স্ট্যান্ডার্ড ডেভিয়েশন এবং স্ট্যান্ডার্ড ত্রুটিের প্রকৃত হিসাব খুব অনুরূপ মনে হলেও, তারা দুটি ভিন্ন ভিন্ন, কিন্তু পরিপূরক, পরিমাপের প্রতিনিধিত্ব করে। এসডি আমাদের বন্টনের আকার সম্বন্ধে আমাদেরকে বলে, কিভাবে ব্যক্তিগত তথ্য মান হল গড় মান থেকে। এসই আমাদের বলে যে আমাদের নমুনা মানে কত জনসংখ্যার মোট জনসংখ্যার প্রকৃত অর্থ।একসাথে, তারা আমাদের বলতে পারে কেবল গড় চেয়ে আরও সম্পূর্ণ ছবি প্রদান করতে সাহায্য।