ऋणात्मक द्विपद वितरण कैलकुलेटर
PMF · CDF · माध्य · प्रसरण · बार चार्ट · दो पैरामीटराइजेशन
ऋणात्मक द्विपद (पास्कल) वितरण के लिए सटीक प्रायिकता, CDF और सांख्यिकी की गणना करें। यह failures-before-r-th-success (मोड A) और trial-of-r-th-success (मोड B) दोनों पैरामीटराइजेशन का समर्थन करता है।
त्वरित उदाहरण (Quick Examples)
पैरामीटराइजेशन (Parameterization)
सूत्र और प्रतिस्थापन (Formula & Substitution)
k=0 से k_max तक पूरी प्रायिकता तालिका। पहले कैलकुलेटर टैब का उपयोग करें, या नीचे पैरामीटर दर्ज करें।
| k | P(X=k) | P(X≤k) | P(X>k) |
|---|
लाल बिंदीदार रेखा = माध्य (μ)। गहरा हरा बार = चयनित मान।
ऋणात्मक द्विपद वितरण क्या है?
ऋणात्मक द्विपद वितरण (Negative Binomial Distribution) एक अत्यंत महत्वपूर्ण असंतत प्रायिकता वितरण है जो स्वतंत्र बर्नौली परीक्षणों की एक श्रृंखला से प्राप्त संख्यात्मक डेटा को मॉडल करता है। द्विपद वितरण के विपरीत — जिसमें परीक्षणों की संख्या n स्थिर होती है और सफलताओं की संख्या की गणना की जाती है — ऋणात्मक द्विपद वितरण में सफलताओं की एक निश्चित लक्षित संख्या r होती है, और यह गणना करता है कि उस लक्ष्य तक पहुँचने से पहले कितनी असफलताएँ (या कुल परीक्षण) हुईं।
औपचारिक रूप से, मान लें कि प्रत्येक परीक्षण स्वतंत्र रूप से सफलता की प्रायिकता p और विफलता की प्रायिकता 1 − p देता है। यह प्रक्रिया तब तक चलती है जब तक ठीक r सफलताएँ प्राप्त न हो जाएँ। ऋणात्मक द्विपद वितरण इस यात्रा में जमा होने वाली असफलताओं की संख्या को दर्शाता है। इसका प्रायिकता द्रव्यमान कार्य (PMF) निम्न है:
जहाँ X, r-वीं सफलता से पहले असफलताओं की संख्या है। यह रूप विशेष रूप से गुणवत्ता नियंत्रण (Quality Control) में बहुत प्राकृतिक है, जहाँ r = "आवश्यक अच्छे उत्पादों की संख्या" और k = "उस कोटे को पूरा करने से पहले मिलने वाले दोषपूर्ण उत्पादों की संख्या" है।
दोनों पैरामीटराइजेशन का स्पष्टीकरण
सांख्यिकीविद् ऋणात्मक द्विपद वितरण को दर्शाने के लिए दो समतुल्य तरीकों का उपयोग करते हैं, जिससे अक्सर असमंजस की स्थिति उत्पन्न हो जाती है।
मोड A — असफलताओं की संख्या (X)
X, r-वीं सफलता से पहले आने वाली असफलताओं की संख्या है। इसका डोमेन k = 0, 1, 2, ... होता है। इसका PMF P(X=k) = C(k+r−1, k) × p^r × (1−p)^k है। इसका माध्य r(1−p)/p और प्रसरण r(1−p)/p² होता है। प्रायिकता की पाठ्यपुस्तकों में यह पैरामीटराइजेशन बहुत लोकप्रिय है।
मोड B — परीक्षण संख्या (Y, पास्कल वितरण)
Y उस परीक्षण संख्या को दर्शाता है जिस पर r-वीं सफलता प्राप्त होती है। इसका डोमेन n = r, r+1, r+2, ... होता है। इसका PMF P(Y=n) = C(n−1, r−1) × p^r × (1−p)^(n−r) है। इसका माध्य r/p और प्रसरण r(1−p)/p² होता है। इस रूप को पास्कल वितरण (Pascal Distribution) भी कहा जाता है और यह तब बहुत उपयोगी होता है जब प्रश्न यह हो कि "किस प्रयास में r-वीं सफलता मिलेगी?"
ज्यामितीय वितरण से संबंध
जब r = 1 होता है, तो ऋणात्मक द्विपद वितरण बिल्कुल ज्यामितीय वितरण (Geometric Distribution) में बदल जाता है। मोड A में r = 1 के साथ, P(X=k) = p × (1−p)^k (k = 0, 1, 2, ... के लिए) होता है, जो पहली सफलता से पहले असफलताओं की संख्या को मापने वाला ज्यामितीय वितरण है। मोड B में r = 1 के साथ, P(Y=n) = p × (1−p)^(n−1) (n = 1, 2, 3, ... के लिए) होता है, जो मानक ज्यामितीय वितरण है। आप कैलकुलेटर में r = 1 सेट करके इसे सत्यापित कर सकते हैं।
माध्य, प्रसरण और अति-प्रसरण
| पैरामीटराइजेशन | माध्य (Mean) | प्रसरण (Variance) | मानक विचलन (Std Dev) |
|---|---|---|---|
| मोड A (असफलताएँ X) | r(1−p)/p | r(1−p)/p² | √(r(1−p)/p²) |
| मोड B (परीक्षण Y) | r/p | r(1−p)/p² | √(r(1−p)/p²) |
इस वितरण का एक मुख्य गुण यह है कि प्रसरण = माध्य + माध्य²/r होता है। चूँकि माध्य²/r > 0 है, इसलिए इसका प्रसरण हमेशा इसके माध्य से अधिक होता है। इसे अति-प्रसरण (Overdispersion) कहा जाता है — यह पॉइसन वितरण के विपरीत है, जहाँ प्रसरण हमेशा माध्य के बराबर होता है। जैसे-जैसे r → ∞ होता है (माध्य को स्थिर रखते हुए), ऋणात्मक द्विपद वितरण पॉइसन वितरण की ओर प्रवृत्त होता है।
द्विपद वितरण से संबंध
हालांकि दोनों वितरणों में बर्नौली परीक्षण शामिल होते हैं, लेकिन उनकी भूमिकाएँ उलटी होती हैं। द्विपद वितरण B(n, p) में, परीक्षणों की संख्या n स्थिर होती है और सफलताओं X की गणना की जाती है। ऋणात्मक द्विपद में, r सफलताएँ आवश्यक होती हैं और असफलताओं (या कुल परीक्षणों) की गणना की जाती है।
अनुप्रयोग
- बीमा और वास्तविक विज्ञान (Actuarial Science): पॉलिसीधारकों के विषम जोखिमों के मामले में दावों की संख्या को मॉडल करने के लिए।
- पारिस्थितिकी (Ecology): प्रजातियों की प्रचुरता और कीड़ों की आबादी की गणना के लिए, जो आमतौर पर अति-प्रसरित होती हैं।
- जीनोमिक्स / RNA-seq: जीन अभिव्यक्ति विश्लेषण में रीड काउंट को मॉडल करने के लिए DESeq2 और edgeR जैसे उपकरणों में ऋणात्मक द्विपद वितरण का बड़े पैमाने पर उपयोग किया जाता है।
- महामारी विज्ञान (Epidemiology): संक्रामक रोगों (जैसे COVID-19) के सुपरस्प्रेडर डायनामिक्स को मॉडल करने में, जहाँ रोग फैलने की घटनाएँ अति-प्रसरित होती हैं।
- विश्वसनीयता इंजीनियरिंग: किसी मरम्मत योग्य प्रणाली के r-वें खराब होने तक लगने वाले समय का विश्लेषण करने के लिए।
- खेल विश्लेषण: फुटबॉल में प्रति गेम किए गए गोलों, क्रिकेट में एक पारी में बने रनों और गेंदबाजी स्पेल में लिए गए विकेटों के अति-प्रसरित पैटर्न को समझने के लिए।
अक्सर पूछे जाने वाले प्रश्न (FAQ)
ऋणात्मक द्विपद वितरण क्या है?
द्विपद (Binomial) और ऋणात्मक द्विपद (Negative Binomial) में क्या अंतर है?
ऋणात्मक द्विपद वितरण में r और p क्या दर्शाते हैं?
पास्कल वितरण क्या है?
ऋणात्मक द्विपद वितरण ज्यामितीय वितरण में कब बदलता है?
अति-प्रसरण (Overdispersion) क्या है?
इस कैलकुलेटर में 'k_max' क्या है?
वितरण के मुख्य सूत्र
P(X = k) = k+r-1Ck pr (1-p)k
μ = r(1-p)/p
σ² = r(1-p)/p²
प्रसरण = माध्य + माध्य²/r