NB

ऋणात्मक द्विपद वितरण कैलकुलेटर

PMF · CDF · माध्य · प्रसरण · बार चार्ट · दो पैरामीटराइजेशन

ऋणात्मक द्विपद (पास्कल) वितरण के लिए सटीक प्रायिकता, CDF और सांख्यिकी की गणना करें। यह failures-before-r-th-success (मोड A) और trial-of-r-th-success (मोड B) दोनों पैरामीटराइजेशन का समर्थन करता है।

त्वरित उदाहरण (Quick Examples)

पैरामीटराइजेशन (Parameterization)

पूर्णांक 1 – 50
0 < p < 1
पूर्णांक ≥ 0
स्वचालित या 1 – 100

ऋणात्मक द्विपद वितरण क्या है?

ऋणात्मक द्विपद वितरण (Negative Binomial Distribution) एक अत्यंत महत्वपूर्ण असंतत प्रायिकता वितरण है जो स्वतंत्र बर्नौली परीक्षणों की एक श्रृंखला से प्राप्त संख्यात्मक डेटा को मॉडल करता है। द्विपद वितरण के विपरीत — जिसमें परीक्षणों की संख्या n स्थिर होती है और सफलताओं की संख्या की गणना की जाती है — ऋणात्मक द्विपद वितरण में सफलताओं की एक निश्चित लक्षित संख्या r होती है, और यह गणना करता है कि उस लक्ष्य तक पहुँचने से पहले कितनी असफलताएँ (या कुल परीक्षण) हुईं।

औपचारिक रूप से, मान लें कि प्रत्येक परीक्षण स्वतंत्र रूप से सफलता की प्रायिकता p और विफलता की प्रायिकता 1 − p देता है। यह प्रक्रिया तब तक चलती है जब तक ठीक r सफलताएँ प्राप्त न हो जाएँ। ऋणात्मक द्विपद वितरण इस यात्रा में जमा होने वाली असफलताओं की संख्या को दर्शाता है। इसका प्रायिकता द्रव्यमान कार्य (PMF) निम्न है:

P(X = k) = C(k+r−1, k) × p^r × (1−p)^k    k = 0, 1, 2, ... के लिए

जहाँ X, r-वीं सफलता से पहले असफलताओं की संख्या है। यह रूप विशेष रूप से गुणवत्ता नियंत्रण (Quality Control) में बहुत प्राकृतिक है, जहाँ r = "आवश्यक अच्छे उत्पादों की संख्या" और k = "उस कोटे को पूरा करने से पहले मिलने वाले दोषपूर्ण उत्पादों की संख्या" है।

दोनों पैरामीटराइजेशन का स्पष्टीकरण

सांख्यिकीविद् ऋणात्मक द्विपद वितरण को दर्शाने के लिए दो समतुल्य तरीकों का उपयोग करते हैं, जिससे अक्सर असमंजस की स्थिति उत्पन्न हो जाती है।

मोड A — असफलताओं की संख्या (X)

X, r-वीं सफलता से पहले आने वाली असफलताओं की संख्या है। इसका डोमेन k = 0, 1, 2, ... होता है। इसका PMF P(X=k) = C(k+r−1, k) × p^r × (1−p)^k है। इसका माध्य r(1−p)/p और प्रसरण r(1−p)/p² होता है। प्रायिकता की पाठ्यपुस्तकों में यह पैरामीटराइजेशन बहुत लोकप्रिय है।

मोड B — परीक्षण संख्या (Y, पास्कल वितरण)

Y उस परीक्षण संख्या को दर्शाता है जिस पर r-वीं सफलता प्राप्त होती है। इसका डोमेन n = r, r+1, r+2, ... होता है। इसका PMF P(Y=n) = C(n−1, r−1) × p^r × (1−p)^(n−r) है। इसका माध्य r/p और प्रसरण r(1−p)/p² होता है। इस रूप को पास्कल वितरण (Pascal Distribution) भी कहा जाता है और यह तब बहुत उपयोगी होता है जब प्रश्न यह हो कि "किस प्रयास में r-वीं सफलता मिलेगी?"

ज्यामितीय वितरण से संबंध

जब r = 1 होता है, तो ऋणात्मक द्विपद वितरण बिल्कुल ज्यामितीय वितरण (Geometric Distribution) में बदल जाता है। मोड A में r = 1 के साथ, P(X=k) = p × (1−p)^k (k = 0, 1, 2, ... के लिए) होता है, जो पहली सफलता से पहले असफलताओं की संख्या को मापने वाला ज्यामितीय वितरण है। मोड B में r = 1 के साथ, P(Y=n) = p × (1−p)^(n−1) (n = 1, 2, 3, ... के लिए) होता है, जो मानक ज्यामितीय वितरण है। आप कैलकुलेटर में r = 1 सेट करके इसे सत्यापित कर सकते हैं।

माध्य, प्रसरण और अति-प्रसरण

पैरामीटराइजेशनमाध्य (Mean)प्रसरण (Variance)मानक विचलन (Std Dev)
मोड A (असफलताएँ X)r(1−p)/pr(1−p)/p²√(r(1−p)/p²)
मोड B (परीक्षण Y)r/pr(1−p)/p²√(r(1−p)/p²)

इस वितरण का एक मुख्य गुण यह है कि प्रसरण = माध्य + माध्य²/r होता है। चूँकि माध्य²/r > 0 है, इसलिए इसका प्रसरण हमेशा इसके माध्य से अधिक होता है। इसे अति-प्रसरण (Overdispersion) कहा जाता है — यह पॉइसन वितरण के विपरीत है, जहाँ प्रसरण हमेशा माध्य के बराबर होता है। जैसे-जैसे r → ∞ होता है (माध्य को स्थिर रखते हुए), ऋणात्मक द्विपद वितरण पॉइसन वितरण की ओर प्रवृत्त होता है।

द्विपद वितरण से संबंध

हालांकि दोनों वितरणों में बर्नौली परीक्षण शामिल होते हैं, लेकिन उनकी भूमिकाएँ उलटी होती हैं। द्विपद वितरण B(n, p) में, परीक्षणों की संख्या n स्थिर होती है और सफलताओं X की गणना की जाती है। ऋणात्मक द्विपद में, r सफलताएँ आवश्यक होती हैं और असफलताओं (या कुल परीक्षणों) की गणना की जाती है।

अनुप्रयोग

  • बीमा और वास्तविक विज्ञान (Actuarial Science): पॉलिसीधारकों के विषम जोखिमों के मामले में दावों की संख्या को मॉडल करने के लिए।
  • पारिस्थितिकी (Ecology): प्रजातियों की प्रचुरता और कीड़ों की आबादी की गणना के लिए, जो आमतौर पर अति-प्रसरित होती हैं।
  • जीनोमिक्स / RNA-seq: जीन अभिव्यक्ति विश्लेषण में रीड काउंट को मॉडल करने के लिए DESeq2 और edgeR जैसे उपकरणों में ऋणात्मक द्विपद वितरण का बड़े पैमाने पर उपयोग किया जाता है।
  • महामारी विज्ञान (Epidemiology): संक्रामक रोगों (जैसे COVID-19) के सुपरस्प्रेडर डायनामिक्स को मॉडल करने में, जहाँ रोग फैलने की घटनाएँ अति-प्रसरित होती हैं।
  • विश्वसनीयता इंजीनियरिंग: किसी मरम्मत योग्य प्रणाली के r-वें खराब होने तक लगने वाले समय का विश्लेषण करने के लिए।
  • खेल विश्लेषण: फुटबॉल में प्रति गेम किए गए गोलों, क्रिकेट में एक पारी में बने रनों और गेंदबाजी स्पेल में लिए गए विकेटों के अति-प्रसरित पैटर्न को समझने के लिए।

अक्सर पूछे जाने वाले प्रश्न (FAQ)

ऋणात्मक द्विपद वितरण क्या है?
ऋणात्मक द्विपद वितरण एक असंतत प्रायिकता वितरण है जो स्वतंत्र बर्नौली परीक्षणों की एक श्रृंखला में एक निर्दिष्ट संख्या में सफलताओं r के प्राप्त होने से पहले आवश्यक असफलताओं (मोड A) या परीक्षणों की संख्या (मोड B) को दर्शाता है, जहाँ प्रत्येक परीक्षण में सफलता की प्रायिकता p होती है।
द्विपद (Binomial) और ऋणात्मक द्विपद (Negative Binomial) में क्या अंतर है?
द्विपद: परीक्षणों की संख्या n स्थिर है, और सफलताओं की संख्या यादृच्छिक है। ऋणात्मक द्विपद: आवश्यक सफलताओं की संख्या r स्थिर है, और असफलताओं या परीक्षणों की संख्या यादृच्छिक है। द्विपद पूछता है "10 सिक्का उछालने में कितने चित (heads) आएंगे?" जबकि ऋणात्मक द्विपद पूछता है "3 चित मिलने तक सिक्का कितनी बार उछालना पड़ेगा?"
ऋणात्मक द्विपद वितरण में r और p क्या दर्शाते हैं?
r लक्षित सफलताओं की संख्या है — एक स्थिर धनात्मक पूर्णांक। p एक एकल परीक्षण पर सफलता की प्रायिकता है (0 < p < 1)। परीक्षण स्वतंत्र होते हैं। r वितरण के आकार को नियंत्रित करता है: बड़ा r इसे अधिक सममित (symmetric) बनाता है, जबकि छोटा r इसे दाईं ओर अधिक विषम (skewed) बनाता है।
पास्कल वितरण क्या है?
पास्कल वितरण ऋणात्मक द्विपद वितरण का मोड B पैरामीटराइजेशन है, जहाँ Y = r-वीं सफलता का परीक्षण संख्या है। इसका नाम ब्लेज पास्कल के नाम पर रखा गया है। इसका माध्य r/p (वह अपेक्षित परीक्षण संख्या जिस पर r-वीं सफलता मिलती है) और प्रसरण r(1-p)/p² होता है।
ऋणात्मक द्विपद वितरण ज्यामितीय वितरण में कब बदलता है?
जब r = 1 सेट किया जाता है, तो यह बिल्कुल ज्यामितीय वितरण बन जाता है। मोड A में यह पहली सफलता से पहले असफलताओं की संख्या P(X=k) = p(1-p)^k को मापता है, और मोड B में यह पहली सफलता के लिए कुल आवश्यक परीक्षणों P(Y=n) = p(1-p)^(n-1) को मापता है।
अति-प्रसरण (Overdispersion) क्या है?
जब किसी वितरण का प्रसरण (variance) उसके माध्य (mean) से अधिक हो जाता है, तो उसे अति-प्रसरण कहा जाता है। पॉइसन मॉडल में हमेशा प्रसरण = माध्य होता है, लेकिन वास्तविक दुनिया के डेटा में प्रसरण अक्सर बड़ा होता है। ऋणात्मक द्विपद में प्रसरण हमेशा माध्य से बड़ा होता है, जो इसे अति-प्रसरित डेटा के लिए आदर्श बनाता है।
इस कैलकुलेटर में 'k_max' क्या है?
k_max वह सीमा है जहाँ तक प्रायिकता तालिका और बार चार्ट प्रदर्शित किए जाते हैं। ऋणात्मक द्विपद वितरण का सिरा (tail) अनंत तक जा सकता है, इसलिए हम तालिका और चार्ट को सीमित करने के लिए एक स्वचालित या उपयोगकर्ता-निर्धारित सीमा (k_max) का उपयोग करते हैं।

वितरण के मुख्य सूत्र

प्रायिकता द्रव्यमान कार्य (PMF - मोड A): P(X = k) = k+r-1Ck pr (1-p)k
माध्य (μ - मोड A): μ = r(1-p)/p
प्रसरण (σ²): σ² = r(1-p)/p²
अति-प्रसरण संबंध: प्रसरण = माध्य + माध्य²/r