P(λ)

पॉइसन वितरण कैलकुलेटर

PMF · CDF · उत्तरजीविता · सीमा प्रायिकता · बार चार्ट

कैलकुलेटर की मदद से किसी भी दर λ के लिए P(X=k) = e−λλk/k!, संचयी P(X≤k), P(X>k), और सीमा P(a≤X≤b) की गणना करें। इसमें पूर्ण प्रायिकता तालिका और कैनवास बार चार्ट शामिल हैं।

त्वरित उदाहरण

दर > 0
पूर्णांक ≥ 0

पॉइसन वितरण क्या है?

पॉइसन वितरण (Poisson distribution) एक मूलभूत असतत प्रायिकता वितरण (discrete probability distribution) है। यह दर्शाता है कि कोई यादृच्छिक घटना (random event) किसी निश्चित समयांतराल, स्थान या किसी अन्य निरंतर माध्यम में कितनी बार घटित होती है — बशर्ते कि ये घटनाएं एक-दूसरे से स्वतंत्र रूप से और एक स्थिर औसत दर λ (लैम्ब्डा) पर घटित हों। इसे पहली बार फ्रांसीसी गणितज्ञ सिमोन डेनिस पॉइसन ने 1837 में द्विपद वितरण के एक सीमित मामले के रूप में प्राप्त किया था जब n बड़ा होता है और p छोटा होता है।

द्विपद वितरण के विपरीत, जो परीक्षणों की एक निश्चित संख्या में सफलताओं की गणना करता है, पॉइसन वितरण उन गणना डेटा को मॉडल करता है जहां कोई सैद्धांतिक ऊपरी सीमा नहीं होती है। आपके पास किसी अंतराल में 0, 1, 2, … कितनी भी घटनाएं हो सकती हैं। सामान्य उदाहरणों में एक घंटे में चेकआउट काउंटर पर आने वाले ग्राहकों की संख्या, प्रति दिन प्राप्त होने वाले ईमेल की संख्या, या एक मीटर कपड़े में धागे के दोषों की संख्या शामिल हैं।

PMF सूत्र और लॉग-स्पेस गणना (Log-Space Computation)

पॉइसन वितरण का प्रायिकता द्रव्यमान फलन (Probability Mass Function - PMF) निम्नलिखित है:

P(X = k) = e−λ × λk / k!  जहाँ k = 0, 1, 2, …

बड़े λ या k के लिए, λk और k! की सीधे गणना करने से अंकगणितीय ओवरफ्लो (overflow) हो जाता है। इसका समाधान लॉग-स्पेस गणना (log-space computation) है:

log P(X = k) = −λ + k × ln(λ) − ln(k!) P(X = k) = exp(−λ + k × ln(λ) − ln(k!))

जहाँ ln(k!) को संचयी योग का उपयोग करके कुशलतापूर्वक संचित किया जाता है: ln(k!) = Σi=1k ln(i)। यह दृष्टिकोण λ को 200 तक और k को 150 तक के मानों के लिए संख्यात्मक रूप से स्थिर रखता है।

पॉइसन वितरण के गुण (Properties)

गुण (Property)मान (Value)टिप्पणी
माध्य (μ)λघटनाओं की अपेक्षित संख्या
प्रसरण (σ²)λमाध्य के बराबर — पॉइसन का एक अनूठा गुण
मानक विचलन (σ)√λवितरण का फैलाव
विषमता (Skewness)1/√λदाईं ओर झुका हुआ; बड़े λ के लिए सममित (symmetric)
ककुदता (Excess Kurtosis)1/λλ → ∞ होने पर सामान्य वितरण की ओर प्रवृत्त
बहुलक (Mode)⌊λ⌋ और ⌊λ⌋−1 (यदि λ पूर्णांक है)सबसे संभावित संख्या

समान माध्य-प्रसरण गुण (μ = σ² = λ) इसकी एक अनूठी विशेषता है। व्यावहारिक रूप से, यदि आपके पास डेटा में प्रसरण माध्य से बहुत अधिक है (अति-प्रकीर्णन/overdispersion), तो ऋणात्मक द्विपद वितरण (negative binomial distribution) अधिक उपयुक्त हो सकता है।

योगज गुण और सुपरपोजिशन (Additive Property)

यदि X ~ Poisson(λ1) और Y ~ Poisson(λ2) स्वतंत्र हैं, तो X + Y ~ Poisson(λ1 + λ2) होता है। यह योगज गुण (additive property) पॉइसन प्रक्रियाओं को संयोजित करना आसान बनाता है — दो स्वतंत्र पॉइसन धाराओं की कुल आगमन दर केवल उनकी व्यक्तिगत दरों का योग होती है।

घातीय वितरण (Exponential Distribution) से संबंध

यदि घटनाएं दर λ घटनाओं प्रति इकाई समय के साथ एक पॉइसन प्रक्रिया का पालन करती हैं, तो लगातार दो घटनाओं के बीच का आगमन अंतराल समय (inter-arrival time) दर λ (माध्य 1/λ) के साथ एक घातीय वितरण का पालन करता है। यह संबंध कतार सिद्धांत (queuing theory) और M/M/1 कतार मॉडल का मुख्य आधार है:

  • आगमन: प्रति घंटे ग्राहकों की संख्या ~ Poisson(λ)
  • प्रतीक्षा समय: अगले ग्राहक तक का प्रतीक्षा समय ~ Exponential(λ)
  • सेवा समय: यदि सेवा दर μ है, तो प्रति सेवा समय ~ Exponential(μ)

द्विपद के लिए पॉइसन सन्निकटन (Poisson Approximation to Binomial)

जब n बड़ा (≥ 20) और p छोटा (≤ 0.05) हो, तो द्विपद प्रायिकता की गणना करना कठिन हो जाता है। चूंकि माध्य λ = np है, हम Binomial(n, p) को Poisson(λ = np) द्वारा सन्निकटित करते हैं। सन्निकटन त्रुटि min(p, λ/n) द्वारा सीमित होती है और निश्चित λ के साथ n → ∞ होने पर बेहतर होती है।

वास्तविक दुनिया के अनुप्रयोग

  • कतार सिद्धांत / कॉल सेंटर: प्रति समय अंतराल ग्राहकों के आगमन की संख्या; M/M/1 कतार विश्लेषण।
  • दूरसंचार: नेटवर्क बफ़र्स में पैकेट का आगमन; प्रति मिनट ड्रॉप हुई कॉल की संख्या।
  • महामारी विज्ञान: दुर्लभ स्थितियों के लिए प्रति वर्ष प्रति जिला बीमारी के मामलों की संख्या।
  • रेडियोधर्मी क्षय: गीगर काउंटर क्लिक प्रति सेकंड पूरी तरह से पॉइसन वितरण का पालन करते हैं।
  • बीमा: प्रति पॉलिसीधारक प्रति वर्ष दावों (claims) की संख्या।
  • वेबसाइट ट्रैफ़िक: प्रति सेकंड पेज अनुरोध, विशेष रूप से गैर-पीक घंटों के दौरान।
  • विनिर्माण गुणवत्ता: उत्पादन लाइन पर प्रति इकाई क्षेत्र दोषों की संख्या।
  • पारिस्थितिकी: सर्वेक्षण में प्रति हेक्टेयर दुर्लभ प्रजातियों के दिखने की संख्या।
  • खगोल विज्ञान: टेलीस्कोप डिटेक्टर पर प्रति सेकंड पहुँचने वाले फोटॉन की संख्या।

अक्सर पूछे जाने वाले प्रश्न (FAQ)

पॉइसन वितरण (Poisson distribution) क्या है?
पॉइसन वितरण एक असतत प्रायिकता वितरण है जो समय या स्थान के एक निश्चित अंतराल में होने वाली घटनाओं की संख्या को दर्शाता है, बशर्ते घटनाओं की एक ज्ञात निरंतर औसत दर λ हो और घटनाएं एक-दूसरे से स्वतंत्र हों। इसका PMF k = 0, 1, 2, … के लिए P(X=k) = e−λλk/k! होता है। यह सिमोन डेनिस पॉइसन (1837) के नाम पर रखा गया है और द्विपद वितरण की सीमा के रूप में स्वाभाविक रूप से उत्पन्न होता है।
लैम्ब्डा (λ) क्या दर्शाता है?
लैम्ब्डा (λ) पॉइसन वितरण का दर पैरामीटर है — प्रति अंतराल अपेक्षित घटनाओं की संख्या। उदाहरण के लिए, यदि प्रति घंटे औसतन 5 ग्राहक आते हैं, तो λ = 5। लैम्ब्डा एक सकारात्मक वास्तविक संख्या होनी चाहिए। यह वितरण के माध्य और प्रसरण दोनों के बराबर होता है, इसलिए इसे सीधे डेटा से नमूना औसत मान के रूप में आकलित किया जा सकता है।
मुझे पॉइसन बनाम द्विपद (binomial) वितरण का उपयोग कब करना चाहिए?
द्विपद वितरण का उपयोग तब करें जब आपके पास स्वतंत्र परीक्षणों की एक निश्चित संख्या n हो, और प्रत्येक में सफलता की प्रायिकता p हो। पॉइसन वितरण का उपयोग तब करें जब घटनाएं एक निरंतर अंतराल में कितनी भी बार घटित हो सकती हैं और कोई निश्चित ऊपरी सीमा न हो — विशेष रूप से जब घटनाएं दुर्लभ हों या जब n बहुत बड़ा और p बहुत छोटा हो। नियम के अनुसार: यदि n ≥ 20 और p ≤ 0.05 (या np ≤ 10), तो पॉइसन द्विपद का एक बहुत अच्छा सन्निकटन है।
द्विपद के लिए पॉइसन सन्निकटन क्या है?
जब n बड़ा (≥ 20) और p छोटा (≤ 0.05) हो, तो Binomial(n, p) ≈ Poisson(λ = np) होता है। कंप्यूटर से पहले यह सन्निकटन बहुत महत्वपूर्ण था क्योंकि बड़े n के लिए C(n,k) की गणना करना अव्यावहारिक था। आज यह अवधारणात्मक रूप से उपयोगी है और तब काम आता है जब p इतना छोटा होता है कि डेटा से द्विपद प्रायिकता का अनुमान लगाना कठिन होता है। इन दोनों की तुलना करने के लिए ऊपर दिए गए 'सन्निकटन' टैब का उपयोग करें।
माध्य और प्रसरण दोनों λ के बराबर क्यों होते हैं?
यह सीधे आघूर्ण जनक फलन M(t) = exp(λ(et − 1)) से सिद्ध होता है। t = 0 पर पहला अवकलज E[X] = λ देता है। दूसरा केंद्रीय आघूर्ण (प्रसरण) भी λ होता है। यह विशेषता काफी व्यावहारिक है: आप नमूना माध्य और नमूना प्रसरण की तुलना करके यह जांच सकते हैं कि डेटा पॉइसन वितरण का पालन करता है या नहीं। यदि प्रसरण माध्य से बहुत अधिक है, तो ऋणात्मक द्विपद मॉडल का उपयोग करें।
पॉइसन और घातीय वितरण के बीच क्या संबंध है?
यदि घटनाएं दर λ के साथ एक पॉइसन प्रक्रिया का पालन करती हैं, तो क्रमिक घटनाओं के बीच प्रतीक्षा समय Exponential(λ) होता है जिसका माध्य 1/λ होता है। उदाहरण के लिए, यदि एक सर्वर प्रति सेकंड λ = 10 अनुरोध (पॉइसन) प्राप्त करता है, तो अनुरोधों के बीच का औसत अंतराल 0.1 सेकंड होता है, और यह अंतराल घातीय रूप से वितरित होता है। यह संबंध M/M/1 कतार सिद्धांत का आधार है — जहाँ M "स्मृतिहीन" (Memoryless) को दर्शाता है।
पॉइसन वितरण के वास्तविक दुनिया में क्या अनुप्रयोग हैं?
पॉइसन वितरण के अनुप्रयोगों में शामिल हैं: कतार सिद्धांत और कॉल सेंटर स्टाफिंग (प्रति घंटे ग्राहक आगमन), नेटवर्क ट्रैफ़िक इंजीनियरिंग (प्रति मिलीसेकंड पैकेट आगमन), महामारी विज्ञान (प्रति वर्ष प्रति 1,00,000 आबादी पर बीमारी के मामले), परमाणु भौतिकी (रेडियोधर्मी क्षय गणना), बीमा विज्ञान (प्रति वर्ष दावों की संख्या), वेबसाइट लोड परीक्षण (प्रति सेकंड अनुरोध), विनिर्माण गुणवत्ता नियंत्रण (प्रति इकाई क्षेत्र दोष), पारिस्थितिकी (प्रति नमूना क्षेत्र जीवों की संख्या), और खगोल विज्ञान (प्रति डिटेक्टर पिक्सेल फोटॉन संख्या)।