Sisteminizde veya işleminizde veri topladığınızda, bir sonraki adım ne tür bir olasılık dağılımına sahip olduğunu belirlemektir. Olasılık dağılım tipleri şunlardır: ayrık düzgün, Bernoulli, binom, negatif binom, Poisson, geometrik, sürekli düzgün, normal (çan eğrisi), üstel, gamma ve beta dağılımları. Olanak listesinden birkaçı daraltmak, hangisinin en yakın R kare değerinin daha hızlı olduğunu belirlemeyi sağlar.
İhtiyacınız olacak ürünler
-
Grafik yazılımı
-
R kare değerinin hesaplanması (en uygun analiz)
Veri tipinin görsel bir gösterimi için verileri çizin.
Bir veri dağılımının ne olduğunu belirlemek için atılacak ilk adımlardan biri - ve dolayısıyla verileri modellemek için kullanılacak denklem tipi - ne olamayacağını dışlamak. • Veri setinde herhangi bir tepe varsa, ayrı bir tek tip dağılım olamaz. • Verilerin birden fazla zirvesi varsa, Poisson veya binom değildir. • Tek bir eğri varsa, ikincil tepe noktası olmaz ve her iki tarafta da yavaş bir eğim varsa, Poisson veya gama dağılımı olabilir. Ancak ayrık bir düzgün dağılım olamaz. • Veriler eşit şekilde dağıtılıyorsa ve bir tarafa doğru eğrilme göstermiyorsa, bir gama veya Weibull dağılımını ekarte etmek güvenlidir. • İşlev, elde edilen sonuçların ortasında düz bir dağılıma ya da tepe noktasına sahipse, geometrik bir dağılım ya da üstel bir dağılım değildir. • Bir faktörün oluşumu çevresel değişkene göre değişiyorsa, muhtemelen Poisson dağılımı değildir.
Olasılık dağılım tipi daraltıldıktan sonra, olası her olası dağılım dağılımının bir R kare analizi yapın. En yüksek R kare değerine sahip olan büyük olasılıkla doğrudur.
Bir outlier veri noktasını kaldırın. Sonra R karesini tekrar hesapla. Aynı olasılık dağılım tipi en yakın eşleşme olarak karşımıza çıkarsa, bunun veri seti için kullanılacak doğru olasılık dağılımı olduğuna dair yüksek bir güven vardır.
İpuçları
-
Veriler birden fazla tepe noktasını geniş bir dağılım gösteriyorsa, iki ayrı işlemin devam etmesi veya örneklenen ürünün karıştırılması mümkündür. Verileri yeniden toplayın ve sonra yeniden analiz edin.
Uyarı
Veri kümesi için hala doğru olduğunu onaylamak için daha sonraki veri kümelerine karşı oluşturulan denklemleri doğrulayın. Çevresel faktörlerin ve süreç kaymasının mevcut denklemleri ve modelleri yanlış yapmış olması mümkündür.