İstatistiksel analizde varyans Bir veri setinin üyeleri arasında, veri noktalarının bir trend çizgisinden ne kadar uzak olduğunu ve aynı zamanda regresyon hattı. Varyans ne kadar yüksekse, veri noktaları o kadar fazla yayılır. Varyans analizi çalışması, varyansın hangi bölümlerinin verilerin özelliklerine göre açıklanabileceğini ve hangilerinin rastgele faktörlere atfedilebileceğini göstermektedir. Varyansın açıklanamayan kısmına rezidüel varyans denir.
Kalıntı Varyansını Hesaplamak için Excel Tablolarını Kullanma
Kalıntı varyansını hesaplamak için formül sayısız karmaşık hesaplamaları içerir. Küçük veri kümeleri için, artık varyansın elle hesaplanması işlemi sıkıcı olabilir. Büyük veri kümeleri için görev yorucu olabilir. Bir Excel elektronik tablosu kullanarak, yalnızca veri noktalarını girmeniz ve doğru formülü seçmeniz gerekir. Program karmaşık hesaplamaları yapar ve hızlı bir şekilde sonuç verir.
Veri noktaları
Yeni bir Excel elektronik tablosu açın ve veri noktalarını iki sütuna girin. Regresyon çizgileri, her veri noktasının iki öğeye sahip olmasını gerektirir. İstatistikçiler bu öğeleri "X" ve "Y" olarak etiketler. Mesela, Generic Insurance Co., çalışanlarının boy ve ağırlığının rezidüel varyansını bulmak istiyor. X değişkeni yüksekliği temsil eder ve Y değişkeni ağırlığı temsil eder. Yükseklikleri A sütununa, ağırlıkları B sütununa girin.
Ortalamayı Bulmak
anlamına gelmek Veri kümesindeki her elemanın ortalamasını temsil eder. Bu örnekte, Genel Sigorta, 10 çalışanın boy ve ağırlıklarının ortalamasını, standart sapmasını ve kovaryansını bulmak istiyor. Sütun A'da listelenen yüksekliklerin ortalaması, "= ORTALAMA (A1: A10)" işlevini F1 hücresine girerek bulunabilir. B sütununda listelenen ağırlıkların ortalaması, "= ORTALAMA (B1: B10)" işlevini F3 hücresine girerek bulunabilir.
Standart Sapma ve Kovaryansı Bulma
standart sapma Veri noktalarının ortalamadan ne kadar uzaklaştığını ölçer. kovaryans Veri noktasının iki öğesinin birlikte ne kadar değiştiğini ölçer. Yüksekliklerin standart sapması, F2 hücresine "= STDEV (A1: A10)" fonksiyonunun girilmesiyle bulunur. Ağırlıkların standart sapması, F4 hücresine "= STDEV (B1: B10)" işlevinin girilmesiyle bulunur. Yükseklikler ve ağırlıklar arasındaki kovaryans, "= COVAR (A1: A10; B1: B10)" fonksiyonunu F5 hücresine girerek bulunur.
Regresyon Çizgisini Bulma
regresyon hattı veri noktalarının eğilimini izleyen doğrusal bir işlevi temsil eder. Regresyon çizgisinin formülü şöyle görünür: Y = aX + b.
Kullanıcı, "a" ve "b" için değerleri, ortalamalar, standart sapmalar ve kovaryans hesaplarını kullanarak bulabilir. "B" değeri, regresyon çizgisinin Y eksenini kestiği noktayı temsil eder. Değer, kovaryans alınarak ve X değerlerinin standart sapmasının karesine bölünerek bulunabilir. Excel formülü F6 hücresine gider ve şöyle görünür: = F5 / F2 ^ 2.
"A" değeri regresyon çizgisinin eğimini temsil eder. Excel formülü F7 hücresine gider ve şöyle görünür: = F3-F6 * F1.
Regresyon çizgisinin formülünü görmek için, bu dize birleştirme işlemini F8 hücresine girin:
= CONCATENATE ("Y ="; YUVARLAK (F6; 2); "X"; IF (SIGN (F7) = 1; "+"; "-"); ABS (YUVARLAK (F7; 2)))
Y Değerlerini Hesapla
Bir sonraki adım, veri setinde verilen X değerleri için regresyon hattındaki Y değerlerinin hesaplanmasını içerir. Y değerlerini bulma formülü C sütununa gider ve şöyle görünür:
= $ F $ 6 * A (i) + $ F $ 7
Burada A (i), Satır (i) 'deki A Sütunu değeridir. Formüller elektronik tabloda şöyle görünür:
= $ F $ 6 * A1 + $ F $ 7
= $ F $ 6 * A2 + $ F $ 7
= $ F $ 6 * A3 + $ F $ 7 vb.
Sütun D'deki girdiler, Y için beklenen ve gerçek değerler arasındaki farkları gösterir. Formüller şöyle görünür:
= B (i) -C (i)
Burada B (i) ve C (i), sırasıyla B ve C sütunlarındaki Satır (i) 'deki değerlerdir.
Kalan Varyansı Bulmak
rezidüel varyans formülü F9 hücresine gider ve şöyle görünür:
= SUMSQ (D1: D10) / (COUNT (D1: D10) -2)
SUMSQ (D1: D10), gerçek ve beklenen Y değerleri arasındaki farkların karelerinin toplamı ve (COUNT (D1: D10) -2) veri noktalarının sayısıdır, eksi 2'deki serbestlik dereceleri için veri.