Yazar adı: Ayşe Sıla Şahin

Merhaba, ben Ayşe Sıla. Dokuz Eylül Üniversitesi İstatistik bölümü mezunuyum. Bilgi sahibi olduğum konuları açıklayıcı ve çok da zor olmayacak şekilde anlatıyor olacağım.

STEM

Nitel/Nicel Verilerin Tablo ve Grafiklerle Özetlenmesi

Elimizde bir veri seti var bazı istatistiksel çıkarımlarda bulunduk ve sonuçlar elde ettik, peki bu yeterli midir? Tabi ki de hayır. Veri setindeki bilgileri özetlemek, karakterize etmek için bazı yöntemlere ihtiyacımız var. Serinin ikinci yazısında bu yöntemlerden bahsediyor olacağız. Veriyi grafiksel ve sayısal yöntemler ile açıklayabiliriz.   Veri:   Nitel veri:   Çubuk Diyagramı (Bar Chart):   Her bir ayrı kategori çubuklar ile gösterilir. Çubuklar dikey ya da yatay şekilde olabilir.     Pasta Diyagramı (Pie Chart)   Her kategori ayrı pasta dilimleriyle gösterilir. Tercihe göre pasta dilimlerin üzerinde oranlar gösterilir.     Pareto Diyagramı     İki tane dikey ekseni bulunur. Tüm kategorilerin birikimli olarak frekansını verir. Kategoriler en sıktan en aza doğru sıralanır.     Frekans Dağılım Tablosu Sınıf: Her bir kategoriyi ifade eder. Sınıf Frekansı: Veri setindeki belirli bir sınıfa giren gözlem sayısıdır. Göreli Sınıf Frekansı: Her bir sınıf frekansının veri setindeki toplam gözlem sayısına bölünmesiyle bulunur. Sınıf Yüzdesi: Göreli sınıf frekansının 100 ile çarpımıyla bulunur. Daha iyi anlayabilmek için gelin örneklendirelim. Lise öğrencilerinin bulunduğu bir servis düşünelim. Toplamda 30 öğrenci var ve bu öğrencilere kaçıncı sınıf oldukları soruluyor.   Sınıfları Lise 1, Lise 2, Lise 3, Lise 4 olarak ayırırsak; Sınıf 1 : 10 tane Lise 1 öğrencisi vardır. Sınıf 2 : 8 tane Lise 2 öğrencisi vardır. Sınıf 3 : 6 tane Lise 3 öğrencisi vardır. Sınıf 4 : 6 tane Lise 4 öğrencisi vardır. Sınıf 1’in göreli frekansı = 10/30 = 0.33 Sınıf 2’nin göreli frekansı = 8/30 = 0.27 Sınıf 3’ün göreli frekansı = 6/30 = 0.2 Sınıf 4’ün göreli frekansı = 6/30 = 0.2 Her göreli sınıf frekans değerine  x100 yaparız. Ve sonrasında birikimli sınıf yüzdelerini buluruz. Ve böylece frekans dağılım tablosunu oluşturmuş oluruz. Nicel Veri:   Nokta Grafiği (Dot Plot)   Her bir veri nokta ile gösterilir. Kategoriler arasında karşılaştırma yapmayı kolaylaştırır. Küçük veri setlerinde kullanılır. Nokta grafiğindeki oluşan desen ile veri setinde simetrik ya da çarpıklık olduğunu gözlemleyebiliriz.   Yukarıdaki nokta grafiğinde 0-9 (En kötü:0, En iyi: 9) arasında bulunan rakamları, anket değerlendirmesindeki bir soru için kullanıldığını düşünürsek;  “0” verenlerin 4 tane olduğunu, “1” verenlerin 6 tane olduğu, “2” verenlerin 3 tane olduğunu ve “6” değerinin hiç verilmediğini söyleyebiliriz.   Gövde Yaprak Grafiği (Steam and Leaf Display) Çizginin sol tarafında bulunan rakamları kök, sağ taraftakileri ise yaprak olarak alınır. Küçükten büyüğe sıralanır. Veri setine göre gövde ve yaprak grafikleri değişiklik gösterebilir.   Veri setinde 52,65,66,95,80,57,78,78,41,58,70,80,78,75 sayıları vardır. Burada sayıların onlar basamağındaki rakamları kök kısmına, birler basamağındaki rakamları da yaprak kısmına yazılır.   Histogram Çubukların yüksekliği frekanslara karşılık gelir. Her çubuk birbirleriyle bitişiktir. Çubuk grafiğiyle karıştırılmamaya özen gösterilmelidir. Grafiğin şekline göre simetrik ya çarpık olduğuyla ilgili bilgi verebilir.     Frekans Poligonu Frekans histogramı ya da frekans poligonu olarak bilinir. Çubuk yüksekliklerinin orta noktaları birleştirilir.         Ogive   Frekans poligonuna benzer fakat burada birikimli göreceli frekansları gösterir. Toplam frekansa ulaşıncaya kadar toplayarak bulunur.     Keyifli okumalar dilerim 🙂  

STEM

İstatistiğe Giriş : Temel Kavramlar ve Veri Türleri

Herkese Merhaba! Son zamanlarda herkesin dilinde olan, internet sitelerinde ve birçok yerde adını sık duyduğumuz ve daha da duyacağımız “İstatistik” ile ilgili bilgilerden bahsediyor olacağım. Gün içinde sürekli duyduğumuz, internete, sosyal medyaya girdiğimizde sürekli karşımıza çıkan birçok sayının istatistiksel hesaplamalarla ortaya çıktığını az çok tahmin ediyoruzdur. Aslında gördüğümüz rakamlardan ve sayılardan çok daha fazlasıdır çünkü o konuyla ilgili yorum yapmamıza olanak sağlar. Geçtiğimiz senelerde neredeyse herkesin hakim olduğu, her gün bekledikleri “Türkiye Günlük Koronavirüs Tablosu” en büyük örneklerden biri olabilir. Hatırlarsanız tabloda “Bugünkü hasta sayısı” ve “Bugünkü iyileşen sayısı” vardı. Yaşlısından gencine hatta çocuklar bile bu iki değere bakıp karşılaştırarak durumun daha iyiye gidip gitmediği yorumunda bulunabiliyordu. İstatistiğe zor gözüyle bakılıp biraz kaçınılsa da hayatımızın her yerinde olduğunu görüyoruz. Zor deyip geçmek yerine gelin hep birlikte öğrenmeye çalışalım. Tabi burada istemek en büyük etken, çünkü insan yeterince isterse yapamayacağı hiçbir şey yoktur 🙂 Şimdi istatistik ile ilgili bilgilerimi çok da zor olmayacak şekilde anlatmaya başlayabilirim. İstatistik aslında bilimlerin evrensel dilidir. İşletme, devlet, tıp, çevre, fizik ve sosyal bilimlere geniş bir uygulama alanına sahip faydalı bir bilimdir. İstatistik, sayısal bilgileri toplama, sınıflandırma, özetleme, düzenleme, analiz etme ve yorumlamayı içeren veri bilimidir. Peki veri (data) nedir? Veri, belirli bir birimler kümesinde bir veya daha fazla değişken için toplanan tüm gözlemlerin/ölçümlerin kümesidir. Veri hamdır, seçim yaparak ve yorumlayarak geliştirildiğinde ise bilgiyi (information) oluşturur. İstatistiğin iki türlü uygulama alanı vardır, biri “Tanımlayıcı İstatistik (Descriptive Statistics)” bir diğeri ise “Çıkarsamalı İstatistik (Inferential Statistics)” dir. Tanımlayıcı İstatistik de pasta diyagramı, çubuk diyagramı gibi tablolar grafikler kullanılır özet bilgiler verinin ortalaması, standart sapması, minimum, maksimum gibi değerleri verir.Çıkarsamalı İstatistik, elimizdeki verileri kullanarak daha büyük veri grupları için tahminde bulunmak genelleme yapmak için kullanılır. İkiye ayrılır; Tahmin (Estimation) : Elimizdeki veriyi kullanarak tahminde bulunmak, genelleme yapmak için kullanılır. Hipotez testi : Herhangi bir konuda olan iddianın doğru olup olamayacağını araştırır. Şimdilik başlık olarak görüp ilerleyen konularda daha detaylı göreceğiz. İstatistiğin bazı temel unsurları vardır, bunlar; Bunlar bilgi almak ya da üzerinde çalışma yapmak istediğimiz topluluğa kitle (population) Kitleyi temsil etmek üzere seçtiğimiz alt gruba örneklem (sample) Bilgi üretebildiğimiz özelliklere değişken (variable) Tüm kitle üstünde yapılan sayımlara tamsayım (census) Veri topladığımız herhangi bir şeye deney birimi (experimental unit) Kitle ve örneklem birbiriyle genellikle çok karıştırılır ve daha iyi anlayabilmek için örnek verirsek: Kitleyi İzmir’de okuyan öğrenciler olarak seçersek, burayı temsil etmek üzere bir program aracılığıyla kişiler seçilecek ve bu da bizim örneklemimiz olmuş olacak. Seçilen kişilerin yaşı, okuduğu okulu, bölümü, cinsiyeti değişkenimiz olmuş olacak. Örneklemimiz ne kadar büyük olursa kitlemizi de o kadar iyi yansıtacaktır. Fakat burada kitle ve örneklem özellikleri arasında ayrım yapmamız gerekir. Parameter (parametre) kitlenin herhangi bir özelliğidir, statistic (istatistik) ise örneklemin herhangi bir özelliğidir. Elimizde bir veri var ve bu verini türü nedir? Nasıl sınıflandırmalıyız? İlk olarak bu iki önemli soruyu sormalıyız. Veri türleri nicel (quantitative) ve nitel (qualitative) olarak ikiye ayrılır. Nicel Veri : Sayısal ölçekte kaydedilen ölçümlerdir. Yaş Kilo İşsizlik oranı Hava sıcaklığı Nitel Veri : Sayısal ölçekte ölçülemeyen ölçümlerdir. Gözlem sonucu elde edilir. Renkler Yemeğin tadı (iyi, kötü) Tatlar (tuzlu, tatlı, ekşi) Nicel veriyi de kendi içinde kesikli (discerete) veri ve sürekli (continuous) veri olarak ikiye ayırıyoruz. Kesikli Veri : Sayı aralığında belirli değerleri alabilir. Kitaptaki sayfa sayısı Sınıftaki öğrenci sayısı Hastanedeki hasta sayısı Sürekli Veri : Ölçerek elde edilen verilerdir. Hava sıcaklığı Sınıftaki öğrencilerin boy uzunluğu Hastanenin iyileşen sayısı oranı Verileri sınıflandırmanın başka bir yolu ise ölçüm düzeylerini kullanmaktır. Ölçüm düzeyleri değişkenlerin tanımlanmasına ve kategorilere ayırmamızı sağlar. Ve ölçüm düzeylerinin her biri uygunluğuna göre istatistiksel analizlerde kullanılır. Açıklayıcı Ölçek (Nominal Scale) Sıralayıcı Ölçek (Ordinal Scale) Aralıklı Ölçek (Interval Scale) Oransal Ölçek (Ratio Scale) Açıklayıcı ölçekten oransal ölçeğe gidildikçe ölçüm düzeyi daha da güçlenir. Açıklayıcı Ölçek (Nominal Scale) : Veriyi sadece açıklayıp kategorileştiriyor. Uzun /kısa Filmin türü Saç rengi Sıralayıcı Ölçek (Ordinal Scale) : Sınıflandırma var fakat bir sıralamaya sokuluyor. Yarış sonucu birinci ikinci ve üçüncü belirlenmesi Sınav notu (AA, BB, FF) Yabancı dil seviyesi Aralıklı Ölçek (Interval Scale) : Sıralayıcı ölçeğe benzer fakat farklar arası anlamlıdır. Toplama, çıkarma işlemleri yapılabilir. Sıcaklık IQ değeri Oransal Ölçek (Ratio Scale) : En güçlü veri türüdür. Sıfır yokluğu ifade eder. Toplama, çıkarma, çarpma, bölme işlemleri yapılabilir. Ağırlık Filmin süresi Veri tipini ve ölçek düzeylerini grafik üzerinde gördüğümüzde aslında daha da anlamış oluyoruz. Böylece istatistiğe ufak bir giriş yapmış olduk. İlerleyen yazılarda da devamı gelecek olan bir çok konu var fakat şimdilik benim söyleyeceklerim bu kadar. Diğer yazılarda görüşmek üzere 🙂

Scroll to Top