İstatistiğe Giriş : Temel Kavramlar ve Veri Türleri

İstatistiğe Giriş : Temel Kavramlar ve Veri Türleri

Herkese Merhaba!
Son zamanlarda herkesin dilinde olan, internet sitelerinde ve birçok yerde adını sık duyduğumuz ve daha da duyacağımız “İstatistik” ile ilgili bilgilerden bahsediyor olacağım.

Gün içinde sürekli duyduğumuz, internete, sosyal medyaya girdiğimizde sürekli karşımıza çıkan birçok sayının istatistiksel hesaplamalarla ortaya çıktığını az çok tahmin ediyoruzdur. Aslında gördüğümüz rakamlardan ve sayılardan çok daha fazlasıdır çünkü o konuyla ilgili yorum yapmamıza olanak sağlar. Geçtiğimiz senelerde neredeyse herkesin hakim olduğu, her gün bekledikleri “Türkiye Günlük Koronavirüs Tablosu” en büyük örneklerden biri olabilir. Hatırlarsanız tabloda “Bugünkü hasta sayısı” ve “Bugünkü iyileşen sayısı” vardı. Yaşlısından gencine hatta çocuklar bile bu iki değere bakıp karşılaştırarak durumun daha iyiye gidip gitmediği yorumunda bulunabiliyordu. İstatistiğe zor gözüyle bakılıp biraz kaçınılsa da hayatımızın her yerinde olduğunu görüyoruz. Zor deyip geçmek yerine gelin hep birlikte öğrenmeye çalışalım. Tabi burada istemek en büyük etken, çünkü insan yeterince isterse yapamayacağı hiçbir şey yoktur 🙂

Şimdi istatistik ile ilgili bilgilerimi çok da zor olmayacak şekilde anlatmaya başlayabilirim.

İstatistik aslında bilimlerin evrensel dilidir. İşletme, devlet, tıp, çevre, fizik ve sosyal bilimlere geniş bir uygulama alanına sahip faydalı bir bilimdir. İstatistik, sayısal bilgileri toplama, sınıflandırma, özetleme, düzenleme, analiz etme ve yorumlamayı içeren veri bilimidir.

Peki veri (data) nedir?

Veri, belirli bir birimler kümesinde bir veya daha fazla değişken için toplanan tüm gözlemlerin/ölçümlerin kümesidir. Veri hamdır, seçim yaparak ve yorumlayarak geliştirildiğinde ise bilgiyi (information) oluşturur.

İstatistiğin iki türlü uygulama alanı vardır, biri “Tanımlayıcı İstatistik (Descriptive Statistics)” bir diğeri ise “Çıkarsamalı İstatistik (Inferential Statistics)” dir.

Tanımlayıcı İstatistik de pasta diyagramı, çubuk diyagramı gibi tablolar grafikler kullanılır özet bilgiler verinin ortalaması, standart sapması, minimum, maksimum gibi değerleri verir.Çıkarsamalı İstatistik, elimizdeki verileri kullanarak daha büyük veri grupları için tahminde bulunmak genelleme yapmak için kullanılır. İkiye ayrılır;

  • Tahmin (Estimation) : Elimizdeki veriyi kullanarak tahminde bulunmak, genelleme yapmak için kullanılır.
  • Hipotez testi : Herhangi bir konuda olan iddianın doğru olup olamayacağını araştırır.

Şimdilik başlık olarak görüp ilerleyen konularda daha detaylı göreceğiz.

İstatistiğin bazı temel unsurları vardır, bunlar;

  • Bunlar bilgi almak ya da üzerinde çalışma yapmak istediğimiz topluluğa kitle (population)
  • Kitleyi temsil etmek üzere seçtiğimiz alt gruba örneklem (sample)
  • Bilgi üretebildiğimiz özelliklere değişken (variable)
  • Tüm kitle üstünde yapılan sayımlara tamsayım (census)
  • Veri topladığımız herhangi bir şeye deney birimi (experimental unit)

Kitle ve örneklem birbiriyle genellikle çok karıştırılır ve daha iyi anlayabilmek için örnek verirsek:

Kitleyi İzmir’de okuyan öğrenciler olarak seçersek, burayı temsil etmek üzere bir program aracılığıyla kişiler seçilecek ve bu da bizim örneklemimiz olmuş olacak. Seçilen kişilerin yaşı, okuduğu okulu, bölümü, cinsiyeti değişkenimiz olmuş olacak. Örneklemimiz ne kadar büyük olursa kitlemizi de o kadar iyi yansıtacaktır.

Fakat burada kitle ve örneklem özellikleri arasında ayrım yapmamız gerekir. Parameter (parametre) kitlenin herhangi bir özelliğidir, statistic (istatistik) ise örneklemin herhangi bir özelliğidir.

Elimizde bir veri var ve bu verini türü nedir? Nasıl sınıflandırmalıyız? İlk olarak bu iki önemli soruyu sormalıyız. Veri türleri nicel (quantitative) ve nitel (qualitative) olarak ikiye ayrılır.

Nicel Veri : Sayısal ölçekte kaydedilen ölçümlerdir.

  • Yaş
  • Kilo
  • İşsizlik oranı
  • Hava sıcaklığı

Nitel Veri : Sayısal ölçekte ölçülemeyen ölçümlerdir. Gözlem sonucu elde edilir.

  • Renkler
  • Yemeğin tadı (iyi, kötü)
  • Tatlar (tuzlu, tatlı, ekşi)

Nicel veriyi de kendi içinde kesikli (discerete) veri ve sürekli (continuous) veri olarak ikiye ayırıyoruz.

Kesikli Veri : Sayı aralığında belirli değerleri alabilir.

  • Kitaptaki sayfa sayısı
  • Sınıftaki öğrenci sayısı
  • Hastanedeki hasta sayısı

Sürekli Veri : Ölçerek elde edilen verilerdir.

  • Hava sıcaklığı
  • Sınıftaki öğrencilerin boy uzunluğu
  • Hastanenin iyileşen sayısı oranı

Verileri sınıflandırmanın başka bir yolu ise ölçüm düzeylerini kullanmaktır. Ölçüm düzeyleri değişkenlerin tanımlanmasına ve kategorilere ayırmamızı sağlar. Ve ölçüm düzeylerinin her biri uygunluğuna göre istatistiksel analizlerde kullanılır.

  • Açıklayıcı Ölçek (Nominal Scale)
  • Sıralayıcı Ölçek (Ordinal Scale)
  • Aralıklı Ölçek (Interval Scale)
  • Oransal Ölçek (Ratio Scale)

Açıklayıcı ölçekten oransal ölçeğe gidildikçe ölçüm düzeyi daha da güçlenir.

Açıklayıcı Ölçek (Nominal Scale) : Veriyi sadece açıklayıp kategorileştiriyor.

  • Uzun /kısa
  • Filmin türü
  • Saç rengi

Sıralayıcı Ölçek (Ordinal Scale) : Sınıflandırma var fakat bir sıralamaya sokuluyor.

  • Yarış sonucu birinci ikinci ve üçüncü belirlenmesi
  • Sınav notu (AA, BB, FF)
  • Yabancı dil seviyesi

Aralıklı Ölçek (Interval Scale) : Sıralayıcı ölçeğe benzer fakat farklar arası anlamlıdır. Toplama, çıkarma işlemleri yapılabilir.

  • Sıcaklık
  • IQ değeri

Oransal Ölçek (Ratio Scale) : En güçlü veri türüdür. Sıfır yokluğu ifade eder. Toplama, çıkarma, çarpma, bölme işlemleri yapılabilir.

  • Ağırlık
  • Filmin süresi

Veri tipini ve ölçek düzeylerini grafik üzerinde gördüğümüzde aslında daha da anlamış oluyoruz. Böylece istatistiğe ufak bir giriş yapmış olduk. İlerleyen yazılarda da devamı gelecek olan bir çok konu var fakat şimdilik benim söyleyeceklerim bu kadar. Diğer yazılarda görüşmek üzere 🙂

yazı

Merhaba, ben Ayşe Sıla. Dokuz Eylül Üniversitesi İstatistik bölümü mezunuyum. Bilgi sahibi olduğum konuları açıklayıcı ve çok da zor olmayacak şekilde anlatıyor olacağım.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir