class: center, middle, inverse, title-slide # 💪 4005 R ile Büyük Veri Analitiği ##
📈 Veri Manipulasyonu_06 ###
👩🏫 Dr. Kübra ATALAY KABASAKAL
Hacettepe Üniversitesi ### 20/12/2021
📧
katalay@hacettepe.edu.tr
--- layout: true <div class="my-footer"> <span> - Dr. Kübra Atalay Kabasakal </span> </div> --- --- ## Veriyi İnceleme Oncelikle **select()** fonksiyonunu ile kullanmak üzere bir veri seti oluşturalim. ```r miniPISA <- PISA_OGR_2018 %>% select(OGRENCIID, OKUL_TUR, CINSIYET,SES,Gocmenlik, Anne_Egitim,Baba_Egitim, OKUMA_ZEVK,OK_YETERLIK,ODOKUMA1) %>% expss::drop_var_labs() ``` --- ## Veriyi İnceleme `"miniPISA"` nesnesinden sosyoekonomik düzeyi 3'un üstünde olan gözlemlerin seçilmesi --- ## Veriyi İnceleme `"miniPISA"` nesnesinden sosyoekonomik düzeyi 2'in üstünde olan gözlemlerin seçilmesi --- ## Veriyi İnceleme `"miniPISA"` nesnesinden anne eğitim düzeyi, baba eğitim düzeyinden yüksek olanların secilmesi --- ## Veriyi İnceleme `"miniPISA"` nesnesinden anne eğitim düzeyi, baba eğitim düzeyinden yüksek olanların ve OK_YETERLIK değişkeninde eksik verisi olmayanların seçilmesi - eksik veri varlığı **is.na()** fonksiyonu ile incelenebilir. ```r x <- c(3,5,6,7,8,NA) is.na(x) ``` ``` ## [1] FALSE FALSE FALSE FALSE FALSE TRUE ``` --- ## Veriyi İnceleme `"miniPISA"` nesnesinden anne eğitim düzeyi, baba eğitim düzeyinden yüksek olanların ve OK_YETERLIK değişkeninde eksik verisi olmayanların ve sosyoekonomik düzeyi ortalamanın üstünde olanların seçilmesi --- ## Veriyi İnceleme `"miniPISA"` nesnesindeki gözlemlerin SES puanlarına göre büyükten küçüğe sıralanması --- ## Veriyi İnceleme `"miniPISA"` nesnesindeki gözlemlerin anne eğitim düzeyi ve baba eğitim düzeyi toplamına gore büyükten küçüğe sıralanması ```r arrange(miniPISA,Anne_Egitim + Baba_Egitim) ``` ``` ## # A tibble: 6,890 x 10 ## OGRENCIID OKUL_TUR CINSIYET SES Gocmenlik Anne_Egitim Baba_Egitim ## <dbl> <chr> <dbl> <dbl> <dbl> <dbl> <dbl> ## 1 79203057 TUR0231 2 -2.71 1 0 0 ## 2 79201246 TUR0114 1 -3.31 1 0 0 ## 3 79206034 TUR0114 2 -3.21 1 0 0 ## 4 79206038 TUR0114 2 -2.76 1 0 0 ## 5 79203957 TUR0231 1 -3.14 1 0 0 ## 6 79205430 TUR0231 1 -2.52 1 0 0 ## 7 79200013 TUR0111 2 -2.86 1 0 0 ## 8 79201946 TUR0230 1 -3.25 1 0 0 ## 9 79200998 TUR0115 1 -3.33 1 0 0 ## 10 79201589 TUR0115 1 -3.22 1 0 0 ## # ... with 6,880 more rows, and 3 more variables: OKUMA_ZEVK <dbl>, ## # OK_YETERLIK <dbl>, ODOKUMA1 <dbl> ``` --- ## Veriyi İnceleme `"miniPISA"` nesnesindeki gözlemlerin "OK_YETERLIK" puanlarina iliskin ozet istatistiklerin elde edilmesi --- ## Veriyi İnceleme `"miniPISA"` nesnesindeki gözlemlerin eksik gözlemler çikarildiktan sonra sayısal sütunlara ilişkin ozet istatistikler ayni islemi `is.na()` fonksiyonunu kullanarak siz de deneyiniz. --- ## Veriyi İnceleme `"miniPISA"` nesnesinde anne ve baba egitim düzeyin lise ve uzeri olan ve sosyo ekonomik düzeyi ortalamanin uzerinde olan öğrencilerin OK_YETERLIK puanlarina iliskin ozet istatistikler --- ## Veriyi İnceleme `"miniPISA"` nesnesinde anne egitim düzeyinde eksik verisi olmayan öğrencilerin anne egitim düzeyine gore OK_YETERLIK puanlarinin buyukten kucuge siralanmasi --- ## Veriyi İnceleme `"miniPISA"` nesnesinde 2. nesil gocmen öğrencilerin cinsiyete gore basari puanlarinin ortalamasinin hesaplanmasi ## Baska Ornekler Icin [tuev paket] (https://rpubs.com/tuevpaket/775269) --- .hand-large[teşekkürler !]