6 Mart 2015 Cuma

DERS 4-VERİLERİ R ORTAMINA AKTARMA (Data İmport)

EXCEL FILE

Örnek veriler excel formatında oldukça sık,ve kullanılmadan önce R ortamına aktarılması gerek. Bunun  için,  "gdata"  paketindeki read.xls() fonksiyonu kullanılır. Aşağıda örnek bir uygulama yapıldı. 

library(gdata)                    #"gdata" paketini yükler
help(read.xls)                    #documentasyon bilgisi
mydata = read.xls("mydata.xls")   #ilk veriyi okur 

MINITAB FILE

     Veri dosyası Minitab taşınabilir çalışma biçiminde ise, "foreign" paketinden read.mtp() fonksiyonu ile okunabilir. Minitab çalışma sayfasındaki bileşenlerin listesini verir.

 library(foreign)                    #"foreign" paketini yükler
 help(read.mtp)                     #documentasyon bilgisi
 mydata = read.mtp("mydata.mtp")    #mtp'den veriyi okur 

SPSS FILE

    SPSS formatındaki veri dosyaları için  "foreign" paketinden  read.spss() fonksiyonu ile açılabilir. Dataframe  döndürüp döndürmeyeceğini seçmek için "to.data.frame" seçeneği vardır. Defaoult olarak onun yerine bileşenlerin listesini verir

library(foreign)                                      #"foreign" paketini yükler
help(read.spss)                                       #documentasyon bilgisi
mydata=read.spss("myfile", to.data.frame=TRUE)

TABLE  FILE

     Bir veri tablosunu, txt dosyasında bulundarabilirsiniz. Tablo içindeki hücreler boş karakterler tarafından ayrılır. İşte 3 sütun ve satırlı bir tablo örneği 
 100   a1   b1 
200   a2   b2 
300   a3   b3 
400   a4   b4

    Şimdi  kopyalayıp  bir metin editörü ile  "mydata.txt" adlı bir dosyada yukarıdaki tabloyu yapıştırın. sonra  read.table() fonksiyonu ile  çalışma alanına veriyi yükleyin 

mydata=read.table("mydata.txt")               #text dosyasını okur
mydata                                                        #veri tablosunu yazdırır

  V1 V2 V3 
1 100 a1 b1 
2 200 a2 b2 
3 300 a3 b3 
4 400 a4 b4
 
read.table() fonksiyonun daha fazla detayı için 
help(read.table)

CSV  FILE

Örnek veriler de virgülle ayrılmış değerler (CSV) biçiminde olabilir.  Bu veri dosyası içinde her hücre özel bir karakter ile ayrılır, genellikle virgül ile ancak diğer karakterlerde kullanılabilir.

   Veri dosyasının ilk satırı, gerçek veri yerine sütun adları içermelidir. İşte beklenen format örneği.

Col1,Col2,Col3 
100,a1,b1 
200,a2,b2 
300,a3,b3

Bir text editörü ile  "mydata.csv" adlı dosyaya yukardaki veriyi kopyalıyıp yapıştırdıktan sonra read.csv() fonksiyonu ile  veriyi okuyabiliriz.

mydata=read.csv("mydata.txt")               #csv dosyasını okur
mydata                                                        #veri tablosunu yazdırır

  Col1 Col2 Col3 
1  100   a1   b1 
2  200   a2   b2 
3  300   a3   b3

read.csv() fonksiyonun daha fazla detayı için 
help(read.csv)

ÇALIŞMA DİZİNİ

Son olarak,  veri dosyalarını çalışma dizinine konumlandıralım, getwd() fonksiyonu ile çalışma dizinin konumu belirlenir

getwd()            #Çalışma dizinin konumunu gösterir

setwd() fonksiyonu ile farklı bir çalışma dizini seçebilirsin böylece verinin tüm yolunu girmekten sakınabiliriz.

setwd("yeni yol")    #Çalışma dizinini ayarlar 

Şükrü ERGÜNTOP

Author & Editor

Bilecik Şeyh Edebali Üniversitesi Bilgisayar Mühendisi mezunuyum 2015 yılından beri Sigorta Bilgi ve Gözetim Merkezinde İş Zekası alanında çalışmaktayım

0 yorum:

Yorum Gönder