Įvadas į statistinį programavimą naudojant R

Turinys
R yra statistinė programavimo kalba, ji yra nemokama ir atviro kodo. Jis daugiausia naudojamas operacijoms duomenų gavyba arba statistika, visa tai siekiant sukurti programas, skirtas didelio kiekio duomenų analizei.
Komandinės eilutės sąsaja R Iš pradžių tai gali būti šiek tiek bauginanti, tačiau tai užgožiama, įvertinus kalbos teikiamą galią ir galimybes dalytis ir atkurti informacijos analizę.
R Ją galima nemokamai atsisiųsti visoms šiandien egzistuojančioms nemokamoms platformoms, mes turime galimybę ją įdiegti „Windows“, Linux Ir netgi „Mac“.
Šios pamokos tikslais naudosime versiją „Windows“ kurį galime rasti oficialiame projekto puslapyje šioje nuorodoje. Atsisiuntę ir įdiegę turėsime savo funkcinę kopiją R, jei jį įvykdysime, turėsime pradinį ekraną R kuris turėtų atrodyti taip:

R Tai leidžia mums greitai ir efektyviai dirbti su duomenimis, tačiau numatytoji sąsaja nėra tobula šiai užduočiai atlikti. Viena iš problemų yra ta, kad viskas atsidaro atskiruose languose, todėl sunku dirbti, o komandų eilutės sąsaja nėra vienoda visose operacinėse sistemose.
Nors yra daug sąsajų šiai problemai išspręsti, šioje pamokoje mes naudosime RS studija kuri yra prieinama visoms platformoms, tačiau svarbu paminėti, kad tai būtina turėti R įdiegta prieš diegiant, kad gautumėte „Windows“ einame į šią nuorodą ir atsisiųsime atitinkamą versiją.
Po diegimo vykdome RS studija ir turėtume pamatyti pagrindinę sąsają:

RS studija suteikia mums visų langų organizavimą R viename skydelyje ir papildomai suteikia mums prieigą prie funkcijų, kurių gali būti sunku rasti, be to, galime paminėti kitus papildomus privalumus:
  • Padalinkime savo darbą į Projektai kur kiekvienas iš jų turės savo darbo katalogą, istoriją ir šaltinio failus.
  • Integracija su „GitHub“.
  • Leidžia grafiškai išsaugoti istoriją.
  • Galite eksportuoti grafiką įvairiais formatais ir dydžiais.
  • Tai leidžia mums užpildyti kodą naudojant lentelės klavišą.
  • Tam tikrų paketų dėka galite kurti interaktyvias diagramas.
Kaip matome RS studija yra gana optimalus būdas dirbti RTačiau rinkoje yra ir kitų sprendimų, kiekvienas turi tai ištirti ir įvertinti, ar jie geriau pritaikyti kiekvieno žmogaus poreikiams.
Yra keletas būdų, kaip dirbti R kur pirmiausia aptarsime R konsolėNepaisant to, kad negalime saugoti čia atlikto darbo, gana naudinga išbandyti kai kurias funkcijas ir pradėti susipažinti su kalba.
Darbas su pultu yra gana paprastas, mes įvedame komandą ir tada R suteikia mums jos išvestį, pabandykime atlikti paprastą pridėjimo operaciją, kaip nurodyta toliau:
> 10 + 7

Mes stumiame Įveskite ir automatiškai R Šioje eilutėje pateikiamas atsakymas į mūsų operaciją:

Kaip matome paveikslėlyje, pirmoje eilutėje yra komanda su mūsų operacija, svarbu tai paminėti R norint užbaigti liniją, nereikia naudoti kabliataškio ar bet kurio kito baigiančio operatoriaus. Antroje eilutėje matome prieš atsakymą [1] tai rodo būdą, kuriuo R atlieka aritmetines operacijas ir naudoja vektorius, vienas reiškia pirmojo vektoriaus elemento indeksą, kuriame galime pabrėžti, kad daugelis kitų kalbų tvarko indeksus nuo nulio, bet R daro tai iš vieno.
Kaip minėjome anksčiau, pultas yra gana naudingas, tačiau su juo nėra geriausia dirbti, daugiausia todėl, kad jame nėra galimybės išsaugoti mūsų komandas ir galimybės vienu metu įvesti tik vieną komandą, kažkas panašaus atsitinka su Python, bet nuo to mes neturėtume jaudintis RS studija suteikia mums scenarijaus langas esančią viršutinėje mūsų konsolės dalyje, jei jos nerandame, einame į Failas> Naujas failas> R scenarijus arba paspauskite „Shift“ + „Command“ + N..
Iš esmės R scenarijus yra paprastas tekstas su plėtiniu .R. Norėdami pamatyti, kaip tai veikia, mes galime atkurti savo aritmetinę operaciją iš ankstesnio pavyzdžio, sukurdami naują scenarijų ir pridėdami kelias papildomas komandų eilutes, pažiūrėkime:
 10 + 7 1:50 spauda („Labas pasaulis“) 

A R scenarijus galite paleisti eilutę po eilutės naudodami parinktį, kurią turime viršutiniame meniu pavadinimu Bėgti ir mes pamatysime to paties rezultato konsolėje, pažiūrėkime kiekvienos mūsų scenarijaus eilutės atsakymą:

Kaip matome, kad pirmoji eilutė suteikia mums rezultatą, kurį gavome anksčiau, antroje eilutėje sudaromas skaičių nuo 1 iki 50 sąrašas, kuriame skliausteliuose esantis skaičius yra pirmasis tos eilutės indeksas ir galiausiai susidarome klasikinio įspūdžio Labas pasauli.
Pamatę būdus, kaip galime dirbti su kalba, pereisime prie daugiau teorinių koncepcijų, kad geriau suprastume, ką turime kalbomis, kad galėtume dirbti ir vykdyti savo projektus.
Kaip ir visose programavimo kalbose, kintamieji yra vienas iš svarbiausių aspektų juos sukurti R Mums reikia tik parašyti jo pavadinimą, nenustatant tipo. Mes naudojame paskyrimo operatorius suteikti kintamajam reikšmę.
SvarbuMes galime priskirti kintamojo vertę lygybės ženklu, tačiau tai yra bloga praktika R, norėdami atlikti teisingą priskyrimą, naudokite operatorių <-.
Pažiūrėkime, kaip atrodo reikšmės priskyrimas kintamajam ir jo spausdinimas:
 x <- 58 x 

Mes taip pat galime priskirti keletą reikšmių savo kintamiesiems su sujungimo funkcija:
y <- c (5, 2, 11, 28, 17)

Jei vykdysime pavyzdį, dešiniajame skydelyje pamatysime, kaip turime vertę x ir priskirtą skaičių sąrašą Y:

DIDELIS

Be to, norėdami pašalinti kintamąjį iš darbo vietos, mes tiesiog turime naudoti šią funkciją rm, mes netgi galime išvalyti visą darbo vietą, pažiūrėkime, kaip tai darome:
 rm (x) rm (sąrašas = ls ()) 

Su pirmąja eilute pašaliname kintamąjį, o su antrąja - visą erdvę.
Kalboje turime keturias duomenų struktūras, kurias atpažįsta R:
Karikatūrų vektoriusVektorius yra vienmatis masyvas, kuriame visi jame esantys duomenys turi būti to paties tipo, sveikieji skaičiai, simboliai ir pan., Be to, svarbu pažymėti, kad tai yra pagrindinis duomenų objektas R.
Masyvai ir matricosMatrica yra panaši į vektorių, kur duomenys turi būti to paties tipo, tačiau matrica turi du matmenis, o informacija yra suskirstyta į eilutes ir stulpelius. Masyvas yra panašus į masyvą, tačiau jis gali turėti daugiau nei du matmenis.
Duomenų rėmaiDuomenų rėmeliai yra to paties ilgio vektorių rinkinys, panašus į matricą, tačiau tokio tipo struktūros ypatumas yra tas, kad jie gali būti mišrių duomenų tipų, kur vektoriai gali turėti net pavadinimus.
SąrašaiLabiausiai paplitęs R struktūros tipas, sąrašas yra bet kurios klasės, ilgio ar struktūros elementų rinkinys, netgi galime turėti kitų sąrašų.
Be to, R Jis turi keletą funkcijų, leidžiančių mums konvertuoti vieno tipo struktūrą į kitą, pažiūrėkime:
as.vector ()Ši funkcija leidžia konvertuoti matricas į vienmačius vektorius.
as.matrix ()Galite konvertuoti duomenų struktūras į masyvą.
as.data.frame ()Galite konvertuoti duomenų struktūras į duomenų rėmus.
as.list ()Galite konvertuoti duomenų struktūras į sąrašus.
Viena iš stiprybių R yra tai, kad galite pridėti paketų, leidžiančių išplėsti kalbos funkcijas. Kitomis kalbomis šie papildiniai yra bibliotekose, tačiau R bibliotekoje yra vieta, kurioje saugomi visi paketai.
The paketai apie R gali kilti iš dviejų skirtingų vietų, kai kurios - su R pagal numatytuosius nustatymus, tačiau jie nėra aktyvūs, o kitus galima rasti internetinėse saugyklose.
Norėdami pamatyti šiuo metu įdiegtus ar įkeltus paketus, galime atlikti šias funkcijas:
 biblioteka () paieška () 

Funkcija biblioteka () pateikia mums šiuo metu įdiegtų paketų sąrašą, pažiūrėkime dalį to, ką jis mums meta, kai vykdome šią eilutę:

Funkcija Paieška () Kita vertus, per konsolę mums rodomi šiuo metu įkelti paketai, pažiūrėkime šiame paveikslėlyje, kuriuos paketus įkėlėme:

Be to, norėdami įdiegti paketus, galime tai padaryti keliais būdais, pirmasis - naudojant parinktį viršutiniame meniu Įrankiai> Įdiegti paketus ir tada mes turime kalbos funkcijas, pastarąją mes rekomenduojame, nes ji gali būti mūsų scenarijaus dalis.
Norėdami įdiegti mūsų naudojamą paketą įdiegti.paketus, po to turime jį įtraukti, galime naudoti biblioteka arba reikalauti Tačiau šiuo tikslu geriausia naudoti pastarąją, kad nebūtų painiojama su funkcijų apimtimi, pažiūrėkime, kaip įdiegsime ir įtrauksime paketą ggplot2:
 install.packages ("ggplot2") reikia ("ggplot2") 

Pagaliau ištrinti paketą, kurį galime naudoti pašalinti.pakuotes, pažiūrėkime, kaip jis naudojamas:
remove.packages ("ggplot2")

Tuo baigiame šią pamoką, su kuria jau turime supratimą, kaip su ja dirbti RBe aiškių dalykų, tokių kaip kintamieji ir duomenų struktūros, esminiai aspektai, kuriuos turime žinoti, kad galėtume visapusiškai pasinaudoti šia galinga ir veiksminga kalba.Ar jums patiko ir padėjo ši pamoka?Galite apdovanoti autorių paspausdami šį mygtuką, kad suteiktumėte jam teigiamą tašką
wave wave wave wave wave