Uvod u statističko programiranje s R

Sadržaj
R je statistički programski jezik, besplatan je i otvorenog koda. Koristi se uglavnom za operacije rudarenje podataka ili statistike, sve to s ciljem stvaranja aplikacija za analizu velikih količina podataka.
Sučelje naredbenog retka datoteke R U početku to može biti pomalo zastrašujuće, ali to je zasjenjeno nakon što smo uvidjeli moć i mogućnosti koje nam jezik nudi za razmjenu i reprodukciju analize informacija.
R Može se besplatno preuzeti za sve besplatne platforme koje danas postoje, imamo mogućnost instaliranja na nju Windows, Linux pa čak i Mac.
Za potrebe ovog vodiča koristit ćemo verziju za Windows koje možemo pronaći na službenoj stranici projekta na sljedećoj poveznici. Nakon preuzimanja i instaliranja imat ćemo našu funkcionalnu kopiju R, ako ga izvršimo imat ćemo početni zaslon od R koji bi trebao izgledati ovako:

R Omogućuje nam rad s podacima na brz i učinkovit način, no njegovo zadano sučelje nije savršeno za ovaj zadatak. Jedan od problema je što se sve otvara u zasebnim prozorima što otežava rad, a sučelje naredbenog retka nije isto u svim operativnim sustavima.
Iako postoji mnogo sučelja za rješavanje ovog problema, u ovom ćemo vodiču koristiti RStudio koji je dostupan za sve platforme, no važno je spomenuti da ga je potrebno imati R instaliran prije instalacije, da biste dobili verziju Windows idemo na sljedeću vezu i preuzimamo odgovarajuću verziju.
Nakon instalacije izvršavamo RStudio i trebali bismo vidjeti glavno sučelje:

RStudio daje nam organizaciju svih prozora R unutar jedne ploče i dodatno nam daje pristup funkcijama koje je teško pronaći, osim toga možemo spomenuti i druge dodatne prednosti:
  • Podijelimo naš rad na Projekti gdje će svaki od njih imati svoj radni direktorij, povijest i izvorne datoteke.
  • Integracija sa GitHub.
  • Omogućuje grafičko spremanje priče.
  • Možete izvesti grafiku u različitim formatima i veličinama.
  • Omogućuje nam dovršenje koda pomoću tabličnog ključa.
  • Zahvaljujući određenim paketima možete stvoriti interaktivne grafikone.
Kao što vidimo RStudio je prilično optimalan način rada RMeđutim, na tržištu postoje druga rješenja, na svakoj je osobi da ih istraži i procijeni jesu li bolje prilagođena potrebama svake osobe.
Postoji nekoliko načina rada R gdje ćemo se prvo obratiti R konzolaUnatoč činjenici da ovdje ne možemo pohraniti obavljeni posao, vrlo je korisno testirati neke funkcije i početi se upoznavati s jezikom.
Rad s konzolom je vrlo jednostavan, unosimo naredbu, a zatim nam R daje izlaz, pokušajmo jednostavnu operaciju zbrajanja poput ove:
> 10 + 7

Guramo Unesi i automatski R U sljedećem retku daje nam odgovor na naš rad:

Kao što možemo vidjeti na slici, prvi redak sadrži naredbu s našom operacijom, važno je to spomenuti R ne zahtijeva korištenje točke sa zarezom za završetak retka ili bilo koji drugi operator završetka. U drugom retku prije odgovora možemo vidjeti [1] to ukazuje na način na koji R izvodi aritmetičke operacije i koristi vektor, jedan znači indeks prvog elementa vektora, gdje možemo istaknuti da mnogi drugi jezici obrađuju indekse ispočetka, ali R čini to od onog.
Kao što smo ranije spomenuli, konzola je vrlo korisna, ali nije najbolje raditi s njom, uglavnom zato što nema mogućnost pohrane naših naredbi i mogućnost unosa samo jedne naredbe odjednom, nešto slično se događa s Piton, no od tada se ne bismo trebali brinuti RStudio daje nam prozor skripte koji se nalazi u gornjem dijelu naše konzole, ako ga ne pronađemo, idemo na Datoteka> Nova datoteka> R skripta ili pritisnite Shift + Command + N.
U osnovi R skripta je običan tekst s nastavkom .R. Da bismo vidjeli kako to funkcionira, možemo ponovno stvoriti našu aritmetičku operaciju iz prethodnog primjera stvaranjem nove skripte i dodavanjem nekoliko dodatnih naredbenih redaka, da vidimo:
 10 + 7 1:50 ispis ("Hello World") 

A R skripta možete pokrenuti redak po redak s opcijom koju imamo u gornjem izborniku pod nazivom Trčanje i vidjet ćemo izlaz iste u konzoli, pogledajmo odgovor za svaki redak naše skripte:

Kako možemo vidjeti da prvi redak daje rezultat koji smo prethodno dobili, drugi redak stvara popis brojeva od 1 do 50 gdje je broj u zagradama prvi indeks za taj redak i na kraju imamo dojam klasičnog Pozdrav svijete.
Nakon što smo vidjeli načine na koje možemo raditi s jezikom, preći ćemo na više teorijskih pojmova kako bismo bolje razumjeli ono što imamo na raspolaganju u jeziku za rad i izvođenje naših projekata.
Kao i u svim programskim jezicima, varijable jedan su od najvažnijih aspekata za njihovo stvaranje R Trebamo samo napisati naziv bez definiranja vrste. Koristimo operator dodjeljivanja dati vrijednost varijabli.
VažnoVrijednosti varijable možemo dodijeliti znak jednakosti, ali to je loša praksa R, za ispravnu dodjelu koristite operator <-.
Pogledajmo kako izgleda dodjeljivanje vrijednosti varijabli, a zatim ispis:
 x <- 58 x 

Također možemo dodijeliti nekoliko vrijednosti našim varijablama s funkcijom spajanja:
y <- c (5, 2, 11, 28, 17)

Ako pokrenemo primjer, vidjet ćemo na desnoj ploči koliko imamo vrijednost x i numerički popis dodijeljen Y:

POVEĆAJTE

Dodatno, da bismo uklonili varijablu iz radnog prostora, samo moramo koristiti funkciju rm, možemo čak i očistiti cijeli radni prostor, da vidimo kako to radimo:
 rm (x) rm (popis = ls ()) 

Prvim retkom eliminiramo varijablu, a drugim retkom sav prostor.
U jeziku imamo četiri strukture podataka koje prepoznaje R:
Vektor crtićaVektor je jednodimenzionalni niz u kojem svi podaci prisutni u njemu moraju biti istog tipa, cijeli broj, znak itd., Dodatno je važno napomenuti da je to osnovni podatkovni objekt u R.
Nizovi i matriceMatrica je slična vektoru gdje podaci moraju biti istog tipa, međutim matrica ima dvije dimenzije i informacije su organizirane u retke i stupce. Niz je sličan nizu, ali može imati više od dvije dimenzije.
Okviri podatakaOkviri podataka zbirka su vektora iste duljine, slični su matrici, ali je posebnost ove vrste strukture u tome što mogu biti mješovitih tipova podataka, gdje vektori mogu imati čak i imena.
PopisiNajopćenitiji tip strukture u R -u, popis je skup elemenata bilo koje klase, duljine ili strukture, čak možemo imati i druge popise.
Unaprijediti, R Ima nekoliko funkcija koje nam omogućuju pretvaranje jedne vrste strukture u drugu, da vidimo:
as.vector ()Ova vam funkcija omogućuje pretvaranje matrica u jednodimenzionalne vektore.
as.matrix ()Strukture podataka možete pretvoriti u niz.
as.data.frame ()Strukture podataka možete pretvoriti u okvire podataka.
as.list ()Strukture podataka možete pretvoriti u popise.
Jedna od prednosti R je da možete dodati pakete koji nam omogućuju proširenje funkcionalnosti jezika. Na drugim jezicima ti dodaci dolaze u knjižnice, ali u R je knjižnica mjesto gdje su pohranjeni svi paketi.
The paketi od R mogu doći s dva različita mjesta, s nekima dolaze R prema zadanim postavkama, ali nisu aktivni, a drugi se mogu pronaći u mrežnim spremištima.
Da bismo vidjeli pakete koji su trenutno instalirani ili učitani, možemo izvršiti sljedeće funkcije:
 library () search () 

Funkcija knjižnica () donosi nam popis trenutno instaliranih paketa, pogledajmo dio onoga što nam baca kada izvršimo ovaj redak:

Funkcija traži () S druge strane, pokazuje nam konzolom trenutno učitane pakete, da vidimo na sljedećoj slici koje smo pakete učitali:

Dodatno, za instaliranje paketa to možemo učiniti na nekoliko načina, prvi je putem opcije u gornjem izborniku Alati> Instaliraj pakete a zatim imamo niz funkcija jezika, potonji je onaj koji preporučujemo budući da stoga može biti dio našeg pisma.
Za instaliranje paketa koristimo instalirati.pakete, nakon što to moramo uključiti, možemo koristiti knjižnica ili zahtijevaju U tu je svrhu ipak najbolje koristiti potonje kako bi se izbjegla zabuna s opsegom funkcija. Pogledajmo kako ćemo instalirati i uključiti paket ggplot2:
 install.packages ("ggplot2") require ("ggplot2") 

Konačno, za brisanje paketa koji možemo upotrijebiti ukloniti.pakete, da vidimo kako se koristi:
remove.packages ("ggplot2")

Ovime završavamo ovaj vodič s kojim već imamo predodžbu o tome kako raditi R, osim što smo pojasnili točke kao što su varijable i strukture podataka, bitne aspekte koje moramo znati kako bismo u potpunosti iskoristili prednosti ovog moćnog i učinkovitog jezika.Je li vam se svidio i pomogao ovaj vodič?Autor možete nagraditi pritiskom na ovaj gumb kako biste mu dali pozitivan bod

Vi ćete pomoći u razvoju web stranice, dijeljenje stranicu sa svojim prijateljima

wave wave wave wave wave