R Урок - Ръководство за начинаещи за изучаване на R програмиране



Този блог на R Tutorial ви запознава с R инструмента и ви помага да разберете подробно различните основи на R програмирането с примери.

R е най-популярният инструмент за анализ на данни, тъй като е с отворен код, гъвкав, предлага множество пакети и има огромна общност. Той е предназначен за софтуерни програмисти, статистици и майнери на данни, както и следователно, породени от популярността на .В този блог на R Rutorial ще ви дам пълна представа за R с примери.

По-долу са темите в този блог на R Rutorial, които ще обсъждам в следната последователност:





  1. Защо се нуждаем от Анализ ?
  2. Какво е бизнес анализ ?
  3. Защо R и кой използва R ?
  4. Инсталиране на R
  5. Оператори на данни
  6. Типове данни
  7. Контрол на потока

R Урок: Защо се нуждаем от анализи?

Преди да отговоря на въпроса, нека ви запозная с някои от проблемите и техните решения в R в множество домейни.



банкиране - R Урок - Edureka

Банкиране :

Голямо количество клиентски данни се генерират всеки ден в банките. WHile, занимаващи се редовно с милиони клиенти, става трудно да се проследят техните ипотеки.



Решение :

R изгражда персонализиран модел, който поддържа заемите, предоставени на всеки отделен клиент, което ни помага да решим сумата, която да бъде платена от клиента с течение на времето.

Застраховка :

Застраховката зависи в голяма степен от прогнозата. Трудно ерешете коя политика да приемете или отхвърлите.

Решение:

как да тествате база данни

Използвайки непрекъснатия кредитен отчет като вход, можем да създадем модел в R, който не само ще оцени апетита за риск, но и ще направи прогнозна прогноза.

Здравеопазване:

Всяка година милиони хора се приемат в болница и милиарди се изразходват годишно точно в процеса на приемане.

Решение :

Като се има предвид историята на пациентите и медицинската история, може да се изгради предсказващ модел, който да идентифицира кой е изложен на риск за хоспитализация и до каква степен трябва да се мащабира медицинското оборудване.

Сега знаем как анализът на данните помага на организациите да използват своите данни и да ги използват за идентифициране на нови възможности. Ако говорим за необходимостта от анализи в дадена организация, трябва да попаднете на следните 4 аспекта:

След това нека продължим напред в R tutorial blog, където първо ще разберем какво точно представлява бизнес анализ.

R Урок: Какво е бизнес анализ?

Бизнес анализът е процес на изследване на големи набори от данни и постигане на скрити модели, корелации и други прозрения. Това основно ви помага да разберете всички данни, които сте събрали, било то организационни данни, данни за проучване на пазара или продукти или всякакъв друг вид данни. За вас става лесно да взимате по-добри решения, по-добри продукти, по-добри маркетингови стратегии и т.н. Вижте изображението по-долу за по-добро разбиране:

Ако погледнете горната фигура, вашите данни в първото изображение са разпръснати. Сега, ако искате нещо конкретно като конкретен запис в база данни, става тромаво. За да опростите това, имате нужда от анализ. С анализа става лесно да се установи корелация между данните. След като сте установили какво да правите, за вас става съвсем лесно да взимате решения като, кой път искате да следвате или по отношение на бизнес анализа, кой път ще доведе до подобряване на вашата организация.

Но не можете да очаквате хората от веригата по-горе винаги да разбират суровите данни, които им предоставяте след анализ. Така че, за да преодолеем тази празнина, имаме концепция за визуализация на данни .

Визуализация на данни : Визуализацията на данни е визуален достъп до огромни количества данни, които сте генерирали след анализ. Човешкият ум обработва визуални изображения и визуалните графики са по-добри, отколкото в сравнение със суровите данни. За нас винаги е лесно да разберем кръгова диаграма или стълбовидна диаграма в сравнение със суровите числа. Сега може би се чудите как можете да постигнете тази визуализация на данните от данните, които вече сте анализирали?
На пазара са налични различни инструменти за визуализация на данни:

Сигурно всички се чудите, че вече има толкова много инструменти, които ви помагат да постигнете визуализация на данните и определен обем анализи, защо да използвате R?

Така че следващата ми тема в R tutorial blog се занимава с „защо R“ и „кой използва R“.

R Урок: Защо R и кой използва R?

Защо R?

R е програмен и статистически език.

R се използва за анализ и визуализация на данни.

R е лесен за научаване, четене и писане.

R е пример за FLOSS (безплатен софтуер Libre и софтуер с отворен код), където човек може свободно да разпространява копия на този софтуер, да чете неговия изходен код, да го променя и т.н.

Кой използва R?

  • Бюрото за финансова защита на потребителите използва R за анализ на данните
  • Статистиците от John Deere използват R за моделиране на времеви редове и геопространствен анализ по надежден и възпроизводим начин.
  • Bank of America използва R за отчитане.
  • R е част от технологичния стек зад известния механизъм за препоръки на Foursquare.
  • ANZ, четвъртата по големина банка в Австралия, използваща R за анализ на кредитния риск.
  • Google използва R, за да предскаже икономическа активност.
  • Mozilla, фондацията, отговорна за уеб браузъра Firefox, използва R, за да визуализира уеб активността.

По-долу са някои от домейните, където се използва R:

Сега, нека да продължим напред в R tutorial blog и да инсталираме R.

R Урок: Инсталиране на R

Позволете ми да ви преведа през процеса на инсталиране на R на вашата система. Просто следвайте стъпките по-долу:

Етап 1 : Отидете на връзката- https://cran.r-project.org/

Стъпка 2 : Изтеглете и инсталирайте R 3.3.3 на вашата система.

Вижте скрийншота по-долу, за да получите по-добро разбиране.

Следвайки горните стъпки, сте готови с R инсталационната част. Сега можете директно да започнете да кодирате в R, като изтеглите RStudio IDE. За да изтеглите това, следвайте стъпките по-долу:

Етап 1 : Отидете на връзката- https://www.rstudio.com/

Стъпка 2 : Изтеглете и инсталирайте Rstudio на вашата система.

След като инсталирате всичко, всички сте готови да кодирате!

R Урок за начинаещи | R Урок по програмиране | Едурека

След това нека продължим напред в блога R Tutorial и да разберем какво представляват операторите на данни в R.

R Урок: Оператори на данни в R

Има основно 5 различни типа оператори, които са изброени по-долу:

  1. Аритметични оператори : Извършвайте аритметични операции като събиране, изваждане, умножение, деление и т.н.
  2. Оператори за присвояване :Операторите на присвояване се използват за присвояване на стойности. Например:
  • Оператор за присвояване =
    Синтаксис:
    име на променлива = стойност
> x = 5 >х 
Изход: [1] 5
  • Оператор за възлагане<-
    Синтаксис:
    име на променлива<- value

    > x<- 15 > x
    Изход: [1] 15
  • Оператор за възлагане<<-
    Синтаксис :
    име на променлива<<- value
> x<<- 2 > x
Изход: [1] 2
  • Оператор за присвояване ->
    Синтаксис :
    стойност -> име на променлива

    > 25 -> x > x 
    Изход: [1] 25

3. Релационен оператор : Определя връзка между две обекти. Например: ,<=,!= etc.

> xx! = 2
Изход:[1] ВЯРНО

4. Логически оператори : Тези оператори сравняват двете обекти и обикновено се използват с булеви (логически) стойности като &, | и !.

> x2 и 3
Изход:[1] ВЯРНО

5. Специални оператори : Тези оператори се използват за конкретна цел, а не за логическо изчисление. Например:

  • Той създава поредица от числа в последователност за вектор.

    > хх
    Изход: [1] 2 3 4 5 6 7 8
  • % в% Този оператор се използва за идентифициране дали даден елемент принадлежи на вектор.
    Пример

    > xyy% в% x
    Изход: [1] TRUE

R Урок: Типове данни

Типовете данни се използват за съхраняване на информация. В R не е нужно да декларираме променлива като някакъв тип данни. Променливите се присвояват с R-Objects и типът данни на R-обекта се превръща в тип данни на променливата.В R има основно шест типа данни:

Нека да разгледаме по-подробно всеки един от тях:

Вектор : Vector е поредица от елементи от данни от същия основен тип. Пример:

vtr = (1, 3, 5, 7 9)

или

vtr<- (1, 3, 5 ,7 9)

Има 5 атомни вектора, наричани още пет класа вектори.

Списък : Списъците са R обектите, които съдържат елементи от различни типове като & минус числа, низове, вектори и друг списък вътре в него.

> n = c (2, 3, 5) > s = c ('aa', 'bb', 'cc', 'dd', 'ee') > x = списък (n, s, TRUE) > x

Изход -

[[1]] [1] 2 3 5 [[2]] [1] 'aa' 'bb' 'cc' 'dd' 'ee' [[3]] [1] TRUE

Масиви : Масивите са R обектите с данни, които могат да съхраняват данни в повече от две измерения. Взема вектори като вход и използва стойностите в параметъра dim за създаване на масив.

вектор1<- c(5,9,3) вектор2<- c(10,11,12,13,14,15) резултат<- array(c(vector1,vector2),dim = c(3,3,2))

Изход -

,, 1 [, 1] [, 2] [, 3] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15 ,, 2 [, 1] [, 2] [, 3 ] [1,] 5 10 13 [2,] 9 11 14 [3,] 3 12 15

Масиви : Матриците са R обектите, в които елементите са подредени в двумерно правоъгълно оформление. Матрицата се създава с помощта на функцията matrix (). Пример: матрица (данни, nrow, ncol, byrow, dimnames) където,

данни е входният вектор, който се превръща в елементите от данни на матрицата.

nrow е броят на редовете, които трябва да бъдат създадени.

ncol е броят на колоните, които трябва да бъдат създадени.

байроу е логична улика. Ако е TRUE, тогава входните векторни елементи са подредени по ред.

dimname е имената, присвоени на редовете и колоните.

> Мат<- matrix(c(1:16), nrow = 4, ncol = 4 ) > Мат
Изход :
[, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Фактори : Факторите са обектите на данни, които се използват за категоризиране на данните и съхраняването им като нива. Те могат да съхраняват както низове, така и цели числа. Те са полезни при анализ на данни за статистическо моделиране.

> данни<- c('East','West','East','North','North','East','West','West“,'East“) > фактор_данни<- factor(data) > фактор_данни

Изход :

[1] Изток Запад Изток Север Север Изток Запад Запад Изток Нива: Изток Северозапад

Рамки за данни : Рамката за данни е таблица или двумерна структура, подобна на масив, в която всяка колона съдържа стойности на една променлива и всеки ред съдържа по един набор от стойности от всяка колона.

> std_id = c (1: 5) > std_name = c ('Rick', 'Dan', 'Michelle', 'Ryan', 'Gary') > марки = c (623.3,515.2,611.0,729.0,843.25) > std.data<- data.frame(std_id, std_name, marks) > std.data

Изход :

std_id std_name марки 1 1 Рик 623,30 2 2 и 515.20 3 3 Мишел 611.00 4 4 Райън 729.00 5 5 Гари 843.25

С това стигаме до края на различните типове данни в R. След това нека да продължим напред в блога R Tutorial и да разберем друга ключова концепция - изявления за контрол на потока.

R Урок: Изявления за контрол на потока

Изявленията за контрол на потока играят много важна роля, тъй като ви позволяват да контролирате потока на изпълнение на скрипт във функция. Най-често използваните изявления за контрол на потока са представени на изображението по-долу:

Сега нека обсъдим всеки един от тях с примери.

R Урок: Изявления на селектора

  • Ако контрол Изявление : Този контролен оператор оценява едно условие. Това е доста лесно, тъй като има само една ключова дума „if“, последвана от условието и след това определен набор от изрази, които трябва да бъдат изпълнени, в случай че е вярно. Вижте диаграмата по-долу, за да получите по-добро разбиране:

В тази блок-схема кодът ще отговори по следния начин:

  1. На първо място, той ще влезе в цикъла, където проверява състоянието.
  2. Ако условието е вярно, ще бъде изпълнен условен код или написаните изрази.
  3. Ако условието е невярно, изявленията се игнорират.

По-долу е даден пример за ако контролен израз в R. Опитайте да стартирате този пример в R Studio.

x = 2 повторете {x = x ^ 2 print (x) if (x> 100) {break}

Изход:

[1] 4 [1] 16 [1] 256
  • If Else Control Statement :Изпитs тип изявление за контролоценява група условия и избира изявленията. Вижте диаграмата по-долу, за да получите по-добро разбиране:

В тази блок-схема кодът ще отговори по следния начин:

  1. На първо място, той ще влезе в цикъла, където проверява състоянието.
  2. Ако условието е вярно, първите оператори „ако“ ще бъдат изпълнени.
  3. Ако условието е невярно, то преминава към условие ‘else if’ и ако е вярно, кодът ‘else if’ ще бъде изпълнен.
  4. И накрая, ако кодът „else if“ също е фалшив, той ще премине към кода „else“ и ще бъде изпълнен. Това означава, че ако нито едно от тези условия не е вярно, тогава изразът ‘else’ се изпълнява.

По-долу е даден пример за ако е друго контролен израз в R. Опитайте да стартирате този пример в R Studio.

x5) {print ('x е по-голямо от 5')} elseif (x == 5) {print ('x е равно на 5')} else {print ('x не е по-голямо от 5')}

Изход:

[1] 'x е равно на 5'
  • Превключване на изявления : Тези контролни оператори се използват основно за сравняване на определен израз с известна стойност. Вижте диаграмата по-долу, за да получите по-добро разбиране:

В тази блок-схема на случая на комутатора кодът ще отговори в следните стъпки:

  1. Първо ще влезе в превключвателя, който има израз.
  2. След това ще премине към условие за случай 1, проверява стойността, предадена на условието. Ако е вярно, блокът Statement ще се изпълни. След това ще се счупи от този случай на превключвател.
  3. В случай, че е невярно, то ще премине към следващия случай. Ако условието за случай 2 е вярно, то ще изпълни изявлението и ще се откъсне от този случай, в противен случай отново ще премине към следващия случай.
  4. Сега да кажем, че не сте посочили нито един случай или има някакъв грешен вход от потребителя, тогава той ще премине към случая по подразбиране, където ще отпечата вашия оператор по подразбиране.

По-долу е даден пример за оператор за превключване в R. Опитайте да стартирате този пример в R Studio.

vtr<- c(150,200,250,300,350,400) option <-'mean' switch(option, 'mean' = print(mean(vtr)), 'mode' = print(mode((vtr))), 'median' = print(median((vtr))) ) 

Изход:

[1] 275

R Урок: Изявления за цикъл

Циклите ви помагат да повторите определен набор от действия, така че да не се налага да ги извършвате многократно. Представете си, че трябва да извършите операция 10 пъти, ако започнете да пишете кода за всеки път, продължителността на програмата се увеличава и ще ви бъде трудно да я разберете по-късно. Но в същото време, като използвам цикъл, ако напиша същия израз в цикъл, това спестява време и улеснява четенето на кода. Той също така се оптимизира по отношение на ефективността на кода.

В горното изображение „ повтарям и ' докато ‘Изявленията ви помагат да изпълнявате определен набор от правила, докато условието е вярно, но’ за' е оператор на цикъл, който се използва, когато знаете колко пъти искате да повторите блок от изявления. Сега, ако знаете, че искате да го повторите 10 пъти, ще отидете с изявлението „за“, но ако не сте сигурни колко пъти искате да се повтори кода, ще отидете с „повторение“ или цикъл „while“.

Нека обсъдим всеки един от тях с примери.

  • Повторете : Цикълът за повторение помага да се изпълнява същия набор от кодове отново и отново, докато не бъде изпълнено условието за спиране. Вижте диаграмата по-долу, за да получите по-добро разбиране:

В горната блок-схема кодът ще отговори в следните стъпки:

  1. Първо ще въведе и изпълни набор от кодове.
  2. След това ще провери състоянието, ако е вярно, ще се върне и ще изпълни същия набор от кодове отново, докато не е замислено като невярно.
  3. Ако се установи, че е невярно, той директно ще излезе от цикъла.
  • Докато : Инструкцията while също помага да се изпълнява същия набор от кодове отново и отново, докато не бъде изпълнено условието за спиране. Вижте диаграмата по-долу, за да получите по-добро разбиране:

В горната блок-схема кодът ще отговори в следните стъпки:

  1. На първо място ще провери състоянието.
  2. Ако се установи, че е вярно, ще изпълни набора от кодове.
  3. След това отново проверява състоянието, ако е вярно, ще изпълни същия код отново. Веднага щом се установи, че условието е невярно, то веднага излиза от цикъла.

По-долу е даден пример за оператор while в R. Опитайте да стартирате този пример в R Studio.

x = 2, докато (x<1000) { x=x^2 print(x) } 

Изход:

4 16 256 65 536

Значи трябва да се чудите как се различават тези две твърдения? Позволете ми да изчистя съмнението ви!
Тук основната разлика между повторението и изявлението while е, че се променя по отношение на вашето състояние. Докато цикълът основно определя кога ще въведете цикъла за изпълнение на операторите и повторете цикъл определя когато излизате от цикъла след изпълнението на операторите. Така че тези две твърдения са известни като контур за контрол на влизане и контур за контрол на изхода. Ето как твърдения while и repeat се различават.

  • За Loop: За цикли се използват, когато трябва да се изпълни блок от код няколко пъти. Вижте диаграмата по-долу, за да получите по-добро разбиране:

В горната блок-схема кодът ще отговори в следните стъпки:

  1. На първо място има инициализация, където посочвате колко пъти искате цикълът да се повтаря.
  2. След това проверява състоянието. Ако условието е вярно, то ще изпълни набора от код за посочения брой пъти.
  3. Веднага щом се установи, че условието е невярно, то веднага излиза от цикъла.

По-долу е даден пример за израз в R. Опитайте да стартирате този пример в R Studio.

vtr<- c(7,19,25,65, 45) for( i in vtr) { print(i) } 

Изход:

7 19 25 65 45

След това нека преминем към последния ни набор от изявления в блога R Tutorial, т.е.

R Урок: Изявления за скок

Изявление за прекъсване : Прекъсването на инструкции помага за прекратяване на програмата и възобновява контрола към следващия израз след цикъла. Тези изявления се използват и в случай на превключване. Вижте диаграмата по-долу, за да получите по-добро разбиране:

В горната блок-схема кодът ще отговори в следните стъпки:

  1. На първо място, той ще влезе в цикъла, където проверява състоянието.
  2. Ако условието на цикъла е невярно, той директно излиза от цикъла.
  3. Ако условието е вярно, то ще провери състоянието на прекъсване.
  4. Ако условието за прекъсване е вярно, то съществува от цикъла.
  5. Ако условието за прекъсване е невярно, то ще изпълни операторите, които са останали в цикъла, и след това ще повтори същите стъпки.

По-долу е даден пример за оператор за скок в R. Опитайте да стартирате този пример в R Studio.

х<- 1:5 for (val in x) { if (val == 3){ break } print(val) } 

Изход:

[1] 1 [1] 2

Следващо изявление : Следващ израз се използва, когато искате да пропуснете текущата итерация на цикъла, без да го прекратявате. Следващото изявление е доста подобно на ‘continue’ в друг език за програмиране. Вижте диаграмата по-долу, за да получите по-добро разбиране:

В горната блок-схема кодът ще отговори в следните стъпки:

  1. На първо място, той ще влезе в цикъла, където проверява състоянието.

  2. Ако условието на цикъла е невярно, той директно излиза от цикъла.

  3. Ако условието на цикъла е вярно, то ще изпълни оператори от блок 1.

  4. След това ще провери за „следващо“ изявление. Ако е налице, тогава операторите след това няма да бъдат изпълнени в същата итерация на цикъла.

  5. Ако изразът ‘next’ не присъства, тогава всички изявления след това ще бъдат изпълнени.

По-долу е даден пример за следващ израз в R. Опитайте да стартирате този пример в R Studio.

за (i в 1:15) {if ((i %% 2) == 0) {next} print (i)}

Изход:

1 3 5 7 9 11 13 15

Това е краят на R tutorial blog. Надявам се, че вие ​​сте наясно с всяка една концепция, която съм обсъждал по-горе. Останете на линия, следващият ми блог ще бъде на R обучение, където ще обясня подробно някои концепции на R с exдостатъчно.

След като разбрахте основите на R, разгледайте от Edureka, доверена компания за онлайн обучение с мрежа от над 250 000 доволни учащи, разпространени по целия свят. Анализът на данни на Edureka с R обучение ще ви помогне да придобиете опит в R програмиране, манипулиране на данни, проучвателен анализ на данни, визуализация на данни, извличане на данни, регресия, анализ на настроението и използване на R Studio за реални казуси в областта на търговията на дребно, социалните медии.

Имате въпрос към нас? Моля, споменете го в раздела за коментари на този блог „R Tutorial“ и ние ще се свържем с вас възможно най-скоро.