Програмиране R - Ръководство за начинаещи за език за програмиране R



Този блог за програмиране на R ви запознава с R и ви помага да разберете подробно различните основни концепции за програмиране на R с примери.

R е един от най-популярните инструменти за анализ. Но освен че се използва за анализ, R е и език за програмиране.С неговия растеж в ИТ индустрията има процъфтяващо търсене на квалифицирани или с разбирането на R като едновременно инструмент за анализ на данни и език за програмиране.В този блог ще ви помогна да разберете различните основи на програмирането на R. В нашата стр отвратителен Блог ,дискутирали сме защо се нуждаем от анализ, какво е бизнес анализ, защо и кой използва R.

В този блог ще разберем следните основни концепции за програмиране R в следната последователност:





  1. Променливи
  2. Типове данни
  3. Оператори на данни
  4. Условна декларация
  5. Цикли
  6. Функции

Можете да преминете през записа на уебинара на езика за програмиране R, където нашият инструктор е обяснил подробно темите с примери, които ще ви помогнат да разберете по-добре програмирането на R.

R Програмиране за начинаещи | R Урок за програмиране на език | Едурека



Така че нека да продължим напред и да разгледаме първата концепция за програмиране R - променливи.

R Програмиране: Променливи

Променливите не са нищо друго освен име на място в паметта, съдържащо стойност. Променлива в R може да съхранява числови стойности, сложни стойности, думи, матрици и дори таблица. Изненадващо, нали?

Променлива - R програмиране - Edureka

Фиг: Създаванена променливи



Горното изображение ни показва как се създават променливи и как те се съхраняват в различни блокове памет. В R не трябва да декларираме променлива, преди да я използваме, за разлика от други езици за програмиране като Java, C, C ++ и т.н.

Нека да продължим напред и да се опитаме да разберем какво е тип данни и различните типове данни, поддържани в R.

R Програмиране: Типове данни

В R, самата променлива не се декларира за какъвто и да е тип данни, а по-скоро получава типа данни на R обекта, присвоен към нея. Така R се нарича динамично типизиран език, което означава, че можем да променяме типа данни на същата променлива отново и отново, когато го използваме в програма.

как да инициализираме обект в python

Типовете данни указва кой тип стойност има дадена променлива и какъв тип математически, релационни или логически операции могат да бъдат приложени към нея, без да причиняват грешка. Има много типове данни в R, но по-долу са най-често използваните:

Нека сега обсъдим всеки от тези типове данни поотделно, започвайки от Вектори.

Вектори

Векторите са най-основните R обекти с данни и има шест вида атомни вектори. По-долу са шестте атомни вектора:

Логично : Използва се за съхраняване на логическа стойност като ВЯРНО или НЕВЯРНО .

Числови : Използва се за съхраняване на положителни и отрицателни числа, включително реално число.

Например: 25, 7.1145, 96547

Цяло число : Той съдържа всички цели числа, т.е. всички положителни и отрицателни цели числа.

Например: 45.479, -856.479, 0

Комплекс : Те са от формата x + yi, където x и y са числови и i представлява квадратния корен от -1.

Например: 4 + 3i

Характер : Използва се за съхраняване на единичен знак, група знаци (думи) или група думи заедно. Символите могат да бъдат определени в единични кавички или двойни кавички.

Например: „Edureka“, „R е забавно да се учи“.

Като цяло, векторът се дефинира и инициализира по следния начин:

Vtr = c (2, 5, 11, 24) Или Vtr<- c(2, 5, 11 , 24)

Нека продължим напред и да разберем други типове данни в R.

Списък

Списъците са доста сходни с вектори, но Списъците са R обектите, които могат да съдържат елементи от различни типове като & минус числа, низове, вектори и друг списък вътре в него.

Например:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Изход:

[[1]] [1] „Здравей“ „Здравей“ „Как правиш ли „[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] ВЯРНО

Матрица

Матрицата е R обектът, в който елементите са подредени в двумерно правоъгълно оформление.

Основният синтаксис за създаване на матрица в R е & minus

 матрица (данни, nrow, ncol, byrow, dimnames) 

Където:

  • данни е входният вектор, който се превръща в елементите от данни на матрицата.
  • nrow е броят на редовете, които трябва да бъдат създадени.
  • ncol е броят на колоните, които трябва да бъдат създадени.
  • байроу е логична улика. Ако TRUE, тогава входните векторни елементи са подредени по ред.
  • dimname е имената, присвоени на редовете и колоните.

Пример:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Изход:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

Масив

Масивите в R са обекти на данни, които могат да се използват за съхраняване на данни в повече от две измерения. Взема вектори като вход и използва стойностите в не параметър за създаване на масив.

Основният синтаксис за създаване на масив в R е & minus

 масив (данни, dim, dimnames) 

Където:

  • данни е входният вектор, който се превръща в елементите от данни на масива.
  • не е размерът на масива, където предавате броя на редовете, колоната и броя на матриците, които трябва да бъдат създадени от споменатите размери.
  • dimname е имената, присвоени на редовете и колоните.

Пример:

Миари<- array( c(1:16), dim=(4,4,2)) Myarray 

Изход:

,, един [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 ,, 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Рамка за данни

Data Frame е таблица или двумерна структура, подобна на масив, в която всяка колона съдържа стойности на една променлива, а всеки ред съдържа един набор от стойностизавсяка колона. По-долу са дадени някои от характеристиките на Data Frame, които трябва да бъдат взети предвид всеки път, когато работим с тях:

  • Имената на колоните не трябва да са празни.
  • Всяка колона трябва да съдържа еднакво количество елементи от данни.
  • Данните, съхранявани в рамка за данни, могат да бъдат от цифров, факторен или символен тип.
  • Имената на редовете трябва да са уникални.

Пример:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Sales', 'Finance', 'Marketing', 'HR ',' R & D ') emp.data<- data.frame(emp_id, emp_name, dept) emp.data 

Изход:

emp_id emp_name dept 1 100 Джон Продажби 2 101 Хенри Финанс 3 102 Адам Маркетинг 4 103 Ron HR 5 104 Гари R&D

Така че сега, след като разбрахме основните типове данни на R, е време да се потопим дълбоко в R, като разберем концепциите на операторите на данни.

R Програмиране: Оператори на данни

В R има основно 4 оператора на данни, както е показано по-долу:

Аритметични оператори : Тези оператори ни помагат да изпълняваме основните аритметични операции като събиране, изваждане, умножение и др.

Помислете за следния пример:

num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modulus num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 # деление на пода num3 = num1% /% num2 num3

Изход:

[1] 35 [петнадесет [1] 300 [1] 0,75 [1] 15 [1] 125 [единадесет

Релационни оператори : Тези оператори ни помагат да изпълняваме релационните операции като проверка дали дадена променлива е по-голяма, по-малка или равна на друга променлива. Резултатът от релационната операция винаги е логическа стойност.

Обмислете следните примери:

num1 = 15 num2 = 20 #equals на num3 = (num1 == num2) num3 # не е равно на num3 = (num1! = num2) num3 # по-малко от num3 = (num1 num2) num3 # освен, че е равно на num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Изход:

[1] НЕВЯРНО [1] ВЯРНО [1] ВЯРНО [1] НЕВЯРНО [1] ВЯРНО [1] НЕВЯРНО

Оператори за възлагане: Тези оператори се използват за присвояване на стойности на променливи в R. Присвояването може да се извърши с помощта на оператора за присвояване(<-) или е равно на оператор (=). Стойността на променливата може да бъде присвоена по два начина, отляво и отдясно.

ЛогичноОператори: Тези оператори сравняват двете обекти и обикновено се използват с булеви (логически) стойности като „и“, „или“и'не'.


R Програмиране: Условни изявления

  1. Ако изявление: Операторът If ви помага при оценката на един израз като част от потока. За да извършите тази оценка, трябва просто да напишете ключовата дума If, последвана от израза, който ще бъде оценен. Диаграмата по-долу ще даде представа как операторът If контролира потока на код: Помислете за следния пример:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Изход:

[1] „Num1 е по-малко или равно на Num2“
  • Изложение „Else If“: Операторът Else if ви помага да разширите клонове към потока, създаден от израза If, и ви дава възможност да оцените множество условия, като създадете нови клонове на потока. Потокът по-долу ще ви даде представа как операторът else if разклонява потока на кода:

    Помислете за следния пример:

    Num1 = 5 Num2 = 20, ако (Num1 Num2) {print ('Num2 е по-малък от Num1')} else if ('Num1 == Num2) {print (' Num1 и Num2 са равни ')}

    Изход:

    [1] „Num1 е по-малък от Num2“

  • Друго изявление: Операторът else се използва, когато всички останали изрази са проверени и се считат за невалидни. Това ще бъде последното изявление, което се изпълнява като част от клонът If - Else if. По-долу поток ще ви даде по-добра представа за това как Else променя потока на кода:

Помислете за следния пример:

Num1 = 5 Num2 = 20, ако (Num1 Num2) {print ('Num2 е по-малък от Num1')} else print ('Num1 и Num2 са равни')}

Изход:

[1] „Num1 и Num2 са равни“

R Програмиране: Цикли

Инструкция за цикъл ни позволява да изпълняваме оператор или група от оператори няколко пъти. В R има основно 3 вида цикли:

  1. повторете Loop : Повтаря изявление или група изявления, докато дадено условие е TRUE. Цикълът за повторение е най-добрият пример за изходен контролиран цикъл, където кодът се изпълнява първо и след това се проверява условието, за да се определи дали контролата трябва да е вътре в цикъла или да излезе от него. По-долу е потока от контрол в повторен цикъл:
    Нека разгледаме примера по-долу, за да разберем как можем да използваме цикъл за повторение, за да добавим n числа, докато сумата достигне над 100:

    x = 2 повторете {x = x ^ 2 print (x) if (x> 100) {break}

    Изход:

    [1] 4 [1] 16 [1] 256
  2. докато Loop : Азt помага за повтаряне на изявление или група изявления, докато дадено условие е TRUE. Докато цикълът, в сравнение с цикъла за повторение, е малко по-различен, това е пример за входно контролиран цикъл, при който условието се проверява първо и само ако условието е установено, че е вярно, контролата се доставя вътре в цикъла за изпълнение на кода . По-долу е потокът от управление в цикъл while:
    Нека разгледаме примера по-долу, за да добавим сумата от квадратите за първите 10 числа и да разберем как цикълът while работи по-добре:

    c ++ масив за сортиране
    num = 1 sumn = 0, докато (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Изход:

    [единадесет [петнадесет [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. за Loop : Използва се за повтаряне на изявление или група от за определен брой пъти. За разлика от цикъл repeat и while, цикълът for се използва в ситуации, в които сме наясно колко пъти кодът трябва да бъде изпълнен предварително. Подобно е на цикъла while, при който първо се проверява условието и след това се изпълнява само написаният вътре код. Нека видим потока на управление на цикъл for сега:

Нека сега разгледаме пример, при който ще използваме цикъла for, за да отпечатаме първите 10 числа:

за (x в 1:10) {print (x)}

Изход:

[единадесет [12 [1] 3 [1] 4 [петнадесет [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R Програмиране: Функции

Функцията е блок от организиран код за многократна употреба, който се използва за извършване на едно, свързано действие. В R има основно два типа функции:

Предварително определени функции : Те са вградени функции, които могат да се използват от потребителя, за да работят Изиr. Например: меан( х) , сuм( х) , квт( х ), toupper( х ) и т.н.

Дефинирано от потребителя Функции: Тези функции са създадени от потребителя, за да отговорят на специфичните изисквания на потребителя. По-долу е синтаксисът за създаване на функция вR:

 func  име_на_нация  <– функция (arg_1, arg_2 и & hellip){ // Функционално тяло }

Да разгледаме следния пример за проста функция за генериране на сумата на квадратитена2 числа:

сума_от_квадрат<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Изход: [1] 25

Надявам се да ви е харесало да четете този блог за програмиране на R. Ние разгледахме всички основи на R в този урок, така че можете да започнете да практикувате сега. След този блог за програмиране на R ще измисля още блогове на R за Analytics, така че останете на линия.

След като разбрахте основите на R, разгледайте от Edureka, доверена компания за онлайн обучение с мрежа от над 250 000 доволни учащи, разпространени по целия свят. Анализът на данни на Edureka с R ще ви помогне да придобиете опит в програмирането на R, манипулирането на данни, проучвателния анализ на данните, визуализацията на данните, извличането на данни, регресията, анализа на настроението и използването на RStudio за реални казуси в областта на търговията на дребно, социалните медии.

Имате въпрос към нас? Моля, споменете го в раздела за коментари в този блог „Програмиране на R“ и ние ще се свържем с вас възможно най-скоро.