Статистика за машинно обучение: Ръководство за начинаещи



Тази статия за Статистика за машинно обучение е изчерпателно ръководство за различните концепции и статистика с примери.

Разбирането на данните и възможността да се създаде стойност от тях е умението на десетилетието. Машинното обучение е едно такова основно умение, което помага на компаниите да го изпълнят. За да започнете обаче, трябва да изградите правилно своите основи. И така, в тази статия ще разгледам няколко основни понятия и ще ви дам насоки за започване на вашето пътуване в машинното обучение. И така, в тази статия за статистиката за машинно обучение ще бъдат обсъдени следните теми:

  1. Вероятност
  2. Статистика
  3. Линейна алгебра

Вероятност и статистика за машинно обучение:





Какво е вероятност?

Вероятността количествено определя вероятността от настъпване на събитие. Например, ако хвърлите справедлива, безпристрастна матрица, тогава вероятността за един обръщането е 1/6 . Сега, ако се чудите wхи? Тогава отговорът е съвсем прост!

Това е така, защото има шест възможности и всички са еднакво вероятни (справедлива смърт). Следователно можем да добавим 1 + 1 + 1 + 1 + 1 + 1 = 6. Но тъй като ние се интересуваме от събитие, при което се появява 1 . Има само един начин събитието може да се случи. Следователно,



Вероятност 1 да се появи = 1/6

Подобен е случаят с всички останали числа, тъй като всички събития са еднакво вероятни. Просто, нали?

Е, често задаваната дефиниция на вероятността за този пример би звучала така - вероятността за 1 завъртане е съотношението на броя пъти 1, обърнати нагоре, към общия брой пъти, в които матрицата е била хвърлена, ако матрицата е била хвърлена безкрайно пъти.Как има смисъл от това?



Нека го направим по-интересно. Помислете за двата случая - 5 пъти сте хвърлили справедлива матрица. В един случай последователността от числа, които се появяват, е - [1,4,2,6,4,3]. В другия случай получаваме - [2,2,2,2,2,2]. Коя според вас е по-вероятна?

И двете са еднакво вероятни. Изглежда странно, нали?

Сега разгледайте друг случай, в който са всичките 5 ролки във всеки случай независим . Това означава, че едната ролка не засяга другата. В първия случай, когато се появи 6, нямаше представа, че 2 се появиха преди него. Следователно всичките 5 хвърляния са еднакво вероятни.

По същия начин, правите 2s във втория случай могат да се разберат като последователност от независими събития. И всички тези събития са еднакво вероятни. Като цяло, тъй като имаме едни и същи зарове, вероятността конкретно число да се появи в случай, че едно е същото като случай две. След това, в тази статия за статистиката за машинно обучение, нека разберем термина Независимост.

Независимост

Две събития Казват се, че A и B са независими, ако появата на A не засяга събитие B . Например, ако хвърлите монета и хвърлите матрица, резултатът от матрицата няма ефект върху това дали монетата показва глави или опашки. Също така, за две независими събития A и B , вероятност А и В да се появят заедно . Така например, ако искате вероятността монетата да показва глави, а матрицата да показва 3.

излезте от програма в java

P (A и B) = P (A) * P (B)

Следователно P = & frac12 (вероятност главите да се обърнат нагоре) * ⅙ (вероятност 3 да се обърнат) = 1/12

В предишния пример и за двата случая P = ⅙ * ⅙ * ⅙ * ⅙ * ⅙ * ⅙.

Сега нека поговорим за събития, които не са независими. Обмислете следната таблица:

Затлъстяване Не е затлъстял
Сърдечни проблемиЧетири петпетнадесет
Няма сърдечни проблеми1030

Взето е проучване на 100 души. 60 са имали сърдечни проблеми, а 40 - не. От 60, които имат сърдечен проблем, 45 са със затлъстяване. От 40, които нямат сърдечни проблеми, 10 са със затлъстяване. Ако някой ви попита -

  1. Каква е вероятността да имате сърдечен проблем?
  2. Каква е вероятността да имате сърдечен проблем и да не сте затлъстели?

Отговорът на първите въпроси е лесен - 60/100. За второто би било 15/100. Сега помислете за третия въпрос - човек е избран на случаен принцип. Установено е, че има сърдечно заболяване. Каква е вероятността той да е със затлъстяване?

Сега помислете за информацията, която ви е дадена - Известно е, че той има сърдечно заболяване. Следователно той не може да бъде от 40-те, които нямат сърдечно заболяване. Има само 60 възможни опции (най-горният ред в таблицата). Сега, сред тези намалени възможности, вероятността той да е със затлъстяване е 45/60. Сега, след като знаете кои са независимите събития, следващата в тази статия за статистиката за машинно обучение, нека разберем условните вероятности.

Условни вероятности

За да разберем условните вероятности, нека продължим дискусията си с горния пример. Състоянието на затлъстяване и състоянието на страдащо от сърдечни проблеми не е независимо. Ако затлъстяването не засяга сърдечните проблеми, то броят на случаите със затлъстяване и затлъстяване при хора със сърдечни проблеми би бил еднакъв.

Също така ни беше дадено, че човекът има сърдечни проблеми и трябваше да разберем вероятността да е със затлъстяване. Така че вероятността в този случай се казва, че той има сърдечен проблем. Ако вероятността от настъпване на събитие А е обусловена от събитие Б, ние го представяме като

P (A | B)

Сега има теорема, която ни помага да изчислим тази условна вероятност. Нарича се Правило на Байес .

P (A | B) = P (A и B) / P (B)

Можете да проверите тази теорема, като включите примера, който току-що обсъдихме. Ако сте разбрали досега, можете да започнете със следното - Наивен Байес . Той използва условни вероятности, за да класифицира дали даден имейл е спам или не. Той може да изпълнява много други задачи по класификация. Но по същество условната вероятност е в основата на .

Статистика:

Статистиката е използва се за обобщаване и изводи за голям брой точки от данни. В науката за данни и машинното обучение често ще попадате на следната терминология

  • Мерки за централност
  • Разпределения (особено нормални)

Мерки за централност и мерки за спредове

Означава:

Средното е просто средна стойност на числата . За да разберете средното, трябва да сумирате числата и да го разделите с броя на числата. Например средната стойност на [1,2,3,4,5] е 15/5 = 3.

mean-statistics-for-machine-learning

Медиана:

Медианата е среден елемент от набор от числа когато са подредени във възходящ ред. Например числата [1,2,4,3,5] са подредени във възходящ ред [1,2,3,4,5]. Средният от тях е 3. Следователно медианата е 3. Но какво, ако броят на числата е четен и следователно няма средно число? В този случай вземате средната стойност на двете най-средни числа. За поредица от 2n числа във възходящ ред осреднете n-то и (n + 1)тичисло за получаване на медианата. Пример - [1,2,3,4,5,6] има медиана (3 + 4) / 2 = 3,5

Режим:

Режимът е просто най-често срещан номер в набор от числа . Например режимът на [1,2,3,3,4,5,5,5] е 5.

Отклонение:

Дисперсията не е мярка за централно значение. Той измерва как вашите данни се разпространяват около средната стойност . Количествено се определя като

хе средната стойност на N числа. Вземате точка, изваждате средната стойност, вземате квадрата на тази разлика. Направете това за всички N числа и ги осреднете. Квадратният корен на дисперсията се нарича стандартно отклонение. След това, в тази статия за статистиката за машинно обучение, нека разберем Нормално разпределение.

как да хвърля двойно към int

Нормална дистрибуция

Разпределението ни помага разберете как се разпространяват нашите данни . Например, в извадка от възрасти може да имаме млади хора повече от възрастни възрастни и следователно по-малки стойности на възрастта повече от по-големи стойности. Но как да определим разпределение? Помислете за примера по-долу

Оста y представлява плътността. Режимът на това разпределение е 30, тъй като е пикът и следователно най-честият. Можем да намерим и медианата. Медианата лежи в точката на оста x, където е покрита половината от площта под кривата. Площта при всяко нормално разпределение е 1, защото сумата от вероятности за всички събития е 1. Например,

Медианата в горния случай е около 4. Това означава, че площта под кривата преди 4 е същата като тази след 4. Помислете за друг пример

Виждаме три нормални разпределения. Синьото и червеното имат една и съща средна стойност. Червеният има по-голяма дисперсия. Следователно, тя е по-разпространена от синята. Но тъй като площта трябва да бъде 1, пикът на червената крива е по-къс от синята крива, за да се запази площта постоянна.

Надявам се, че сте разбрали основните статистически данни и нормалните разпределения. Сега, следващата в тази статия за статистиката за машинно обучение, нека научим за линейната алгебра.

Линейна алгебра

Съвременният ИИ не би бил възможен без линейна алгебра. Той формира сърцевината на Дълбоко обучение и е бил използван дори в прости алгоритми като . Без допълнително забавяне, нека започнем.

Трябва да сте запознати с векторите. Те са един вид геометрични изображения в пространството. Например, вектор [3,4] има 3 единици по оста x и 4 единици по оста y. Помислете за следното изображение -

Vector d1 има 0.707 единици по оста x и 0.707 единици по оста y. Векторът има 1 измерение. Той задължително има величина и посока. Например,

Горното изображение има вектор (4,3). Неговата величина е 5 и прави 36,9 градуса с оста x.

Какво е матрица? Матрицата е многомерен масив от числа. За какво се използва? Ще видим напред. Но първо, нека да разгледаме как се използва.

Матрица

Матрицата може да има много измерения. Нека разгледаме двумерна матрица. Той има редове (m) и колони (n). Следователно той има m * n елементи.

Например,

Тази матрица има 5 реда и 5 колони. Нека го наречем А. Следователно A (2,3) е записът на втория ред и третата колона, който е 8.

Сега, след като знаете какво е матрица, ни позволява да разгледаме различните операции на матрицата.

Матрични операции

Добавяне на матрици

Две матрици на един и същ могат да се добавят размери. Добавянето става по елемент.

Скаларно умножение

Матрицата може да се умножи по скаларна величина. Такова умножение води до това, че всеки запис в матрицата се умножава по скалара. Скаларът е просто число

Транспониране на матрицата

Транспортирането на матрицата е просто. За матрица A (m, n) нека A ’е нейното транспониране. Тогава

A '(i, j) = A (j, i)

Например,

Умножение на матрицата

Това вероятно е малко сложно от други операции. Преди да се потопим в него, нека дефинираме точков продукт между два вектора.

Да разгледаме вектор X = [1,4,6,0] и вектор Y = [2,3,4,5]. Тогава точковото произведение между X и Y се определя като

X.Y = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38

И така, това е умножение и събиране по елементи. Сега,нека разгледаме две матрици A (m, n) и B (n, k), където m, n, k са измерения и следователно цели числа. Определяме умножението на матрицата като

В горния пример първият елемент на произведението (44) се получава от точковото произведение на първия ред на лявата матрица с първата колона на дясната матрица. По същия начин 72 се получава от точковото произведение на първия ред на лявата матрица с втората колона на дясната матрица.

Java преобразуване на низ в дата

Имайте предвид, че за лявата матрица броят на колоните трябва да бъде равен на броя на редовете в дясната колона. В нашия случай произведението AB съществува, но не и BA, тъй като m не е равно на k. За две матрици A (m, n) и B (n, k) продуктът AB е дефиниран и размерът на продукта е (m, k) (най-външните размери на (m, n), (n, k )). Но BA не е дефиниран, освен ако m = k.

С това стигнахме до края на тази статия за Статистика за машинно обучение. Надявам се, че сте разбрали някои от жаргона за машинно обучение. Това обаче не свършва дотук. За да сте сигурни, че сте готови за индустрията, можете да проверите курсовете на Edureka по Data Science и AI. Те могат да бъдат намерени