Какви са предпоставките за машинно обучение?



Този блог за предпоставките за машинно обучение ще ви помогне да разберете основните концепции, които трябва да знаете, преди да започнете с машинното обучение.

Машинното обучение несъмнено е най-търсената технология за епохата! Ако сте начинаещ, който започва работа с машинно обучение, важно е да знаете предпоставките за машинно обучение. Този блог ще ви помогне да разберете различните концепции, които трябва да знаете, преди да започнете с машинното обучение.

За да получите задълбочени познания по изкуствен интелект и машинно обучение, можете да се запишете на живо от Edureka с денонощна поддръжка и доживотен достъп.





Ето списък с теми обхванати в този блог:

  1. Предпоставки за машинно обучение
  2. Разбиране на машинното обучение с случай на употреба

Предпоставки за машинно обучение

За да започнетеМашинно обучение трябва да сте запознати със следните понятия:



  1. Статистика
  2. Линейна алгебра
  3. Смятане
  4. Вероятност
  5. Програмни езици

Статистика

Статистиката съдържа инструменти, които могат да се използват за получаване на някакъв резултат от данните. Има описателна статистика, която се използва за трансформиране на сурови данни в някаква важна информация. Също така, извеждащата статистика може да се използва за получаване на важна информация от извадка от данни, вместо да се използва пълен набор от данни.

За да научите повече за Статистика можете да прегледате следните блогове:

Линейна алгебра

Сделки с линейна алгебрас вектори, матрици и линейни преобразувания. Това е много важно при машинното обучение, тъй като може да се използва за трансформиране и извършване на операции върху набора от данни.



Смятане

Калкулацията е важна област в математиката и играе неразделна роля в много алгоритми за машинно обучение. Наборът от данни с множество функции еизползва се за изграждане на модели за машинно обучение, тъй като характеристиките са множество мултипроменливи смятания, играе важна роля за изграждане на модел за машинно обучение. Интеграциите и диференциациите са задължителни.

Вероятност

Вероятността помага да се предскаже вероятността от събития, Помага ни да разсъждаваме, че ситуацията може или не може да се повтори. За машинно обучение вероятността е a основа.

Mathematics

За да научите повече за вероятността, можете да преминете през това Блог.

части от Java програма

Програмен език

Важно е да знаете езици за програмиране като R и Python, за да приложите целия процес на машинно обучение. Python и R предлагат вградени библиотеки, които улесняват много лесно прилагането на алгоритми за машинно обучение.

Освен основни познания по програмиране, важно е също така да знаете как да извличате, обработвате и анализирате данни. Това е едно от най-важните умения, които са необходими за машинното обучение.

За да научите повече за програмирането езици за машинно обучение, можете да преминете през следните блогове:

  1. Най-добрите библиотеки на Python за наука за данни и машинно обучение

Случай за използване на машинно обучение

Машинното обучение се състои в създаването на алгоритъм, който може да се учи от данни, за да направи прогноза, като например какви предмети има на снимката, или механизъм за препоръки, най-добрата комбинация от лекарства за лечение на определена болест или филтриране на спам.

Машинното обучение е изградено на математически предпоставки и ако знаете защо математиката се използва в машинното обучение, ще го направи забавно. Трябва да знаете математиката зад функциите, които ще използвате, и кой модел е подходящ за данните и защо.

Така че нека да започнем с интересен проблем за прогнозиране на цените на жилищата, като имаме набор от данни, съдържащ история на различни характеристики и цени, засега ще разгледаме площта на жилищната площ в квадратни фути и цените.

Сега имаме набор от данни, съдържащ две колони, както е показано по-долу:

Трябва да има някаква връзка между тези две променливи, за да разберем, че ще трябва да изградим модел, който може да предскаже цената на къщите, как можем да го направим?

Нека изобразим тези данни и да видим как изглеждат:

Тук оста X е цената на квадратен метър жилищна площ, а оста Y е цената на къщата. Ако начертаем всички точки с данни, ще получим разпръснат график, който може да бъде представен с линия, както е показано на фигурата по-горе и ако въведем някои данни, това ще предскаже някакъв резултат. В идеалния случай трябва да намерим линия, която ще пресича максималните точки от данни.

Тук се опитваме да създадем линия, която се нарича:

Y = mX + c

Този метод за предсказване на линейната връзка между целевата (зависима променлива) и предикторната променлива (независима променлива) се нарича линейна регресия. Позволява ни да проучим и обобщим връзка между две променливи.

  • X = Независима променлива
  • Y = зависима променлива
  • c = y-прихващане
  • m = наклонена линия

Ако разгледаме уравнението, имаме стойности за X, която е независима променлива, така че всичко, което трябва да направим, е да изчислим стойности за m и c, за да предскажем стойността на Y.

И така, как да намерим тези променливи?

За да намерим тези променливи, можем да опитаме куп стойности и да се опитаме да намерим линия, която пресича максималния брой точки от данни. Но как можем да намерим най-подходящата линия?

Така че, за да намерим най-подходящата линия, можем да използваме функцията за грешка с най-малки квадрати, която ще намери грешката между реалната стойност на y и прогнозираната стойност y`.

Функцията за грешка на най-малките квадрати може да бъде представена чрез следното уравнение:

Използвайки тази функция, можем да открием грешката за всяка прогнозирана точка от данни, като я сравним с действителната стойност на точката с данни. След това вземате сумирането на всички тези грешки и ги квадратирате, за да установите отклонението в прогнозата.

обадете се чрез препратка c ++ пример

Ако добавим третата ос към нашата графика, съдържаща всички възможни стойности на грешки, и я начертаем в триизмерно пространство, тя ще изглежда така:

В горното изображение идеалните стойности ще бъдат в долната черна част, която ще предскаже цените, близки до действителната точка с данни. Следващата стъпка е да се намерят възможно най-добрите стойности за m и c. Това може да се направи с помощта на техниката за оптимизация, наречена градиентно спускане.

Градиентното спускане е итеративен метод, при който започваме с инициализиране на някакъв набор от стойности за нашите променливи и ги подобряваме бавно чрез минимизиране на грешката между действителната стойност и прогнозираната стойност.

Сега, ако смятаме, че на практика цените на апартамента всъщност не зависят само от цената на квадратен метър, има много фактори като броя спални, бани и др. Ако вземем предвид и тези характеристики, тогава уравнението ще изглежда нещо като този

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Това е многолинейна регресия, това принадлежи на линейната алгебра, тук можем да използваме матрици с размер mxn, където m са характеристики и n са точки от данни.

Нека разгледаме друга ситуация, при която можем да използваме вероятността да намерим състоянието на къщата, за да класифицираме къща въз основа на това дали е в добро състояние или в лошо състояние. За да работим, ще трябва да използваме техника, наречена Логистична регресия, която работи върху вероятността от поява, представена от сигмоидна функция.

В тази статия разгледахме предпоставките за машинно обучение и как те се прилагат в машинното обучение. Така че основно се състои от статистика, смятане, линейна алгебра и теория на вероятностите. Калкулацията има техники, използвани за оптимизация, линейната алгебра има алгоритми, които могат да работят върху огромни набори от данни, с вероятност можем да предскажем вероятността от поява, а статистиката ни помага да извлечем полезни прозрения от извадката от набори от данни.

След като знаете предпоставките за машинно обучение, сигурен съм, че сте любопитни да научите повече. Ето няколко блога, които ще ви помогнат да започнете с Data Science:

Ако искате да се запишете за пълен курс по изкуствен интелект и машинно обучение, Edureka има специално подготвен което ще ви накара да владеете техники като контролирано обучение, учене без надзор и обработка на естествен език. Включва обучение за най-новите постижения и технически подходи в областта на изкуствения интелект и машинното обучение като дълбоко обучение, графични модели и обучение за подсилване.