Различни техники за моделиране:
Можем да разделим всеки проблем на по-малки процеси:
Класификация - е, където класифицираме данните. Напр. болести всички болести проявяват определено поведение и ние можем допълнително да ги класифицираме.
Например: заболявания, намаляващи имунитета, заболявания, които дават главоболие и т.н.
Регресия - включва установяване на връзката между множество променливи.
Например: как теглото на човешкото същество е свързано с неговия ръст.
какво представлява смесването на данни в таблицата
АномолияОткриване - в основата си е колебание.
Например: В случай на високо напрежение или ниско напрежение.
Друг пример може да включва регулирано поведение, което включва шофиране в дясната или лявата страна според страната. Аномолията тук е някой, който кара от отсрещното.
Друг пример може да бъде намеса в мрежата. Тук удостоверен потребител влиза в уебсайта на вашата компания и след това, ако някой неудостоверен влезе, това еAn0moly.
Значение на атрибута - По принцип дава множество атрибути, като височина, тегло, температура, сърдечен ритъм. Важно е да се отбележи, че всички тези атрибути са важни за дадена задача.
обяснете разликата между изменяеми и неизменяеми обекти.
Например: Някой се опитва да предскаже, по кое време човек ще стигне до офиса. Всеки атрибут играе важна роля, но не всички атрибути са важни.
Правила за асоцииране - По-просто казано, това е да се анализира или прогнозира следващото поведение, където то се върти около механизма за препоръки.
Например: Човек, който купува хляб, може да купи и мляко. Ако анализираме поведението в миналото при пазаруване, всички артикули в кошницата имат връзка. В този случай може да има вероятност човекът, който купува хляб, да купи и мляко.
Групиране - Това е една от най-старите техники в статистиката. Всъщност винаги може да се моделира всеки проблем, било то класификация или групиране, което означава групиране на подобни обекти.
Например:
1) Вземете кошница с ябълки и портокали, в която можем да отделим ябълките от портокалите.
2) Важен случай за използване на клъстери е здравеопазването. Почти всички статистически данни и анализи започнаха със случаи на използване на здравеопазването. За да влезете по-дълбоко, има клъстерен термин, наречен когорти (хора с подобни заболявания), така че те могат да бъдат изучавани отделно от съществуващите клиенти. Например, ако 10 души страдат от треска и други 10 души от главоболие, ще открием общото между тях и ще генерираме лекарства.
Извличане на функции - По отношение на точността на извличане на характеристиките, валидността и отказът са доста важни. С други думи, извличането на характеристики може да се нарече разпознаване на образци.
в python се използва методът __init__ на клас
Например:
В търсенето с Google, когато потребителят въведе термин, той извежда резултати. Сега важен въпрос, който трябва да бъде зададен, е откъде е знаел, коя страница е подходяща и неприложима за термина? На това може да се отговори с извличане на функции и разпознаване на шаблони, където добавя видни функции. Да кажем, че е дадена снимка, някои камери разпознават лица, подчертават лицето, за да дадат красиви изображения, което също използва разпознаване на функции.
Контролирано обучение срещу Неуправлявано обучение
да се) Категория на прогнозите - Техниките включват регресия, логистика, невронни мрежи и дървета за вземане на решения. Някои примери включват откриване на измами (когато компютърът научава и предсказва следващата измама от предишната история на измами). При ученето без надзор не може да се предскаже с примери, тъй като няма исторически данни.
б) Класификация Категория - Вземайки пример, независимо дали транзакцията е измамна или не, тя влиза в категорията за класификация. Тук взимаме исторически данни и ги класифицираме с дърветата за решения или в случай, че изобщо не вземем никакви исторически данни, тогава директно започваме с данни и се опитваме да използваме функции сами. Например, ако трябва да познаваме служителите, които е вероятно да напуснат организацията или да останат. В случай, че това е нова организация, където не можем да използваме исторически данни, винаги можем да използваме клъстериране за извличане на данни.
° С) Категория на проучване - Това е директен метод, измислящ какво означават големите данни. При ученето без надзор то се нарича основни компоненти и групиране.
д) Категория на афинитет - тук са включени множество елементи като кръстосана продажба / продажба нагоре, анализ на пазарната кошница. В анализа на кошницата няма контролирано обучение, тъй като няма исторически данни. Така че ние вземаме данни директно и намираме асоциации, последователност и анализ на фактора.
Имате въпрос към нас? Споменете ги в раздела за коментари и ние ще се свържем с вас.
Подобни публикации: