Техники за моделиране в бизнес анализи с R



Блогът дава кратко въведение в Техники за моделиране в бизнес анализи с R.

Различни техники за моделиране:

Можем да разделим всеки проблем на по-малки процеси:





Класификация - е, където класифицираме данните. Напр. болести всички болести проявяват определено поведение и ние можем допълнително да ги класифицираме.

Например: заболявания, намаляващи имунитета, заболявания, които дават главоболие и т.н.



Регресия - включва установяване на връзката между множество променливи.

Например: как теглото на човешкото същество е свързано с неговия ръст.

какво представлява смесването на данни в таблицата

АномолияОткриване - в основата си е колебание.



Например: В случай на високо напрежение или ниско напрежение.

Друг пример може да включва регулирано поведение, което включва шофиране в дясната или лявата страна според страната. Аномолията тук е някой, който кара от отсрещното.

Друг пример може да бъде намеса в мрежата. Тук удостоверен потребител влиза в уебсайта на вашата компания и след това, ако някой неудостоверен влезе, това еAn0moly.

Значение на атрибута - По принцип дава множество атрибути, като височина, тегло, температура, сърдечен ритъм. Важно е да се отбележи, че всички тези атрибути са важни за дадена задача.

обяснете разликата между изменяеми и неизменяеми обекти.

Например: Някой се опитва да предскаже, по кое време човек ще стигне до офиса. Всеки атрибут играе важна роля, но не всички атрибути са важни.

Правила за асоцииране - По-просто казано, това е да се анализира или прогнозира следващото поведение, където то се върти около механизма за препоръки.

Например: Човек, който купува хляб, може да купи и мляко. Ако анализираме поведението в миналото при пазаруване, всички артикули в кошницата имат връзка. В този случай може да има вероятност човекът, който купува хляб, да купи и мляко.

Групиране - Това е една от най-старите техники в статистиката. Всъщност винаги може да се моделира всеки проблем, било то класификация или групиране, което означава групиране на подобни обекти.

Например:

1) Вземете кошница с ябълки и портокали, в която можем да отделим ябълките от портокалите.

2) Важен случай за използване на клъстери е здравеопазването. Почти всички статистически данни и анализи започнаха със случаи на използване на здравеопазването. За да влезете по-дълбоко, има клъстерен термин, наречен когорти (хора с подобни заболявания), така че те могат да бъдат изучавани отделно от съществуващите клиенти. Например, ако 10 души страдат от треска и други 10 души от главоболие, ще открием общото между тях и ще генерираме лекарства.

Извличане на функции - По отношение на точността на извличане на характеристиките, валидността и отказът са доста важни. С други думи, извличането на характеристики може да се нарече разпознаване на образци.

в python се използва методът __init__ на клас

Например:

В търсенето с Google, когато потребителят въведе термин, той извежда резултати. Сега важен въпрос, който трябва да бъде зададен, е откъде е знаел, коя страница е подходяща и неприложима за термина? На това може да се отговори с извличане на функции и разпознаване на шаблони, където добавя видни функции. Да кажем, че е дадена снимка, някои камери разпознават лица, подчертават лицето, за да дадат красиви изображения, което също използва разпознаване на функции.

Контролирано обучение срещу Неуправлявано обучение

да се) Категория на прогнозите - Техниките включват регресия, логистика, невронни мрежи и дървета за вземане на решения. Някои примери включват откриване на измами (когато компютърът научава и предсказва следващата измама от предишната история на измами). При ученето без надзор не може да се предскаже с примери, тъй като няма исторически данни.

б) Класификация Категория - Вземайки пример, независимо дали транзакцията е измамна или не, тя влиза в категорията за класификация. Тук взимаме исторически данни и ги класифицираме с дърветата за решения или в случай, че изобщо не вземем никакви исторически данни, тогава директно започваме с данни и се опитваме да използваме функции сами. Например, ако трябва да познаваме служителите, които е вероятно да напуснат организацията или да останат. В случай, че това е нова организация, където не можем да използваме исторически данни, винаги можем да използваме клъстериране за извличане на данни.

° С) Категория на проучване - Това е директен метод, измислящ какво означават големите данни. При ученето без надзор то се нарича основни компоненти и групиране.

д) Категория на афинитет - тук са включени множество елементи като кръстосана продажба / продажба нагоре, анализ на пазарната кошница. В анализа на кошницата няма контролирано обучение, тъй като няма исторически данни. Така че ние вземаме данни директно и намираме асоциации, последователност и анализ на фактора.

Имате въпрос към нас? Споменете ги в раздела за коментари и ние ще се свържем с вас.

Подобни публикации: