Процес на предсказуем анализ в Business Analytics с R



Блогът дава кратка представа за процеса на предсказуем анализ в Business Analytics с R

Типичен процес на моделиране:

В типичен процес на моделиране е важно да започнете да изготвяте хипотеза. Получава се RFP (Искане за предложение) и след това се изготвя хипотеза.





python преобразува числото в двоично
  1. Определете правилния източник на данни - Тук клиентът може да даде източник на данни, ако не, трябва да потърсим източник на данни. Като се има предвид сценарий, при който се опитваме да оценим кой ще спечели изборите, се прави публичен анализ на данните с източници, които включват социални медии, новинарски канали или обществено мнение. Също така трябва да разберем количеството данни, необходимо за анализ на проблема. В този случай обикновено търсим големи проби, тъй като става въпрос за избор. От друга страна, ако анализът се прави по отношение на здравеопазването, е трудно да се прибегне до голяма част от населението, тъй като има вероятност да не се наберат достатъчно хора, които да потвърдят хипотезата. Също така качеството на данните е много важно.
  2. Извличане на данни - Например, ако вземем извадка от популация, можем да разгледаме атрибути, като високи доходи, ниски доходи, възраст, работещо население (извън обекта / на място), жители, NRI, покритие на болници и т.н., за да започнем проучването . Тук може да не ни трябват толкова много атрибути за хипотезата. Разбираме, че атрибути като високи и ниски доходи може да не са факторите, които допринасят за това кой ще спечели изборите. Но възрастта може да промени, тъй като ще даде пряк брой на хората, които ще гласуват. Много пъти можем да изключим по-малко използвани атрибути или да включим полезни атрибути. И в двата случая може да се обърка. Това е причината аналитиката да е предизвикателство.
  3. Масажирайте данните, за да се поберат в инструмента - Това е така, защото не всички инструменти могат да приемат всички данни. Някои инструменти приемат само CSV данни или данни на Excel. Липсата на инструменти е предизвикателство.
  4. Стартирайте анализа - Тази операция може да се извърши с помощта на много техники за анализ.
  5. Направете заключения - Анализът дава цифри, за да бъдем точни. Но зависи от потребителя да извлече заключения от тези числа. Например, ако пише 10% или 20%, трябва да разберем какво означава това? Извежда ли корелация между атрибут А и атрибут Б?
  6. Прилагане на резултатите - Важно е да приложите заключения, за да видите резултатите в бизнеса. Например може да се заключи, че ‘Хората купуват чадър в дъждовен сезон’ което може да доведе до повече бизнес. Тук трябва да приложим заключение, където правим чадър, предлаган в магазините, но тогава той може да има проблеми с управлението. В момента, в който статистиката даде резултат, изпълнението може да се обърка.
  7. Наблюдавайте напредъка - Последната стъпка тук, мониторингът играе важна роля. Мониторингът може да се обърка, защото не са много организациите, които искат да следят напредъка и това се счита за незначителна стъпка. Но наблюдението е важно, тъй като можем да разберем дали нашите изследвания и заключения са насочени в правилната посока.

Вижте и тази статия' Корелацията не означава причинно-следствена връзка 'което дава представа за това как анализаторите могат да се объркат. Важен момент, който трябва да се отбележи в тази диаграма, е, че анализът на работата е единствената стъпка, при която машината е отговорна, а след това зависи от човек, който в крайна сметка ще определи как се извършва изследването.

Имате въпрос към нас? Споменете ги в раздела за коментари и ние ще се свържем с вас.



можете ли да разширите и внедрите в java

Подобни публикации: