Управлявано обучение в Apache Mahout



Наблюдаваното обучение е техника на машинно обучение, при която функция се извежда от етикетираните примери за данни за обучение.

Ученото под наблюдение е методът, при който данните за обучение включват както входните данни, така и желаните резултати. Обучението на системата с примери се нарича контролирано обучение. Или пък обучението на алгоритъма с учител също може да се третира като контролирано обучение. След обучение на алгоритъма с всички примерни данни или етикетирани данни, които имат и двата предиктора на целевата променлива, човек може да обучи алгоритъма и да използва невидимия пример за по-нататъшна класификация.





какво означава tostring в java

Ето някои от важните характеристики на контролираното обучение в Mahout:

  • Изграждането на подходящ набор за обучение, валидиране и тестване (Bok) е от решаващо значение.
  • Тези методи обикновено са бързи и точни.
  • Методите за контролирано обучение трябва да могат да се обобщават.
  • Те дават коректни резултати, когато се въвеждат нови данни, без да се знае aаприорицел.
  • В някои случаи са известни правилните резултати (цели) и са дадени като вход към модела по време на учебния процес.

Пример за контролирано обучение

В случай, че искате да обучите мисия и ви се дават две различни групи изображения заедно с етикетираните данни, напр. на горната снимка едната група има изображения на слон, а другата - на лъв. Етикетирани данни предполагат, че всеки набор от данни има целева стойност. В горния пример наборът от данни е изображения на слон, докато етикетът, даден му, т.е. „Elephant“ е целевата стойност на набора от данни. Такъв етикетиран набор от данни се използва за тренировъчния процес, така че алгоритъмът за обучение може да се възползва от този набор от данни и да изгради някакъв модел, който може да се използва допълнително за класифициране на невидимите примери без етикетираните данни или целевата променлива.



Нека да идентифицираме характеристиките, които помагат при идентифицирането на обект като слон или лъв:

Характеристиките може да бъде - размер, цвят, височина, размер на ухото, багажник, бивник

Това може да се нарече набор от функции, който ще се използва за целите на обучението. Този набор от функции ще повлияе на крайната целева променлива. Тези променливи са известни като прогнозни променливи , защото ни помагат при определянето на крайна целева променлива . Крайната променлива също може да се нарече етикет. Крайната променлива тук е слон / лъв.



table-word

В този пример всеки от записите в категориите, размер, цвят, височина, размер на ухото, багажник и бивник е променлива променлива, докато Elephant и Lion са целевите променливи. Тези променливи могат да бъдат третирани съответно като примери за обучение и набори от данни за обучение.

По този начин, контролираното обучение е начин, чрез който тренирате заедно с етикетите, при което искате алгоритъмът да извлече определени характеристики от него и въз основа на това, когато видите невидим пример, алгоритъмът ще може да го класифицира в правилния клас.

Имате въпрос към нас? Споменете ги в раздела за коментари и ние ще се свържем с вас.

Подобни публикации: