Неясно K-Meas грозде в Mahout



Този блог дава въведение за групирането на Fuzzy K-Means в Apache Mahout.

Fuzzy K-Means е точно същият алгоритъм като K-средства, което е популярна проста техника за клъстериране. Единствената разлика е, че вместо да присвоява точка изключително само на един клъстер, той може да има някакво размиване или припокриване между два или повече клъстера. Следват ключовите моменти, описващи Fuzzy K-Means:





  • За разлика от K-Means, който търси твърд клъстер, където всяка от точките принадлежи на един клъстер, Fuzzy K-Means търси по-меките клъстери за припокриване.
  • Една точка в мек клъстер може да принадлежи на повече от един клъстер с определена стойност на афинитет към всяка от точките.
  • Афинитетът е пропорционален на разстоянието на тази точка от клъстерния центроид.
  • Подобно на K-Means, Fuzzy K-Means работи върху обектите, които имат дефинирана мярка за разстояние и могат да бъдат представени в н- размерно векторно пространство.

Fuzzy K-Means Map Намаляване на потока

Няма голяма разлика между потока MapReduce на K-Means и Fuzzy K-Means. Изпълнението и на двете в Mahout е подобно.

какво е метод на javascript

Следват съществени параметри за прилагането на Fuzzy K-Means:



  • За въвеждане се нуждаете от набор от данни Vector.
  • Трябва да има RandomSeedGenerator за засяване на първоначалните k клъстери.
  • За измерване на разстояние се изисква SquaredEuclideanDistanceMeasure.
  • Голяма стойност на прага на конвергенция, като –cd 1.0, ако е използвана квадратурата на мярката за разстоянието
  • Стойност за maxIterations стойността по подразбиране е -x 10.
  • Коефициентът на нормализиране или коефициентът на размитост, със стойност по-голяма от -m 1,0

Имате въпрос към нас? Споменете ги в раздела за коментари и ние ще се свържем с вас.

низ е променлив или неизменим в java

Подобни публикации



кой метод на клас скенер чете низ

Управлявано обучение в Apache Mahout