Page 1 of 1

Различные типы кластерного анализа

Posted: Wed Dec 18, 2024 8:20 am
by Md5656raj
Существует множество методов проведения кластерного анализа , но есть три, которые очень часто используются в маркетинге. Это следующие:

Иерархический кластер
Первая классификация будет состоять из иерархических и неиерархических методов. То есть люди группируются в иерархические фазы. Этот метод интеллектуального анализа данных для классификации данных основан на расстоянии между каждым человеком и направлен на то, чтобы данные внутри кластера были максимально похожи друг на друга .

Лучше это понять можно с помощью этих двух изображений: на первом мы без лишних слов видим, как распределяются данные, а на втором они начинают группироваться по расстоянию. Это создает дерево групп.

кластерно-иерархический

Кластер K-средних
Этот метод используется для быстрой кластеризации больших наборов данных . Этот подход может помочь вам решить некоторые вопросы, например: какие у меня клиенты? Какие из них покупают меньше всего товаров? Какие магазины продают больше (или меньше), чем должны? Хорошо ли они расположены? Или какие клиенты наиболее чувствительны к цене?

Начнем с выбора отдельных лиц, которые будут представителями каждого кластера, «центров». Как только это будет сделано, алгоритм позволит нам назначить остальных особей рядом с той, которая занимает центральное положение и находится ближе всего. Если какие-то особи выделяются над «центром», их придется обновить. Эти шаги повторяются до тех пор, пока группы не останутся прежними, без новых переназначений.

На изображении ниже показаны четыре типа клиентов на основе трех измерений кластеризации.

кластер-k-средства

двухступенчатая группа
Этот метод использует алгоритм кластеризации для идентификации кластер купить номер дании ов, сначала выполняя предварительную кластеризацию, а затем применяя иерархические методы . Двухэтапная кластеризация лучше всего подходит для работы с большими наборами данных, вычисление которых в противном случае заняло бы много времени с помощью строго иерархических методов.

По сути, двухэтапный кластерный анализ представляет собой комбинацию k-средних и иерархического кластерного анализа . Он может обрабатывать масштабные и порядковые данные и автоматически выбирает количество групп. Это похоже на объединение двух исследовательских центров, работающих на полную мощность.

Image




Как выглядит процесс группировки при кластеризации?
Процесс кластеризации состоит из разделения всей информации на группы, также известные как кластеры, на основе шаблонов данных . Эта методология является одной из наиболее часто используемых форм обучения без учителя.

Это неконтролируемый метод, поскольку вначале неизвестна переменная отклика, которая бы указывала, к какой группе действительно принадлежит каждое наблюдение.

Кластеризация — очень эффективный инструмент для осмысления данных и группировки их в схожие группы. Их вклад помогает расшифровать структуры и закономерности в наборе данных, которые человеческому глазу нелегко идентифицировать.

Прежде чем организовывать кластеры
Начало процесса кластеризации может быть очень похоже на сбор помидоров в саду: некоторые из них более зеленые, более спелые, другие не зеленые и не спелые и т. д. Фермер выбирает помидоры: те, которые потверже, он оставляет, а более мягкие и окрашенные кладет в ящик. Эта операция по-прежнему является кластерным процессом.

Сначала осмотрите весь образец на основе двух характеристик (цвета и текстуры); После этого он начинает разделяться на две группы: зеленые и твердые. Две группы. Отличие этого примера кластера от реальности в том, что здесь легко узнать, какие группы мы собирались найти, но в более сложных выборках невозможно заранее знать, какие схожие характеристики мы собираемся найти, чтобы сформировать кластеры. . По этой причине кластеризация известна как метод обучения без учителя.