Кластерный анализ в действии

Здесь мы изучаем и реализуем различные алгоритмы кластерного анализа и проверяем их эффективность

Исследуемые алгоритмы

K-средних
Нейронная сеть Кохонена (Сети векторного квантования)

Теория

Расчеты по методу K-средних

выбрать число кластеров N
выбрать исходные центры кластеров
Пересчитать центры кластеров

Для каждого кластера выполнить:

for (i=0; i< dimensions; i++)
{
    centroid[i] += point[i];	
    pointsInCluster++;
}
for (i=0; i< dimensions; i++)
{
    centroid[i] /= pointsInCluster;	
}

Обучение слоя Кохонена

Обучения нейрона Кохонена выполняется итерационно, согласно уравнению:

w_{n e w} = w_{o l d} + k (x - w_{o l d})

,

где $w_{n e w}$ – новое значение веса, соединяющего входную компоненту х с выигравшим нейроном; $w_{o l d}$ – предыдущее значение этого веса; k – коэффициент скорости обучения, который может варьироваться в процессе обучения.

Выбор начальных значений весовых векторов

Одно из решений, известное под названием метода выпуклой комбинации, состоит в том, что все веса приравниваются одной и той же величине:

w_{i} = \frac{1}{\sqrt{n}}

,

где $n$ – число входов (число компонент каждого весового вектора).

Но тогда каждая компонента входа x корректируется:

x_{i} = k x_{i} + \frac{1 - k}{\sqrt{n}}

В начале обучения $k$ мало, вследствие чего все входные векторы имеют длину, близкую к $\frac{1}{\sqrt{n}}$ , и почти совпадают с векторами весов. В процессе обучения сети $k$ постепенно возрастает, приближаясь к единице.

Метод выпуклой комбинации хорошо работает, но несколько замедляет процесс обучения, так как весовые векторы подстраиваются к изменяющейся цели. Но зато, в отличие от метода K-средних, нет необходимости устанавливать центры произвольным образом, и они образуется плавно в зависимости от распределения значений компонентов в обучающей выборке.

Практика

Задание №1

Есть готовый численный пример
Нужно перевести и оформить в Викиверситете

Задание №2

Есть готовая реализация кластеризации алгоритмом k-means на C++
Нужно переписать код на C#, разобравшись в алгоритме

Кластерный анализ в действии

Содержание

Исследуемые алгоритмы

Теория

Расчеты по методу K-средних

Обучение слоя Кохонена

Выбор начальных значений весовых векторов

Практика

Задание №1

Задание №2

Навигация

Кластерный анализ в действии

Исследуемые алгоритмы

Теория

Расчеты по методу K-средних

Обучение слоя Кохонена

Выбор начальных значений весовых векторов

Практика

Задание №1

Задание №2

Навигация

Поиск