Preview

Труды Института системного программирования РАН

Расширенный поиск

Сравнение методик кластеризации частично упорядоченных множеств

https://doi.org/10.15514/ISPRAS-2014-26(4)-7

Полный текст:

Аннотация

В статье предлагается сравнение трех подходов к кластеризации частично упорядоченных множеств. Первый подход заключается в применение алгоритма кластеризации k-medoids с использованием расстояния Левенштейна. В качестве второго подхода рассматривается векторизация частично упорядоченных множеств с дальнейшей кластеризацией с помощью алгоритма k-means и косинусного расстояния в качестве функции расстояния между объектами. Последним рассматриваемым подходом является кластеризация с помощью алгоритма k-medoids и коэффициента ранговой корреляции Кендалла в качестве функции расстояния. Для оценки качества кластеризации мы использовали Adjusted Rand Index и определили, что кластеризация с использованием всех трех подходов дает стабильный результат даже в тех случаях, когда количество элементов в кластеризуемых множествах существенно различается. В случаях, когда доля ранжированных элементов мала, наилучшие результаты показывает метод векторизации частично упорядоченных множеств.

Об авторе

А. А. Раскин
Национальный исследовательский ядерный университет «МИФИ»
Россия


Список литературы

1. A. Ukkonen. Clustering algorithms for chains. Journal of Machine Learning Research, 12:1389-1423, 2011.

2. L. Kaufman, P. Rousseeuw. Clustering by means of medoids. In Dodge, Y. (Ed.) Statistical Data Analysis based on the L1 Norm. Elsevier/North Holland, Amsterdam, 1987, pp. 405-416.

3. V.I. Levenshein. Binary Codes Capable of Correcting Deletions, Insertions and Reversals. Soviet Physics Doklady. Vol. 10, No. 8, 1966, pp. 707-710

4. T. Kamishima, J. Fujiki. Clustering orders. Proceedings of the 6th International Conference on Discovery Science, 2003, pp.194-207

5. M. Kendall, J.D. Gibbons. Rank Correlation Methods. A Charles Griffin Title, 1990. 272 p.

6. W.M. Rand. Objective criteria for the evaluation of clustering methods. Journal of the American Statistical association. Vol. 66, No. 336, 1971, pp. 846-850

7. L. Hubert, A. Phipps. Comparing partitions. Journal of Classification. Vol. 2, No. 1, pp.193-218


Для цитирования:


Раскин А.А. Сравнение методик кластеризации частично упорядоченных множеств. Труды Института системного программирования РАН. 2014;26(4):91-98. https://doi.org/10.15514/ISPRAS-2014-26(4)-7

For citation:


Raskin A. Comparison of partial orders clustering techniques. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2014;26(4):91-98. (In Russ.) https://doi.org/10.15514/ISPRAS-2014-26(4)-7

Просмотров: 53


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)