Вычислительная сложность двух задач когнитивного анализа данных
Вычислительная сложность двух задач когнитивного анализа данных
Аннотация:
Доказана NP-трудность в сильном смысле двух задач когнитивного анализа данных: задачи таксономии (кластеризации) — разбиения неклассифицированной выборки объектов на непересекающиеся подмножества — и задачи выбора подмножества типичных представителей классифицированной выборки, состоящей из объектов двух образов. Первую задачу можно рассматривать как частный случай второй задачи при условии, что один из образов состоит из одного объекта. Для количественной оценки качества множества выбранных типичных представителей выборки используется функция конкурентного сходства (FRiS-функция), с помощью которой оценивается сходство объекта с ближайшим типичным объектом.
Ил. 1, библиогр. 18.
Литература:
- Zagoruiko N. G., Borisova I. A., Dyubanov V. V., Kutnenko O. A. Methods of recognition based on the function of rival similarity // Pattern Recognit. Image Anal. 2008. V. 18, No. 1. P. 1–6.
- Борисова И. А., Дюбанов В. В., Загоруйко Н. Г., Кутненко О. А. Сходство и компактность // Докл. 14-й Всерос. конф. «Математические методы распознавания образов» (Суздаль, Россия, 21–25 сентября 2009 г.). М.: Макс Пресс, 2009. С. 89–92.
- Burges C. J. C. A tutorial on support vector machines for pattern recognition // Data Mining Knowl. Discov. 1998. V. 2, No. 2. P. 121–167.
- Tipping M. E. The relevance vector machine // Advances in Neural Information Processing Systems 12. Proc. 1999 Conf. (Denver, CO, USA, Nov. 29–Dec. 4, 1999). Cambridge, MA: MIT Press, 2000. P. 652–658.
- Загоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск: Изд-во Ин-та математики 1999. 268 с.
- Воронцов К. В., Колосков А. О. Профили компактности и выделение опорных объектов в метрических алгоритмах классификации // Искусств. интеллект. 2006. № 2. С. 30–33.
- Иванов М. Н., Воронцов К. В. Отбор эталонов, основанный на минимизации функционала полного скользящего контроля // Докл. 14-й Всерос. конф. «Математические методы распознавания образов» (Суздаль, Россия, 21–25 сентября 2009 г.). М.: Макс Пресс, 2009. С. 119–122.
- Bermejo S., Cabestany J. Learning with nearest neighbor classifiers // Neural Proc. Lett. 2001. V. 13, No. 2. P. 159–181.
- Вапник В. Н. Задача обучения распознаванию образов. М.: Знание, 1971. 60 с.
- Загоруйко Н. Г., Борисова И. А., Дюбанов В. В., Кутненко О. А. Количественная мера компактности и сходства в конкурентном пространстве // Сиб. журн. индустр. математики. 2010. Т. 13, № 1. С. 59–71.
- Борисова И. А. Алгоритм таксономии FRiS-Tax // Науч. вестн. НГТУ. 2007. № 3. С. 3–12.
- Борисова И. А., Загоруйко Н. Г. Алгоритм FRiS-TDR для решения обобщённой задачи таксономии и распознавания // Матер. 2-й Всерос. конф. «Знания—Онтологии— Теории» (Новосибирск, Россия, 20–22 октября 2009 г.). Т. 1. Новосибирск: ИМ СО РАН, 2009. С. 93–102.
- MacQueen J. B. Some methods for classification and analysis of multivariate observations // Proc. 5th Berkeley Symp. Math. Stat. Probab. (Berkeley, USA, June 21–July 18, 1965; Dec. 27, 1965–Jan. 7, 1966) V. 1. Berkeley: Univ. California Press, 1967. P. 281–297.
- Zukhba A. V. NP-completeness of the problem of prototype selection in the nearest neighbor method // Pattern Recognit. Image Anal. 2010. V. 20, No. 4. P. 484–494.
- Borisova I. A., Dyubanov V. V., Kutnenko O. A., Zagoruiko N. G. Use of the FRiS-function for taxonomy, attribute selection and decision rule construction // Knowledge Processing and Data Analysis. Rev. Sel. Pap. 1st Int. Conf. KONT 2007 (Novosibirsk, Russia, Sept. 14–16, 2007); 1st Int. Conf. KPP 2007 (Darmstadt, Germany, Sept. 28–30, 2007). Heidelberg: Springer, 2011. P. 256–270. (Lect. Notes Comput. Sci.; V. 6581).
- Загоруйко Н. Г., Борисова И. А., Кутненко О. А., Дюбанов В. В. Построение сжатого описания данных с использованием функции конкурентного сходства // Сиб. журн. индустр. математики. 2013. Т. 16, № 1. С. 29–41.
- Борисова И. А. Вычислительная сложность задачи выбора типичных представителей в 2-разбиении конечного множества точек метрического пространства // Дискрет. анализ и исслед. операций. 2020. Т. 27, № 2. С. 5–16.
- Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые задачи. М.: Мир, 1982. 416 с.
Исследование выполнено в рамках государственного задания ИМ СО РАН (проект № FWNF–2022–0015).
Кутненко Ольга Андреевна
- Институт математики им. С. Л. Соболева,
пр. Коптюга, 4, 630090 Новосибирск, Россия - Новосибирский гос. университет,
ул. Пирогова, 2, 630090 Новосибирск, Россия
E-mail: olga@math.nsc.ru
Статья поступила 26 апреля 2021 г.
После доработки — 2 декабря 2021 г.
Принята к публикации 3 декабря 2021 г.
Abstract:
The NP-hardness in the strong sense is proved for two problems of cognitive data analysis. One of them is the problem of taxonomy (clustering), i. e. splitting an unclassified sample of objects into disjoint subsets. The other is the problem of sampling a subset of typical representatives of a classified sample which consists of objects of two images. The first problem can be considered as a special case of the second problem, provided that one of the images consists of one object. To obtain a quantitative quality estimate for the set of selected typical representatives of the sample, the function of rival similarity (FRiS function) is used, which assesses the similarity of an object with the closest typical object.
Illustr. 1, bibliogr. 18.
References:
- N. G. Zagoruiko, I. A. Borisova, V. V. Dyubanov, and O. A. Kutnenko, Methods of recognition based on the function of rival similarity, Pattern Recognit. Image Anal. 18 (1), 1–6 (2008).
- I. A. Borisova, V. V. Dyubanov, N. G. Zagoruiko, and O. A. Kutnenko, Similarity and compactness, in Proc. 14th All-Russian Conf. “Mathematical Methods for Pattern Recognition”, Suzdal, Russia, Sept. 21–25, 2009 (Maks Press, Moscow, 2009), pp. 89–92 [Russian].
- C. J. C. Burges, A tutorial on support vector machines for pattern recognition, Data Mining Knowl. Discov. 2 (2), 121–167 (1998).
- M. E. Tipping, The relevance vector machine, in Advances in Neural Information Processing Systems 12 (Proc. 1999 Conf., Denver, CO, USA, Nov. 29–Dec. 4, 1999) (MIT Press, Cambridge, MA, 2000), pp. 652–658.
- N. G. Zagoruiko, Applied Methods of Data and Knowledge Analysis (Izd. Inst. Mat., Novosibirsk, 1999) [Russian].
- K. V. Vorontsov and A. O. Koloskov, Compactness profiles and prototype object selection in metric classification algorithms, Iskusstv. Intell., No. 2, 30–33
(2006) [Russian].
- M. N. Ivanov and K. V. Vorontsov, Prototypes selection based on minimization of a complete follow-control functional, in Proc. 14th All-Russian Conf. “Mathematical Methods for Pattern Recognition”, Suzdal, Russia, Sept. 21–25, 2009 (Maks Press, Moscow, 2009), pp. 119-–122 [Russian].
- S. Bermejo and J. Cabestany, Learning with nearest neighbor classifiers, Neural Proc. Lett. 13 (2), 159-–181 (2001).
- V. N. Vapnik, The Task of Learning Pattern Recognition (Znanie, Moscow, 1971) [Russian].
- N. G. Zagoruiko, I. A. Borisova, V. V. Dyubanov, and O. A. Kutnenko, A quantitative measure of compactness and similarity in a competitive space, Sib. J. Ind. Math. 13 (1), 59–71 (2010) [Russian] [J. Appl. Ind. Math. 5 (1), 144–154 (2011)].
- I. A. Borisova, A taxonomy algorithm FRiS-Tax, Nauchn. Vestn. NGTU, No. 3, 3–12 (2007) [Russian].
- I. A. Borisova and N. G. Zagoruiko, A FRiS-TDR algorithm for solving a generalized taxonomy and recognition problem, in Proc. 2nd All-Russian Conf. “Knowledge–Ontology–Theory”, Novosibirsk, Russia, Oct. 22–24, 2009, Vol. 1 (Inst. Mat., Novosibirsk, 2009), pp. 93–102 [Russian].
- J. B. MacQueen, Some methods for classification and analysis of multivariate observations, in Proc. 5th Berkley Symp. Math. Stat. Prob., Berkley, USA, June 21–July 18, 1965; Dec. 27, 1965–Jan. 7, 1966, Vol. 1 (Univ. California Press, Berkley, 1967), pp. 281—297.
- A. V. Zukhba, NP-completeness of the problem of prototype selection in the nearest neighbor method, Pattern Recognit. Image Anal. 20 (4), 484–494 (2010).
- I. A. Borisova, V. V. Dyubanov, O. A. Kutnenko, and N. G. Zagoruiko, Use of the FRiS-function for taxonomy, attribute selection and decision rule construction, in Knowledge Processing and Data Analysis (Rev. Sel. Pap. 1st Int. Conf. KONT 2007, Novosibirsk, Russia, Sept. 14–16, 2007; 1st Int. Conf. KPP 2007, Darmstadt, Germany, Sept. 28–30, 2007) (Springer, Heidelberg, 2011), pp. 256–270 (Lect. Notes Comput. Sci., Vol. 6581).
- N. G. Zagoruiko, I. A. Borisova, O. A. Kutnenko, and V. V. Dyubanov, A construction of a compressed description of data using a function of rival similarity, Sib. J. Ind. Math. 16 (1), 29–41 (2013) [Russian] [J. Appl. Ind. Math. 7 (2), 275–286 (2013)].
- I. A. Borisova, Computational complexity of the problem of choosing typical representatives in a 2-clustering of a finite set of points in a metric space, Discrete Anal. Oper. Res. 27 (2), 5–16 (2020) [Russian] [J. Appl. Ind. Math. 14 (2), 242–248 (2020)].
- M. R. Garey and D. S. Johnson, Computers and Intractability: A Guide to the Theory of NP-Completeness (Freeman, San Francisco, 1979; Mir, Moscow, 1982 [Russian]).