Статья
DOI:
Полный текст:
Проектирование рецептур резиновых смесей сопряжено с высокой комбинаторной сложностью, где даже незначительные вариации состава влияют на свойства конечного продукта. Существующие информационные системы не предлагают оптимизированных решений для точного поиска близких аналогов, что создает значительный пробел на стыке материаловедения и компьютерных наук. В статье осуществляется разработка и сравнительный анализ специализированных методов и метрик для оценки сходства рецептур резиновых смесей, направленных на эффективную идентификацию ближайших аналогов в базах данных с учетом как качественного состава, так и количественных пропорций ингредиентов. В работе формализована задача поиска и ранжирования рецептур-аналогов. Проведено исследование эффективности четырех метрик сходства, адаптированных для работы с композиционными данными: взвешенный коэффициент Жаккара, взвешенный коэффициент Дайса, сходство Хеллингера и косинусное сходство. Экспериментальная проверка выполнена на базе данных 6096 промышленных рецептур. Корреляционный анализ выявил два кластера метрик: функционально эквивалентные коэффициенты Жаккара и Дайса (r = 0,991), чувствительные к полному совпадению компонентов, и комплементарные сходство Хеллингера и косинусное сходство (r = 0,883), ориентированные на пропорциональные соотношения, в том числе минорных ингредиентов. Практически все междометрические корреляции оказались статистически высоко значимыми (p < 0,0001), что подтверждает надежность оценки сходства. Установлена функциональная эквивалентность метрик Жаккара и Дайса, позволяющая оптимизировать вычисления. Для многомерного анализа рекомендовано комбинированное применение одной метрики из кластера «Жаккар-Дайс» (для анализа компонентного состава) и одной из кластера «Хеллингер-Косинус» (для анализа пропорций). Разработанный подход предоставляет практический инструментарий для селекции технологически релевантных аналогов в прикладном материаловедении.
Каблов В. Ф., Рыбанов А. А., Кейбал Н. А. Автоматизированный банк данных нового поколения рецептур и свойств резин «Раббер С». Каучук и резина, 2024, т. 83, № 3, с. 168–173. ; EDN: SORVFN
Каблов В. Ф., Рыбанов А. А., Кейбал Н. А., Маслова М. А., Крюкова Д. А. База данных рецептур, ингредиентов и свойств резиновых смесей с учетом технических синонимов: свидетельство о государственной регистрации программы для ЭВМ № 2025621312: зарегистрировано 24.03.2025 г.; правообладатель ФГАОУ ВО НГУ. 2025. EDN: WXUGOM
Каблов В. Ф., Рыбанов А. А., Маслова М. А. Эволюция информационных систем управления рецептурами резиновых смесей: от баз данных к интеллектуальным хранилищам с интеграцией модулей искусственного интеллекта. Каучук и резина – 2025: Традиции и новации: материалы XIII Всероссийской конференции. Москва: КиР, 2025. c. 23–24. EDN: LWBVSC
Кузнецов Л. А. Универсальная технология оценки близости информационных объектов. Информатика и ее применения, 2014, т. 8, № 2, с. 130–144. ; EDN: SFRWOX
Матвеев Н. А., Моргунов А. П. Автоматизация расчета рецептуры резиновой смеси при помощи программного обеспечения. Омский научный вестник, 2016, № 5 (149), с. 55–58. EDN: WXHOZX
Нигматуллин В. Р., Руднев Н. А. Использование методов машинного обучения и искусственного интеллекта в химической технологии. Часть I. Нефтегазовое дело, 2019, № 4, с. 243–268. ; EDN: VKEFMX
Порошкина В. В. Меры подобия в рекомендательных системах. Аллея науки, 2019, т. 1, № 4 (31), с. 909–913. EDN: PPYPZV
Рыбанов А. А., Каблов В. Ф. Применение алгоритмов поиска ассоциативных правил для определения технологически значимых сочетаний компонентов в рецептурах резиновых смесей. Информационные и математические технологии в науке и управлении, 2025, № 3 (39), с. 177–188. ; EDN: CMFFPD
Тихомиров С. Г., Маслов А. А., Карманова О. В., Хаустов И. А., Битюков В. К. Управление процессом вулканизации на основе моделирования и оценки ключевых параметров модели. Вестник ВГУ. Серия: Системный анализ и информационные технологии, 2024, № 4, с. 22–34. ; EDN: PNZDOI
Шашкин А. И., Стрюков Р. К. О модификации метода ближайших соседей. Вестник Воронежского государственного университета. Серия: Проблемы высшего образования, 2015, № 1, с. 114. EDN: TSZJUD
Chen F., Farahat A., Brants T. Multiple similarity measures and source-pair information in story link detection. Proceedings of the Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics (HLT–NAACL 2004). Boston, Massachusetts, 2004, рр. 313–320.
Rajan K. Data mining and multivariate analysis in materials science. Molten Salts: From Fundamentals to Applications, edited by M. Gaune-Escard. Dordrecht: Springer, 2002, рр. 89–102.
Sohangir S., Wang D. Improved sqrt-cosine similarity measurement. Journal of Big Data, 2017, vol. 4, no. 25, рр. 1–13.
Каблов В. Ф., Рыбанов А. А., Кейбал Н. А., Маслова М. А., Крюкова Д. А. База данных рецептур, ингредиентов и свойств резиновых смесей с учетом технических синонимов: свидетельство о государственной регистрации программы для ЭВМ № 2025621312: зарегистрировано 24.03.2025 г.; правообладатель ФГАОУ ВО НГУ. 2025. EDN: WXUGOM
Каблов В. Ф., Рыбанов А. А., Маслова М. А. Эволюция информационных систем управления рецептурами резиновых смесей: от баз данных к интеллектуальным хранилищам с интеграцией модулей искусственного интеллекта. Каучук и резина – 2025: Традиции и новации: материалы XIII Всероссийской конференции. Москва: КиР, 2025. c. 23–24. EDN: LWBVSC
Кузнецов Л. А. Универсальная технология оценки близости информационных объектов. Информатика и ее применения, 2014, т. 8, № 2, с. 130–144. ; EDN: SFRWOX
Матвеев Н. А., Моргунов А. П. Автоматизация расчета рецептуры резиновой смеси при помощи программного обеспечения. Омский научный вестник, 2016, № 5 (149), с. 55–58. EDN: WXHOZX
Нигматуллин В. Р., Руднев Н. А. Использование методов машинного обучения и искусственного интеллекта в химической технологии. Часть I. Нефтегазовое дело, 2019, № 4, с. 243–268. ; EDN: VKEFMX
Порошкина В. В. Меры подобия в рекомендательных системах. Аллея науки, 2019, т. 1, № 4 (31), с. 909–913. EDN: PPYPZV
Рыбанов А. А., Каблов В. Ф. Применение алгоритмов поиска ассоциативных правил для определения технологически значимых сочетаний компонентов в рецептурах резиновых смесей. Информационные и математические технологии в науке и управлении, 2025, № 3 (39), с. 177–188. ; EDN: CMFFPD
Тихомиров С. Г., Маслов А. А., Карманова О. В., Хаустов И. А., Битюков В. К. Управление процессом вулканизации на основе моделирования и оценки ключевых параметров модели. Вестник ВГУ. Серия: Системный анализ и информационные технологии, 2024, № 4, с. 22–34. ; EDN: PNZDOI
Шашкин А. И., Стрюков Р. К. О модификации метода ближайших соседей. Вестник Воронежского государственного университета. Серия: Проблемы высшего образования, 2015, № 1, с. 114. EDN: TSZJUD
Chen F., Farahat A., Brants T. Multiple similarity measures and source-pair information in story link detection. Proceedings of the Human Language Technology Conference of the North American Chapter of the Association for Computational Linguistics (HLT–NAACL 2004). Boston, Massachusetts, 2004, рр. 313–320.
Rajan K. Data mining and multivariate analysis in materials science. Molten Salts: From Fundamentals to Applications, edited by M. Gaune-Escard. Dordrecht: Springer, 2002, рр. 89–102.
Sohangir S., Wang D. Improved sqrt-cosine similarity measurement. Journal of Big Data, 2017, vol. 4, no. 25, рр. 1–13.
Ключевые слова:
рецептуры резиновых смесей, поиск аналогов, метрики сходства, взвешенный коэффициент Жаккара, коэффициент Дайса, сходство Хеллингера, косинусное сходство, композиционные данные, база данных, материаловедение
Для цитирования:
Рыбанов А. А., Каблов В. Ф. Метрический анализ сходства рецептур резиновых смесей для задач нечеткого информационного поиска релевантных составов. Вестник Череповецкого государственного университета, 2026, № 3 (132), с. 69–86. https://doi.org/10.23859/1994-0637-2026-3-132-6; EDN: ZJLJVX
Контент доступен под лицензией Creative Commons Attribution 4.0 License.