Журнал «Цифровые решения и технологии искусственного интеллекта» посвящен современным достижениям и исследованиям в области информационных технологий и искусственного интеллекта. Является междисциплинарной платформой, посвященной публикации оригинальных исследований и обзоров в области искусственного интеллекта и цифровых технологий. В журнале рассматриваются актуальные вопросы и разработки в следующих ключевых разделах:
- Искусственный интеллект и машинное обучение: исследуются теоретические и практические аспекты искусственного интеллекта, включая алгоритмы машинного обучения, их применения в различных сферах, таких как здравоохранение, финансы и инженерия.
- Математическое моделирование, численные методы и комплексы программ: акцент на разработке новых методов математического моделирования и численных подходов для решения инженерных и научных задач.
- Методы и системы защиты информации, информационная безопасность: исследования в области криптографических методов и систем защиты данных в условиях современных угроз.
- Математические, статистические и инструментальные методы в экономике: публикации, касающиеся применения количественных методов для анализа экономических явлений и оптимизации бизнес-процессов.
Статьи проходят строгий процесс рецензирования, что гарантирует высокое качество публикуемых материалов. Журнал ориентирован на исследователей, аспирантов и профессионалов из различных областей, стремящихся оставаться в курсе последних достижений в области искусственного интеллекта и цифровых технологий.
Текущий выпуск
ТЕМА НОМЕРА: Искусственный интеллект и машинное обучение
Прогнозирование ожидаемой продолжительности жизни связано не только с серьезными социальными и финансовыми факторами, но и с состоянием общественного здравоохранения и экономики, а также с состоянием окружающей среды. Использование математических методов позволяет выделить наиболее информативные показатели, влияющие на продолжительность жизни. Целью работы является прогнозирование ожидаемой продолжительности жизни по данным Всемирного банка* методами машинного обучения (МО), а также сравнение эффективности прогнозирования ожидаемой продолжительности жизни с использованием различных алгоритмов машинного обучения, включая такие широко распространенные методы, как метод опорных векторов, дерево решений, случайный лес, линейный дискриминант Фишера, нейронные сети, два варианта градиентного бустинга, логистическую регрессию и метод статистически взвешенных синдромов. База данных включила данные для 238 стран. Применены стандартные непараметрические критерии хи-квадрат (χ²) и критерий Манна-Уиттни (U-тест). Выявлены 11 значимых показателей.
Использованы методы машинного обучения (МО) системы анализа данных Data Master Azforus. Результат прогнозирования методом статистически взвешенных синдромов (СВС) достиг значения ROC, AUC = 0,986. Представлены одномерные и двумерные диаграммы взаимосвязи исследуемых социально-экономических и медицинских показателей на ожидаемую продолжительность жизни. Из этих диаграмм можно получать прогноз для изменения отдельных показателей с целью улучшения качества и продолжительности жизни. Таким образом, система анализа данных Data Master Azforus (САД ДМА) позволит исследователям создавать рекомендательные системы по прогнозированию ожидаемой продолжительности жизни. Кроме того, проведенное исследование поможет создать более совершенную систему прогнозирования с использованием моделей машинного обучения, которые могут служить руководством для политиков при улучшении прогнозирования ожидаемой продолжительности жизни.
В работе рассматривается токенизация как ключевой этап обработки текстовых данных, особенно в финансовой сфере. Анализируются современные методы токенизации с примерами из последних исследований и их влияние на эффективность NLP-моделей. Исследование показывает, что алгоритмы токенизации по словам (BPE, WordPiece, Unigram) стали стандартом для языковых моделей благодаря гибкости и эффективности сжатия текста. Обсуждаются ограничения длины входной последовательности в языковых моделях (BPE и WordPiece демонстрируют склонность к избыточному разбиению, Unigram требует сложного обучения, а символьная токенизация создает чрезмерно длинные последовательности) и методы преодоления этих ограничений, включая разбиение текста на части, иерархическую обработку и экстраполяцию предобученных моделей с архитектурой трансформеров для работы с длинными входными данными. Для финансовых данных рекомендуется использование доменно-ориентированных токенизаторов или дообучение на специализированных системах, что подтверждается успешным опытом BloombergGPT. Особое внимание уделяется проблеме обработки длинных текстов. Предложены три подхода к решению: разделение текста на части; иерархическая обработка; экстраполяция моделей-трансформеров. В заключение подчеркивается значимость токенизации для финансовой аналитики, где качество обработки текста напрямую влияет на принятие решений. Развитие методов токенизации продолжается параллельно с совершенствованием NLP-моделей, что делает этот этап обработки текста критически важным компонентом современных аналитических систем.
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ, ЧИСЛЕНЫЕ МЕТОДЫ И КОМПЛЕКСЫ ПРОГРАММ
В статье рассматриваются современные подходы к моделированию сетевых систем и в целом сетей с динамической природой. В работе представлен современный класс динамических графов с описанием их практических применений. В качестве процедуры изменения динамического графа представлены базовые или простые операции, среди которых удаление или добавление вершин и ребер. Выделен специальный подкласс предфрактальных графов со свойствами самоподобия. Для класса динамических графов определено понятие траектории, представленное последовательностью классических графов, меняющихся от одного к другому во времени. Инструментарий динамических графов может стать основой для разработки алгоритмов командно-информационного взаимодействия подвижных абонентов в сетевых системах, в том числе сетевых системах непрерывного пространственного мониторинга. Для описания оптимизационных задач на многовзвешенных графах предложена формальная постановка многокритериальной задачи на предфрактальном графе. Описаны множества допустимых решений, парето-оптимальных и полных решений. Предложены некоторые леммы многокритериальной оптимизации для индивидуальных задач, которые обладают свойством полноты, а также ограничения линейной свертки критериев для поиска парето-оптимальных решений. Исследованы наследственные свойства, проявляющиеся в траекториях динамического графа,— а именно наследственность структурно-функциональных характеристик и, как следствие, наследственность решений при переходе от одного графа к другому в траектории динамического графа. Настоящая работа вносит свой вклад в развитие сетевой науки и теорию динамических сетей, предлагая как подходы, так и частные решения на общих и специальных классах графов.
В статье представлена методика прогнозирования успешности проектных инициатив на основе анализа структурных характеристик коммуникационных сетей проектных команд. Исследование базируется на данных из систем трекинга задач (Jira, Trello), отражающих формальные взаимодействия участников проекта.
Методология исследования включает комплекс аналитических инструментов: корреляционный анализ с применением коэффициентов Спирмена и Пирсона, регрессионное моделирование на основе алгоритма Random Forest, а также методы обнаружения аномалий с использованием Isolation Forest. Исследование показало статистически значимые взаимосвязи между ключевыми сетевыми метриками (betweenness centrality, плотность сети, диаметр графа) и показателями эффективности проектов (соблюдение сроков, бюджета, качество результатов). Выявлена статистически значимая отрицательная корреляция между избыточной централизацией и соблюдением сроков (ρ = — 0,72), а также положительная взаимосвязь между плотностью сети и качеством результатов (r = 0,68).
Разработанная модель на основе Random Forest демонстрирует точность прогнозирования успешности проектов на уровне 84%. Установлено, что избыточная централизация коммуникаций снижает вероятность успешной реализации проекта, тогда как оптимальная плотность коммуникационной сети способствует достижению проектных KPI.
Практическая значимость исследования заключается в возможности раннего выявления рисков срыва проектов на основе объективных метрик коммуникационной активности. Разработанная методика, апробированная на данных IT-компании, позволяет не только прогнозировать риски, но и формировать рекомендации по оптимизации командных взаимодействий. Результаты исследования представляют интерес для проектных менеджеров, HR-аналитиков и специалистов по data-driven управлению.
МЕТОДЫ И СИСТЕМЫ ЗАЩИТЫ ИНФОРМАЦИИ, ИНФОРМАЦИОННАЯ БЕЗОПАСНОСТЬ
В статье рассматриваются актуальные проблемы обеспечения кибербезопасности цифрового рубля в условиях растущих угроз цифрового пространства.
Актуальность исследования определяется следующими факторами: необходимостью разработки новой концепции кибербезопасности цифрового рубля; увеличением числа компьютерных атак на кредитно-финансовую сферу; ростом деструктивного информационного воздействия на финансовые организации; потребностью в выявлении и предупреждении киберугроз; важностью защиты от хакерских атак, вирусов и мошенничества; необходимостью оптимизации процессов и повышения качества финансовых платежей.
Цель исследования — разработка технического решения по обеспечению кибербезопасности инфраструктуры цифрового рубля. В ходе исследования решены следующие задачи: уточнены понятия «инфраструктура доверия» и «кибербезопасность»; проанализированы средства киберпространства в контексте защиты цифрового рубля; разработаны предложения по повышению кибербезопасности инфраструктуры доверия.
Практическая значимость работы заключается в возможности применения предложенных решений для укрепления системы защиты цифрового рубля.
Начало двухтысячных годов показало истинное лицо производителей гигантов цифровой индустрии. Существенные изменения протокольной системы, файловой системы, системы передачи данных и т.д. внесли в общую концепцию информационной безопасности принципиально новое направление — обеспечение конфиденциальности данных изнутри. Данное направление вполне актуально и в настоящее время. Лавинно нарастающее количество недекларируемых функций вызывает объективное опасение наступления различных цифровых рисков во всех без исключения государствах, даже в том, где располагаются основные офисы GAFAM. В данной статье не предполагается рассмотрение обхода запрета с использованием VPN-каналов (официально разрешенных ФСБ России с использованием лицензированных ресурсов популярных провайдеров), но будет представлен алгоритм, описывающий одну из причин, побудивших государство ввести запрет на использование глобальных обменников графической информации. Примеров таких алгоритмов достаточно много, и, как следствие, решение, принятое своевременно РКН, со точки зрения защиты цифрового суверенитета нашего государства обоснованно. В доказательство предлагается ряд статей, посвященных скрытым функциям информационных систем и технологий. Начальный этап будет посвящен файловой системе как для стационарных, так и для мобильных систем. Старт с самых простых возможностей, пропускаемых даже современными системами защиты данных. Статьи несут исключительно образовательные и предупредительные цели для действующих специалистов и не предполагают инструкции к исполнению для нанесения вреда организациям.
В условиях цифровой трансформации ИИ становится ключевым фактором повышения боевой эффективности и обеспечения устойчивого развития Вооруженных Сил Российской Федерации. Статья посвящена анализу организационных аспектов применения искусственного интеллекта в сфере обороны Российской Федерации в условиях необходимости поиска новых путей укрепления национальной безопасности и обороноспособности.
Цель статьи — проанализировать текущие проблемы внедрения искусственного интеллекта в организационные процессы оборонной деятельности России и предложить практические пути их решения.
Методы. В исследовании применялись методы системного анализа, сравнительного анализа и структурно-функционального подхода, позволившие изучить особенности интеграции искусственного интеллекта в организационно-управленческие процессы Вооруженных Сил России. Выбор методов исследования обусловлен их взаимодополняющими возможностями и позволяет всесторонне раскрыть процессы интеграции искусственного интеллекта в сферу обороны.
Проблематика. В работе идентифицированы ключевые проблемы внедрения искусственного интеллекта в сфере обороны: технологические (ограничения искусственного интеллекта, интеграция в существующие системы); ресурсные (финансовая и инфраструктурная недостаточность); кадровые (дефицит специалистов); институциональные (нормативно-правовые и этические вопросы), организационные (недостаток межведомственной координации).
Результаты. Автором предложены конкретные организационно-управленческие меры, направленные на преодоление этих препятствий и эффективную интеграцию новых технологий. В статье впервые комплексно рассмотрены организационно-управленческие вопросы интеграции искусственного интеллекта в контексте Вооруженных сил Российской Федерации с учетом современных вызовов и национальных особенностей. Выявлены актуальные проблемы внедрения искусственного интеллекта в процессы оборонного управления, такие как технологические, кадровые и нормативные барьеры.
Выводы. Для эффективного внедрения искусственного интеллекта в сферу обороны необходимо решение выявленных управленческих проблем посредством разработки соответствующей нормативной базы, совершенствования системы подготовки кадров, укрепления межведомственного взаимодействия, адаптации существующих управленческих практик к новым технологическим реалиям. Кроме того, выявлена необходимость внедрения пилотных проектов и поэтапной адаптации управленческих практик при условии постоянного мониторинга и оценки эффективности применяемых мер.
МАТЕМАТИЧЕСКИЕ, СТАТИСТИЧЕСКИЕ И ИНСТРУМЕНТАЛЬНЫЕ МЕТОДЫ В ЭКОНОМИКЕ
В условиях стремительного роста объема научных публикаций, увеличения междисциплинарных исследований и усиления конкуренции в академической среде особенно актуальными становятся задачи анализа и визуализации научной активности. Современные цифровые инструменты позволяют не только отслеживать публикационную динамику, но и выявлять ключевые исследовательские направления, а также устойчивые коллективы авторов, образующие научные сообщества. Одним из эффективных подходов в данной области является сочетание методов тематического моделирования и сетевого анализа на основе теории графов. Научные организации зачастую сталкиваются с проблемой отсутствия оперативной информации о внутренней структуре исследовательской деятельности: какие тематики наиболее активно развиваются, каковы связи между авторами и коллективами, кто выступает в роли «ядер» научных сообществ. Особенно это актуально для крупных вузов, где работают сотни исследователей, создающих значительное число научных работ. В такой ситуации ручной анализ становится невозможным, и на помощь приходят методы автоматизированной обработки текстов и графовой аналитики. Настоящая статья посвящена анализу публикационной активности авторов Финансового университета. Цель исследования заключается в выявлении тематик научных работ и выделении научных сообществ для понимания развития научно-исследовательской деятельности высших учебных заведений на примере Финансового университета. В исследовании представлен подход к формированию набора данных научных публикаций авторов Финансового университета. Проведены визуализация динамики публикаций и анализ ключевых слов, позволяющие выявить общие тренды. Для решения задачи кластеризации текстов и определения тематик публикаций применена модель BERTopic. Выявление научных сообществ реализовано посредством построения и анализа графа соавторства, что позволяет идентифицировать группы исследователей, активно сотрудничающих в рамках определенных научных направлений.
В статье представлено применение кластерного анализа — одного из наиболее распространенных методов машинного обучения — для исследования уровня развития регионального транспорта. Основное внимание уделяется сегментации регионов по существующему спросу на транспортные услуги; определению ключевых компонентов транспортной системы для различных регионов.
Цель исследования заключается в разделении регионов страны на кластеры, однородные по основным параметрам спроса на транспортные услуги. В каждом кластере объединяются регионы со схожими экономическими, географическими и хозяйственными характеристиками, что определяет схожесть в наиболее востребованных видах транспорта и объектах транспортной инфраструктуры.
Методология исследования основана на алгоритмах машинного обучения и применении математических метрик к статистическим данным. Исследование включает: отбор значимых факторов; анализ и нормализацию статистических данных; различные методы кластеризации. При нормализации данные приводятся к единой шкале от 0 до 100 баллов с исключением выбросов. В результате кластерного анализа регионы распределяются по четырем основным кластерам.
Техническая реализация различных вариантов кластерного анализа возможна в табличных редакторах и статистических пакетах. На основе результатов кластеризации проводится интерпретация каждого кластера и выявляются общие характеристики регионов внутри них.
Перспективы исследования включают его ежегодную актуализацию на основе обновляемых статистических данных. Результаты могут быть использованы для: анализа и развития транспортной системы страны; определения приоритетов в развитии транспортной инфраструктуры регионов; оценки значимости и необходимости реализации региональных транспортных проектов.