Интеллектуальная система анализа профиля пользователя на основе машинного обучения
Введение 4
Глава 1. Анализ развития интеллектуальных систем машинного обучения
и обзор методов для поиска отклонений в поведении пользователей 7
1.1 Существующие системы анализа данных пользователей 7
1.2 Анализ методов поиска отклонений в поведении пользователей
по наборам текстовых данных 13
1.3 Нормализация данных в задачах поиска аномального
поведения пользователей 15
Глава 2. Формирование модели представления поведения
пользователя 17
2.1 Обработка текстовых данных и их очистка от информационного шума 17
2.2 Определение длины анализируемой строки 19
2.3 Частотные модели векторного представления 21
2.3.1 Модель «мешок слов» 21
2.3.2 Модель «TF-IDF» 23
2.4 Нейросетевые модели векторного представления 23
2.4.1 Модель представления Word2Vec 23
2.4.2 Модель распределенного представления слов GloVe 24
2.4.3 Модель представления BERT 25
Глава 3. Метод идентификации необычного использования
мобильных устройств пользователями 27
3.1 Определение временных диапазонов выборки 27
3.2 Сравнение векторных представлений 30
3.3 Экспериментальное исследования метода идентификации
нетиповых сценариев использования устройства 35
Глава 4. Реализация программного комплекса сбора и анализа текстовых
данных 37
4.1 Описание сценариев использования 37
4.1.1 Установка и первичная настройка мобильного приложения агента 38
4.1.2 Использование мобильного устройства с установленным агентом
и сбор поведенческих данных 43
4.1.3 Использование Web интерфейса для управления
устройствами пользователей и сбора данных 44
4.1.4 Использование Web интерфейса для анализа отклонений в
поведении пользователя 46
4.2 Программная реализация 48
4.2.1 Проектирование архитектуры программного комплекса 48
4.2.2 Мобильный агент сбора поведенческой информации 50
4.2.3 Модуль поведенческого анализа 52
4.2.4 Серверные модули обработки информации 53
4.3 Экспериментальная проверка показателей производительности 54
4.3.1 Показатели производительности мобильного приложения - агента 55
4.3.2 Показатели производительности разработанного метода
поиска аномального поведения 58
Заключение 61
Список использованной литературы 63
...