Деанонимизация Reddit-профилей ИИ: за $4 взломали приватность 90 млн пользователей
-

Исследователи показали, как ИИ деанонимизирует анонимные профили на Reddit. За $4 на вычисления модель раскрывает реальные личности пользователей с точностью до 90%.Это меняет правила приватности в соцсетях.
Технология использует большие языковые модели для анализа комментариев и стиля письма. Пользователи думали, что псевдонимы надежны, но теперь даже редкие упоминания выдают личность. Такие методы помогут понять риски и меры защиты данных.## Как ИИ деанонимизирует Reddit-профили
Исследователи собрали данные из сабреддитов вроде r/movies и других тематических сообществ. Модель анализирует комментарии о фильмах, предпочтения и стиль текста, сопоставляя их с открытыми профилями на LinkedIn или Hacker News.Чем больше постов оставил пользователь, тем проще идентификация. Например, те, кто обсуждал 10+ фильмов, раскрывались в 48% случаев с точностью 90% и в 17% - с 99%.Это работает даже если аккаунты разные или активность распределена по времени.
Процесс начинается с извлечения косвенных данных: упоминания образования, шутки, особенности письма. Затем ИИ создает векторные эмбеддинги - математические отпечатки текста - и ищет совпадения в пуле кандидатов.На финальном шаге модель рассуждает и выбирает лучшее совпадение. Точность держится высокой даже на миллионах профилей, а стоимость - всего $1-4 за успешный случай.- Этап 1: Анализ текста - ИИ парсит комментарии, выделяя микроидентификаторы вроде предпочтений в кино или хобби.
- Этап 2: Поиск кандидатов - Через эмбеддинги формирует топ-100 похожих профилей из открытых источников.
-
Этап 3: Решение - Модель взвешивает доказательства и выдает результат с оценкой уверенности, избегая случайных догадок. Параметр Значение Примечание Recall 68% Доля успешно деанонимизированных пользователей Precision 90% Точность верных совпадений Стоимость $1-4 За один аккаунт на вычисления Масштаб 90 млн Экстраполяция на Reddit
Эксперименты и реальные кейсы
В одном тесте взяли 338 профилей Hacker News с ссылками на LinkedIn, удалили идентификаторы. ИИ восстановил 67% совпадений с precision 90%.На Reddit модель сопоставляла комментарии из разных сабреддитов, даже если пользователь менял аккаунты.Другой датасет - старые данные Netflix с предпочтениями, где ИИ вычислил личности по рекомендациям.
Классические методы требовали ручной работы и больших ресурсов, но LLM справляются автоматически и дешевле.Авторы экстраполировали: на 100 млн пользователей атака возможна при доступе к API.Это касается не только Reddit - LinkedIn, Hacker News тоже уязвимы. Важно: даже неактивные старые посты выдают пользователя.- Reddit r/movies - Идентификация по обсуждениям 10+ фильмов: 90% точность в 48% случаев.- Hacker News + LinkedIn - 67% recall, 90% precision на 338 профилях.- Netflix данные - Сопоставление по микроидентификаторам предпочтений.- Кросс-платформенный - Связь анонимных постов с реальными профилями через стиль.## Меры защиты от деанонимизации
Платформы могут ограничить скорость API-запросов и мониторить скрапинг данных.Поставщики LLM - встроить защиту, блокирующую использование для идентификации. Регулярное удаление старых постов снижает риски.Пользователям стоит распределять активность, избегать уникальных деталей в текстах.
Исследователи подчеркивают: псевдонимы больше не гарантия.Ключ: автоматизация делает атаки массовыми и дешевыми. Для криптохолдеров это угроза - раскрытие данных ведет к хакерским атакам.Платформы должны обновить политики приватности.
Мера Описание Эффективность Ограничение API Блокировка массовых запросов Высокая Мониторинг скрапинга Автоматическое обнаружение Средняя Удаление старых постов Снижение данных для анализа Высокая Защита в LLM Встроенные ограничения Перспективная Угрозы приватности в эпоху LLM
Масштаб поражает: 90 млн Reddit-профилей под угрозой за копейки. ИИ превосходит ручные методы по скорости и охвату.Остается вопрос - как балансировать открытость форумов и защиту. Дальше эволюция приведет к новым атакам, но и к лучшим защитам. Стоит следить за обновлениями в LLM и политиках платформ.
Здравствуйте! Похоже, вас заинтересовала эта беседа, но у вас ещё нет аккаунта.
Надоело каждый раз пролистывать одни и те же посты? Зарегистрировав аккаунт, вы всегда будете возвращаться на ту же страницу, где были раньше, и сможете выбирать, получать ли уведомления о новых ответах (по электронной почте или в виде push-уведомлений). Вы также сможете сохранять закладки и ставить лайки постам, чтобы выразить свою благодарность другим участникам сообщества.
С вашими комментариями этот пост мог бы стать ещё лучше 💗
Зарегистрироваться Войти© 2024 - 2026 ExLends, Inc. Все права защищены.