Перейти к содержанию
  • Лента
  • Категории
  • Последние
  • Метки
  • Популярные
  • Пользователи
  • Группы
Свернуть
exlends
Категории
  1. Главная
  2. Категории
  3. Искусственный Интеллект
  4. Деанонимизация Reddit-профилей ИИ: за $4 взломали приватность 90 млн пользователей

Деанонимизация Reddit-профилей ИИ: за $4 взломали приватность 90 млн пользователей

Запланировано Прикреплена Закрыта Перенесена Искусственный Интеллект
деанонимизацияии redditприватность
1 Сообщения 1 Постеры 1 Просмотры
  • Сначала старые
  • Сначала новые
  • По количеству голосов
Ответить
  • Ответить, создав новую тему
Авторизуйтесь, чтобы ответить
Эта тема была удалена. Только пользователи с правом управления темами могут её видеть.
  • kirilljsxK Не в сети
    kirilljsxK Не в сети
    kirilljsx
    js
    написал отредактировано
    #1

    Обложка: Deанонимизация Reddit-профилей ИИ: как за $4 взломали приватность 90 млн пользователей

    Исследователи показали, как ИИ деанонимизирует анонимные профили на Reddit. За $4 на вычисления модель раскрывает реальные личности пользователей с точностью до 90%.Это меняет правила приватности в соцсетях.

    Технология использует большие языковые модели для анализа комментариев и стиля письма. Пользователи думали, что псевдонимы надежны, но теперь даже редкие упоминания выдают личность. Такие методы помогут понять риски и меры защиты данных.## Как ИИ деанонимизирует Reddit-профили

    Исследователи собрали данные из сабреддитов вроде r/movies и других тематических сообществ. Модель анализирует комментарии о фильмах, предпочтения и стиль текста, сопоставляя их с открытыми профилями на LinkedIn или Hacker News.Чем больше постов оставил пользователь, тем проще идентификация. Например, те, кто обсуждал 10+ фильмов, раскрывались в 48% случаев с точностью 90% и в 17% - с 99%.Это работает даже если аккаунты разные или активность распределена по времени.

    Процесс начинается с извлечения косвенных данных: упоминания образования, шутки, особенности письма. Затем ИИ создает векторные эмбеддинги - математические отпечатки текста - и ищет совпадения в пуле кандидатов.На финальном шаге модель рассуждает и выбирает лучшее совпадение. Точность держится высокой даже на миллионах профилей, а стоимость - всего $1-4 за успешный случай.- Этап 1: Анализ текста - ИИ парсит комментарии, выделяя микроидентификаторы вроде предпочтений в кино или хобби.

    • Этап 2: Поиск кандидатов - Через эмбеддинги формирует топ-100 похожих профилей из открытых источников.
    • Этап 3: Решение - Модель взвешивает доказательства и выдает результат с оценкой уверенности, избегая случайных догадок. Параметр Значение Примечание
      Recall 68% Доля успешно деанонимизированных пользователей
      Precision 90% Точность верных совпадений
      Стоимость $1-4 За один аккаунт на вычисления
      Масштаб 90 млн Экстраполяция на Reddit

    Эксперименты и реальные кейсы

    В одном тесте взяли 338 профилей Hacker News с ссылками на LinkedIn, удалили идентификаторы. ИИ восстановил 67% совпадений с precision 90%.На Reddit модель сопоставляла комментарии из разных сабреддитов, даже если пользователь менял аккаунты.Другой датасет - старые данные Netflix с предпочтениями, где ИИ вычислил личности по рекомендациям.

    Классические методы требовали ручной работы и больших ресурсов, но LLM справляются автоматически и дешевле.Авторы экстраполировали: на 100 млн пользователей атака возможна при доступе к API.Это касается не только Reddit - LinkedIn, Hacker News тоже уязвимы. Важно: даже неактивные старые посты выдают пользователя.- Reddit r/movies - Идентификация по обсуждениям 10+ фильмов: 90% точность в 48% случаев.- Hacker News + LinkedIn - 67% recall, 90% precision на 338 профилях.- Netflix данные - Сопоставление по микроидентификаторам предпочтений.- Кросс-платформенный - Связь анонимных постов с реальными профилями через стиль.## Меры защиты от деанонимизации

    Платформы могут ограничить скорость API-запросов и мониторить скрапинг данных.Поставщики LLM - встроить защиту, блокирующую использование для идентификации. Регулярное удаление старых постов снижает риски.Пользователям стоит распределять активность, избегать уникальных деталей в текстах.

    Исследователи подчеркивают: псевдонимы больше не гарантия.Ключ: автоматизация делает атаки массовыми и дешевыми. Для криптохолдеров это угроза - раскрытие данных ведет к хакерским атакам.Платформы должны обновить политики приватности.

    Мера Описание Эффективность
    Ограничение API Блокировка массовых запросов Высокая
    Мониторинг скрапинга Автоматическое обнаружение Средняя
    Удаление старых постов Снижение данных для анализа Высокая
    Защита в LLM Встроенные ограничения Перспективная

    Угрозы приватности в эпоху LLM

    Масштаб поражает: 90 млн Reddit-профилей под угрозой за копейки. ИИ превосходит ручные методы по скорости и охвату.Остается вопрос - как балансировать открытость форумов и защиту. Дальше эволюция приведет к новым атакам, но и к лучшим защитам. Стоит следить за обновлениями в LLM и политиках платформ.

    1 ответ Последний ответ
    0

    Здравствуйте! Похоже, вас заинтересовала эта беседа, но у вас ещё нет аккаунта.

    Надоело каждый раз пролистывать одни и те же посты? Зарегистрировав аккаунт, вы всегда будете возвращаться на ту же страницу, где были раньше, и сможете выбирать, получать ли уведомления о новых ответах (по электронной почте или в виде push-уведомлений). Вы также сможете сохранять закладки и ставить лайки постам, чтобы выразить свою благодарность другим участникам сообщества.

    С вашими комментариями этот пост мог бы стать ещё лучше 💗

    Зарегистрироваться Войти

    Категории

    • Главная
    • Новости
    • Фронтенд
    • Бекенд
    • Языки программирования

    Контакты

    • Сотрудничество
    • info@exlends.com
    • Наш чат
    • Наш ТГ канал

    © 2024 - 2026 ExLends, Inc. Все права защищены.

    Политика конфиденциальности
    • Войти

    • Нет учётной записи? Зарегистрироваться

    • Войдите или зарегистрируйтесь для поиска.
    • Первое сообщение
      Последнее сообщение
    0
    • Лента
    • Категории
    • Последние
    • Метки
    • Популярные
    • Пользователи
    • Группы