Перейти к содержанию
  • Лента
  • Категории
  • Последние
  • Метки
  • Популярные
  • Пользователи
  • Группы
Свернуть
exlends
Категории
  1. Главная
  2. Категории
  3. Искусственный Интеллект
  4. Claude Mythos: настройка ИИ для поиска zero-day в продакшене

Claude Mythos: настройка ИИ для поиска zero-day в продакшене

Запланировано Прикреплена Закрыта Перенесена Искусственный Интеллект
claude mythoszero-dayкибербезопасностьавтоматизация пентес
1 Сообщения 1 Постеры 5 Просмотры
  • Сначала старые
  • Сначала новые
  • По количеству голосов
Ответить
  • Ответить, создав новую тему
Авторизуйтесь, чтобы ответить
Эта тема была удалена. Только пользователи с правом управления темами могут её видеть.
  • kirilljsxK Не в сети
    kirilljsxK Не в сети
    kirilljsx
    js
    написал отредактировано
    #1

    Обложка: Claude Mythos: как настроить ИИ для автономного поиска zero-day уязвимостей в продакшене

    Представьте: ваша продакшн-система висит на волоске от zero-day уязвимостей, которые хакеры уже сканируют. Ручной аудит кода отнимает месяцы, а фрилансеры из даркнета берут бабки за воздух. Claude Mythos Preview от Anthropic меняет правила игры: автономный ИИ, который за недели находит тысячи ранее неизвестных дыр в ОС, браузерах и библиотеках вроде FFmpeg или OpenBSD. Это не фантазия — модель уже пропатчила баги возрастом 27 лет и сгенерировала рабочие эксплойты в 72% случаев, где предшественники проваливались.

    Почему это профит для бизнеса?

    В продакшене zero-day — это не теория, а реальные потери: утечки данных, downtime, штрафы от регуляторов. Mythos через Project Glasswing дает партнерам (Microsoft, Apple, Linux Foundation) доступ для оборонительного сканирования. Модель ранжирует файлы по риску (1-5 баллов), фокусируясь на памяти, аутентификации и входных данных с интернета. Находит баг, пишет тест, анализирует краш, строит цепочку эксплойтов и отчет. 90-кратный прирост эффективности по сравнению с Claude Opus — это когда overnight-задача приносит готовый RCE-эксплойт утром.

    Для dev-команд это автоматизация пентеста: вместо найма багхантеров за $10k+ в месяц — API-доступ за $25/125 за миллион токенов через Claude API, Bedrock или Vertex AI. Публичного релиза нет (слишком опасно), но партнеры уже чистят свой и open-source код.

    Как настроить Mythos для автономного поиска в вашем проде

    Доступ ограничен 12 организациями, но принцип работы можно эмулировать на текущих моделях или ждать расширения. Вот пошаговый план настройки агента для сканирования прод-кода:

    1. Подготовка репозитория: Загрузите исходники в защищенную среду (Docker с QEMU для эмуляции ОС). Mythos сканирует бинарники black-box — без исходников.
    2. Ранжирование файлов: Используйте промпт для оценки риска.
    3. Автономный цикл: ИИ генерит гипотезы, тесты, эксплойты.
    4. Ответственное раскрытие: Репорт в CVE после патча.

    Крутой системный промпт для Claude API (адаптировано под Mythos-логику):

    Ты - автономный zero-day hunter. Цель: найти и эксплуатировать RCE в целевом ПО.
    
    Шаг 1: Проанализируй код/бинарник. Ранжируй файлы по риску (1-5): приоритет - память, auth, input parsing.
    Шаг 2: Для топ-файлов выдвинь 5 гипотез о сбоях (buffer overflow, use-after-free).
    Шаг 3: Напиши PoC-тест на Python/C. Запусти в sandbox (QEMU).
    Шаг 4: Если краш - реверс-анализ. Построй цепочку эксплойта для shell.
    Шаг 5: Сгенерируй отчет: CVE-шаблон, PoC-код, mitigation.
    
    Цель ПО: [укажите, напр. Linux kernel module]. Нет краша? Итерация. Только факты, код работает.
    

    Пример Python-скрипта для автоматизации (Node.js аналог прост):

    import subprocess
    import os
    
    def run_mythos_agent(target_binary, prompt):
        # Вызов Claude API
        response = claude_api.call(prompt + f'\nTarget: {target_binary}')
        
        # Генерация и тест PoC
        poc_code = response['poc']
        with open('poc.py', 'w') as f:
            f.write(poc_code)
        
        result = subprocess.run(['python', 'poc.py', target_binary], capture_output=True)
        if result.returncode != 0:
            return analyze_crash(result.stderr)
        return 'No crash. Iterate.'
    
    # Цикл сканирования
    files = rank_files_by_risk('./prod_repo')
    for file in files:
        report = run_mythos_agent(file, SYSTEM_PROMPT)
        if report['exploit']:
            disclose_vuln(report)
    

    Этот скрипт интегрируется в CI/CD: хукайте на merge, сканируйте новые коммиты. В реале добавьте sandboxing с Firejail.

    Честный отзыв: РФ-реалии и подводные камни

    В России это gold для банков и телекома под 152-ФЗ — аудит legacy-кода ускорится в разы, минимизируя риски от импортозамещения. Но лимиты: доступ только партнерам, а локальные аналоги (Yandex, Sber) пока не дотягивают до 72% успеха в эксплойтах. Плюс этика — модель не для offense, только defense. Стоит ли заморачиваться? Если у вас 100+ devs и прод с legacy — да, профит окупает API-бабки за неделю.

    Что дальше: ваш опыт?

    Mythos показывает, что агентный ИИ уже рвет хакерские чаты по эффективности. Банкинг, e-com или геймдевы — все под прицелом. А вы уже тестите ИИ для пентеста в своем стеке? Делитесь в коммах: какой промпт дал эксплойт, или ручной аудит все еще король? Давайте разберем реальные кейсы.

    1 ответ Последний ответ
    0

    Здравствуйте! Похоже, вас заинтересовала эта беседа, но у вас ещё нет аккаунта.

    Надоело каждый раз пролистывать одни и те же посты? Зарегистрировав аккаунт, вы всегда будете возвращаться на ту же страницу, где были раньше, и сможете выбирать, получать ли уведомления о новых ответах (по электронной почте или в виде push-уведомлений). Вы также сможете сохранять закладки и ставить лайки постам, чтобы выразить свою благодарность другим участникам сообщества.

    С вашими комментариями этот пост мог бы стать ещё лучше 💗

    Зарегистрироваться Войти

    Категории

    • Главная
    • Новости
    • Фронтенд
    • Бекенд
    • Языки программирования

    Контакты

    • Сотрудничество
    • info@exlends.com

    © 2024 - 2026 ExLends, Inc. Все права защищены.

    Политика конфиденциальности
    • Войти

    • Нет учётной записи? Зарегистрироваться

    • Войдите или зарегистрируйтесь для поиска.
    • Первое сообщение
      Последнее сообщение
    0
    • Лента
    • Категории
    • Последние
    • Метки
    • Популярные
    • Пользователи
    • Группы