пн-пт 9:00 — 18:00
г. Тула, ул. Некрасова, 7, оф. 315

Проверка Content-Signal

Content-Signal в robots.txt говорит AI, что разрешено делать с вашим контентом: использовать в поиске, в ответах или для обучения модели. Укажите адрес — найдём директиву и проверим на опечатки.

Протокол можно не указывать — подставим https://

Загружаем robots.txt и ищем Content-Signal…

Зачем проверять директиву Content-Signal? Content-Signal

Что такое Content-Signal и почему он появился

Content-Signal — предложенное расширение robots.txt, разрабатываемое в рамках IETF AI Preferences WG и IAB Tech Lab. Традиционный robots.txt отвечает только на вопрос «разрешить или запретить обход». Но AI-системы используют контент по-разному: для поиска, для ответов на вопросы пользователей, для обучения моделей. Content-Signal позволяет разграничить эти сценарии в явном виде, не блокируя краулер целиком. Это более тонкий инструмент управления по сравнению с грубым Disallow.

Три значения директивы

Директива имеет три параметра, каждый принимает значение yes или no. search — разрешение индексирования для поиска. ai-input — разрешение использовать контент как входные данные для AI-систем (RAG, суммаризация, ответы пользователям). ai-train — разрешение включать контент в обучающие корпусы языковых моделей. Пример: Content-Signal: search=yes, ai-input=yes, ai-train=no — контент индексируется и используется для ответов, но не для обучения новых моделей.

Синтаксис и размещение в robots.txt

Директива размещается внутри группы User-agent, аналогично Allow и Disallow. Можно задать разные политики для разных ботов: GPTBot получает ai-train=no, а PerplexityBotai-input=yes. Инструмент также проверяет типичные опечатки: Content-Signals (с S), content-signal (в нижнем регистре), ContentSignal (без дефиса) — всё это не распознаётся валидаторами. Директива должна писаться строго как Content-Signal:.

Текущий статус и практическое значение

Content-Signal — развивающаяся спецификация, ещё не принятая как стандарт. Однако крупные провайдеры моделей уже сигнализируют о планах поддержки. Раннее добавление директивы в robots.txt — проактивный сигнал: он показывает AI-системам и аудиторам вашу политику работы с данными ещё до формальной стандартизации. Это особенно важно для издателей, образовательных платформ и любого сайта с уникальным авторским контентом. Content-Signal дополняет правила доступа в robots.txt — вместе они дают полный контроль над взаимодействием AI-систем с вашим сайтом.

Развернуть все Свернуть

Часто задаваемые вопросы

Что означает значение ai-input=yes?
Разрешение использовать контент как входные данные для готовых AI-систем: суммаризация, ответы на вопросы, RAG-поиск. Это не обучение новых моделей — ai-input касается работы с уже обученными.
Чем Content-Signal отличается от Disallow?
Disallow блокирует обход страниц. Content-Signal — декларация намерений для ботов, уже имеющих доступ: «вы можете заходить, но вот что разрешено с контентом». Два разных уровня контроля.
Обязательно ли соблюдают Content-Signal AI-компании?
Это развивающаяся конвенция, не юридически обязывающий стандарт. Крупные провайдеры (OpenAI, Anthropic, Google) сигнализируют о планах поддержки. Добавление директивы сейчас — проактивная позиция.
Как правильно записать Content-Signal в robots.txt?
Строго внутри группы User-agent, после Disallow/Allow. Одно слово без s: Content-Signal: search=yes, ai-input=yes, ai-train=no. Ошибка в написании (Content-Signals, ContentSignal) делает директиву невидимой.