Инструкции
Как генерировать, проверять, редактировать и выбирать инструкции для тегирования.
Инструкции
Инструкции определяют, как сообщения будут размечаться. Хорошая инструкция удерживает стабильные категории, объясняет пограничные случаи и даёт модели достаточно примеров.
Основной путь создания
Используйте автогенерацию как основной способ создания инструкций. Загрузите уже размеченные примеры, и генератор соберёт структуру тегов, описания и правила разметки на основе реальных данных.
После генерации редактирование нужно в основном для небольших корректировок или сопровождения уже существующей инструкции.
Автогенерация
Используйте генератор, если есть CSV/XLSX с размеченными примерами.
- Загрузите файл с примерами.
- Выберите бренд, систему источника и режим сопоставления колонок.
- Проверьте найденное сопоставление и колонки тегов.
- Выберите режим генерации:
- Точность — для более строгой разметки.
- Баланс — режим по умолчанию.
- Охват — для более широкого покрытия. - Проверьте предварительный просмотр и подтвердите генерацию.
Проверка и редактирование
Откройте инструкцию из таблицы, чтобы проверить статус, теги и текст. Редактируйте названия, описания тегов и правила разметки, когда меняется структура тегов или поведение модели требует корректировки.
Выбор инструкции для тегирования
Выбирайте инструкцию под бренд, язык и тип источника. Неподходящая инструкция быстро создаёт шумную аналитику.
Практический чек-лист
- Названия тегов короткие и единообразные.
- Описания объясняют границы между похожими тегами.
- Примеры включают реальные неоднозначные случаи.
- Инструкция активна перед запуском.