Публикации по теме 'toxicity'


Обнаружение токсичных спанов с помощью spaCy
Введение Выражение является токсичным, если в нем используется грубый, неуважительный или необоснованный язык, который может заставить кого-то покинуть обсуждение. Ядовитая лексика может быть короткой, например "идиот" , или более длинной, например "ваши "посты", как обычно, не соответствуют действительности". Мы будем использовать SpanCategorizer из spaCy для обнаружения токсичных интервалов. Для иллюстрации мы будем использовать хорошо изученный набор данных. В настоящей..

Снижение токсичности в больших языковых моделях с помощью Perspective API
За последний год инновации в генеративном машинном обучении значительно улучшили способность ИИ создавать контент, открыв шлюзы для потока новых продуктов. За последние двенадцать месяцев был выпущен публичный выпуск моделей машинного обучения, позволяющих генерировать изображения из текста ( Imagen от Google, Midjourney и DALL-E2 от OpenAI), видео ( Imagen Video ) и разговорных данных. текст ( Bard , LLaMa в Meta и ChatGPT в OpenAI). Эти модели открыли совершенно новый класс..