Как отличить человеческий текст от текста, написанного искусственным интеллектом

Выдающимся достижением научного коллектива стала разработка метода, позволяющего достоверно определять авторство текстов даже при их небольшом объеме. Инновационный подход основан на комбинации проверенных ИИ-моделей и уникальных авторских разработок, что обеспечивает высокую точность распознавания.
Актуальность данного исследования обусловлена стремительным развитием больших языковых моделей, в результате чего общество все чаще сталкивается с гибридными текстами, созданными как людьми, так и искусственным интеллектом. Особенно важным становится точное определение авторства в ситуациях, требующих достоверной атрибуции текста.
Исследование показало, что традиционные методы имеют определенные ограничения. Например, современные трансформеры типа RoBERTa демонстрируют склонность к переобучению и недостаточную эффективность при работе с разнородными текстами. Для решения этой проблемы были применены «замороженные» модели, которые не подвергаются дополнительному обучению. Такой подход позволяет выявлять устойчивые характеристики машинного текста без риска потери способности к обобщению.
Значительным прорывом стало использование методов на основе перплексии, позволяющих оценить предсказуемость текста. Высокая перплексия характерна для человеческого письма, отражая его непредсказуемость и оригинальность. Напротив, низкая перплексия указывает на более шаблонную структуру, свойственную машинному тексту.
В ходе исследования было установлено влияние длины предложений и их структуры на точность алгоритмов. Особую сложность представляют тексты с четкой структурой, такие как инструкции или рецепты. Для преодоления этого ограничения были разработаны специальные подходы, минимизирующие влияние предсказуемых форматов.
Интеграция различных моделей, включая RoBERTa, в сочетании с оригинальными решениями позволила создать систему, эффективно выявляющую характерные особенности машинного текста: предсказуемую структуру, типовые паттерны и сниженную вариативность по сравнению с более разнообразными человеческими текстами.
Результаты исследования получили высокую оценку международного научного сообщества на конференции по языковому моделированию в Университете Пенсильвании, где работа была удостоена награды Outstanding Paper Award.
Успех данного исследования демонстрирует высокий уровень развития отечественной науки в области искусственного интеллекта и открывает новые перспективы в сфере анализа текстов и определения их авторства.
Источник:www.kommersant.ru