В последние годы искусственный интеллект, особенно глубокое обучение, сделал огромный прорыв в различных областях, включая распознавание изображений. Однако системы CAPTCHA (Completely Automated Public Turing tests to tell Computers and Humans Apart), предназначенные для различения между людьми и ботами в сети, были считались относительно надежными и не подверженными атакам иллюзорного интеллекта.
Однако исследователи из университетов Ланкастера, Северо-Западного и Пекина предложили новый подход, используя генеративно-состязательные сети (GAN), чтобы обойти системы CAPTCHA на 32 популярных веб-сайтах. Они создали алгоритм, который успешно распознает и обходит защиту CAPTCHA с высокой точностью.
Генеративно-состязательные сети (GAN) состоят из двух нейронных сетей: генератора и дискриминатора, которые соревнуются друг с другом. Генератор создает поддельные данные, пытаясь обмануть дискриминатор, который, в свою очередь, старается отличить поддельные данные от реальных. Постепенно генератор улучшается и создает все более реалистичные данные.
Исследователи использовали небольшой набор несинтезированных CAPTCHA для обучения генератора сети GAN, который затем создавал синтетические CAPTCHA. Эти синтетические примеры использовались для обучения базового решателя (base solver). Затем базовый решатель совершенствовался, чтобы создать точно настроенный решатель (fine-tuned solver), который успешно распознавал несинтезированные CAPTCHA.
Важно отметить, что данный подход отличается от предыдущих исследований в области обхода CAPTCHA. Исследователи не использовали набор данных с реальными примерами CAPTCHA, вместо этого они разработали собственный синтезатор с помощью GAN. Этот метод позволил им обучить свою модель на большом количестве сгенерированных примеров, что оказало положительное влияние на точность и эффективность обхода систем CAPTCHA на различных веб-сайтах.
Этот прорыв в искусственном интеллекте открывает новые перспективы для улучшения защиты систем CAPTCHA. Он также подчеркивает необходимость постоянного совершенствования технологий и методов защиты от атак иллюзорного интеллекта, чтобы предотвратить злоупотребление и недобросовестное использование онлайн-контента.
Исследователи разработали инновационный подход, используя генеративно-состязательные сети (GAN), чтобы успешно распознавать системы CAPTCHA на 32 популярных веб-сайтах, включая Google, Microsoft, eBay и Baidu. Их модель, которая требовала всего 500 реальных капч, показала значительно более высокую точность по сравнению с предыдущими решениями, использующими миллионы примеров обучающих данных. С использованием Python, TensorFlow и Keras, они создали прототип, который успешно обходил защитные системы CAPTCHA на различных сайтах, отмечая точность до 100% на некоторых из них. Этот прорыв демонстрирует важность развития более эффективных методов защиты данных от атак иллюзорного интеллекта.
Исследователи отмечают, что их подход не только обеспечивает увеличение точности распознавания капч, но также оказывается более эффективным и экономически доступным по сравнению с другими решениями. Эта GAN-нейросеть является первой с открытым исходным кодом для распознавания капч. Однако, есть некоторые ограничения, такие как капчи с переменным количеством символов, многословные и фото- или видео-капчи. Посещаемым веб-сайтам рекомендуется использовать дополнительные надёжные меры защиты, такие как обнаружение ботов, кибербезопасность и отслеживание устройства, чтобы предотвратить возможные атаки.