0.05초만에 캡차(CAPTCHA) 뚫는 인공지능 개발한 학생들

캡챠뚫는 인공지능 기술

0.05초만에 캡차 뚫는 인공지능 기술


텍스트 기반의 보안문자는 웹사이트 보안을 위해서 가장 보편적으로 사용되는 기술 중 하나입니다. 사람과 로봇을 구분하기 위해 작은 이미지필드에 텍스트로 쓰여진 문자를 입력하게 하는 방식의 캡차(CAPTCHA)가 대표적입니다.


캡차는 사용하여 관리자들은 자동스팸 및 해킹을 차단합니다. CAPTCHA는 'Completely automated public Turing test to tell computers and humans apart'는 지난 20년 동안 이 역할을 잘 수행해 왔지만,


이를 극복(?)하기 위한 해커와 연구원들의 노력도 계속되고 있습니다. 하지만 지금까지 이들은 노동 집약적인 방식으로 캡챠를 뚫는 방법은 사용했습니다.

캡챠종류다양한 캡챠종류


최근 영국 랭카스터 대학과 중국의 노스웨스트 대학, 북경대학 학생들은 인공지능 기술을 활용 어느때보다 효과적으로 캡차를 뚫는 방법을 개발했습니다. 이 방법은 기존방식보다 효과적으로 학습을 할 수 있다고 합니다.


이 팀이 개발한 텍스트 CAPTCHA Solve는 혁신적인 AI기반 이미지 인식 방법을 사용해 마이크로소프트, eBay 등 업계 최고 수준의 모델을 비롯해 33가지 이상의 캡챠 체계에서 다른 4개의 경쟁 솔루션을 모두 제치는 결과를 만들어 냈습니다.


yet another captcha solver.pdf



캡챠결과

이 모델은 일반 데스트톱 CPU에서 사용할 수 있을 정도로 요구되는 컴퓨팅 성능이 낮은게 특징이고, 0.05초 만에 캡챠를 뚫어 낼 수 있습니다.


학생들이 개발한 CAPTCHA Solver는 네가지 단계로 작업을 진행합니다.


4단계


1. 캡차합성 : GAN 기반 생성기를 사용해 캡차와 유사한 출력 이미지를 생성합니다.


2. 사전처리 :  GAN Pix2Pix 모델을 사용, 보안기능을 제거하고  글꼴 스타일을 표준화 합니다.


3. 기본 솔버 훈련(Training the base solver) : 1,2단계를 통해 작성된 데이터세트로 캡챠를 훈련시킵니다.


4. 기본 솔버 미세조정(Fine-tuning base solver) : 전송 학습을 사용해 수동으로 지정된 레이블 CAPTCHA의 스몰셋을 대상 웹 사이트에 적용해 CAPTCHA의 성능을 개선합니다.


학생들은 자신들이 개발한 인공지능이 CAPTCHA 스키마를 개선하고 보안성을 향상시키는데 도움이 될 수 있기를 바란다고 밝혔습니다.



댓글

Designed by JB FACTORY