via 토큰포스트 (Tokenpost) · 토큰포스트 편집부 작성
오픈AI, 보안 연구자에만 ‘GPT-5.5-사이버’ 공개…공격 시뮬레이션까지 허용 - TokenPost

오픈AI가 사이버보안 연구에 특화한 새 인공지능 모델 ‘GPT-5.5-사이버’를 공개했다. 일반 이용자에게는 제한하던 취약점 분석과 공격 시뮬레이션 기능을 보안 연구자에게만 확대 개방한 점이 핵심이다.
이번 모델은 8일 공개됐으며, 오픈AI가 지난 2월 시작한 ‘사이버용 신뢰 접근 프로그램’(TAC)을 통해 제한적으로 제공된다. TAC는 검증된 사이버보안 연구자에게 자사 알고리즘에 대한 더 넓은 접근 권한을 주는 제도다.
일반 버전보다 한 단계 더 넓어진 보안 연구 기능
오픈AI의 최신 대형언어모델인 GPT-5.5는 지난달 출시됐다. 이 모델은 코드 생성과 프로그래밍 보조 능력이 뛰어나며, 실제로 오픈AI 내부 서버 클러스터의 소프트웨어 성능 개선에도 활용된 것으로 전해졌다. 이런 코드 이해·생성 능력은 소프트웨어 취약점을 찾는 작업에도 그대로 연결된다.
다만 오픈AI는 악용 가능성을 우려해 일반 사용자의 사이버보안 관련 요청을 엄격히 제한해왔다. 예를 들어 일반 ChatGPT 계정으로 취약한 웹사이트 공격 방법을 묻는 경우, 모델은 요청을 거부하거나 보안 패치와 복구 방안을 제시하는 수준에 그친다.
반면 TAC 참여 연구자에게는 더 구체적인 응답이 허용된다. GPT-5.5는 취약한 시스템에 대해 해커가 어떤 방식으로 공격을 시도할 수 있는지 기술적으로 설명할 수 있고, 샘플 악성코드도 생성할 수 있다. 다만 기존 버전은 실제 익스플로잇, 즉 공격 코드가 작동하는지까지 검증하지는 않았다.
‘공격 계획’ 넘어 ‘시뮬레이션 검증’까지
새로 공개된 GPT-5.5-사이버는 여기서 한발 더 나아간다. 단순히 취약점 악용 계획을 제시하는 데 그치지 않고, 연구 대상 시스템을 상대로 모의 사이버 공격을 수행해 해당 방식이 실제로 통하는지 검증할 수 있다.
이 기능은 기업 보안 점검에서 중요한 ‘레드팀’ 작업 자동화에 특히 유용할 전망이다. 레드팀은 실제 해커의 행동을 모방해 기업 인프라의 방어 수준을 시험하는 방식이다. 사람이 일일이 설계하던 절차 일부를 AI가 맡을 수 있다는 점에서 보안 운영 효율을 크게 높일 수 있다는 평가가 나온다.
오픈AI에 따르면 GPT-5.5-사이버는 대형언어모델의 사이버보안 역량을 측정하는 벤치마크 ‘사이버짐’에서 81.9% 점수를 기록했다. 이 벤치마크는 수백 개 오픈소스 프로젝트에서 수집한 1,500개 이상의 과거 취약점을 기반으로 구성된다.
강화된 안전장치도 함께 적용
오픈AI는 사이버보안 기능이 강력해진 만큼 안전장치도 함께 강화했다고 설명했다. 우선 해커가 모델에 접근하지 못하도록 ‘더 강한 검증 절차’를 적용하고, 사용 과정에서 악용 징후를 감시하는 모니터링 체계도 보강했다. 접근 권한을 얻은 연구자들이 보안 업계의 모범 관행을 지키는지 지속적으로 확인하겠다는 의미다.
초기에는 ‘핵심 인프라 보안을 담당하는 방어 조직’에 한해 소수만 GPT-5.5-사이버를 이용할 수 있다. 오픈AI는 대부분의 일반적인 보안 프로젝트에는 TAC를 통해 제공되는 표준 GPT-5.5 버전이 더 적합하다고 밝혔다.
앤트로픽과 보안 AI 경쟁도 본격화
이번 출시는 보안 특화 AI 시장 경쟁에도 불을 붙일 가능성이 크다. 앤트로픽도 앞서 자사 고성능 모델 ‘클로드 미토스 프리뷰’를 제한된 기관에 제공하며 소프트웨어 취약점 탐지 역량을 강조한 바 있다.
결국 ‘GPT-5.5-사이버’의 등장은 생성형 AI 경쟁이 단순한 챗봇 성능을 넘어 사이버보안 실전 영역으로 빠르게 확장되고 있음을 보여준다. 다만 이런 기술은 방어 역량을 끌어올리는 동시에 악용 우려도 큰 만큼, 성능 경쟁보다 접근 통제와 검증 체계가 시장 신뢰를 가를 변수로 떠오를 전망이다.