앤스로픽(Anthropic)이 자사 ‘Claude Mythos Preview’(미토스 프리뷰) 모델과 관련해 무단 접근 의혹을 조사하고 있다고 밝혔습니다. BBC와 The Verge에 따르면, 블룸버그 보도 이후 앤스로픽은 제3자 벤더 환경을 통해 모델에 접근했다는 신고를 접하고 조사에 착수했으며, 현재로선 회사 내부 시스템에까지 영향이 미쳤다는 증거는 없다고 설명했습니다.
이번 사안의 핵심은 Mythos가 단순한 대화형 AI를 넘어, 사용자가 지시할 경우 주요 운영체제와 웹 브라우저 전반의 취약점을 탐지·악용하는 데 활용될 수 있는 사이버보안 도구로 알려져 있다는 점입니다. 앤스로픽은 애초에 이 모델을 대중에 공개할 계획이 없다고 밝혀왔습니다. 그럼에도 권한 체계의 틈을 타 모델이 다른 경로로 접근됐을 가능성이 제기되며, ‘프런티어(최전선)급’ AI의 통제 문제를 다시 부각시키고 있습니다.
무단 접근은 ‘전형적 해킹’보다 ‘권한 오남용’일 가능성
BBC 보도에 따르면 앤스로픽은 블룸버그의 보도를 근거로 “제3자 벤더 환경 중 하나를 통해 Claude Mythos Preview에 무단 접근이 이뤄졌다는 보고를 조사 중”이라고 말했습니다. 회사는 현재까지는 무단 접근이 앤스로픽의 핵심 시스템이나 다른 환경으로까지 확산됐는지에 대한 명확한 증거는 없다고 덧붙였습니다.
또한 영국의 사이버보안 업계 관계자들은 이번 유형이 외부 침투형 ‘전형적 해킹’이라기보다, 이미 존재하는 접근 권한이 다른 방식으로 전용되는 오용(misuse of access)에 가까울 수 있다고 언급합니다. BBC는 사이버보안 기업 SmartTech의 CEO Raluca Saceanu의 말을 인용해, 고급 AI 도구가 의도된 통제 밖에서 사용되면 보안 사고 그 자체뿐 아니라 악용 가능한 역량이 확산될 위험이 있다고 전했습니다.
‘제3자 계약자’ 접근 권한이 관문이 됐을 수 있다는 보도
The Verge는 블룸버그를 인용해, 익명의 제보로 알려진 한 인사가 “개인적으로 확보된 접근 권한”을 바탕으로 Mythos에 접근이 가능했으며, 접근 과정에는 온라인 정보 수집 도구(‘인터넷 스누핑’에 가까운 접근)가 섞였다고 전했습니다.
구체적으로, Mythos의 공식 접근은 ‘Project Glasswing’ 이니셔티브를 통해 Nvidia, Google, Amazon Web Services, Apple, Microsoft 등 소수 기업에 제한적으로 제공되는 것으로 알려져 있습니다. 그러나 BBC는 이번 접근이 이미 타 업체(또는 제3자 계약자)를 통해 모델을 볼 수 있는 권한이 존재했던 인물을 고리로 이뤄졌을 가능성을 전합니다. 즉, 앤스로픽이 모델의 배포를 제한하더라도, 권한이 걸려 있는 작업 환경의 보안 및 분리 수준이 충분히 강하지 않으면 같은 결과가 재현될 수 있다는 우려가 생깁니다.
모델은 ‘위험성’을 이유로 공개되지 않았지만…접근 흔적이 남아
앤스로픽은 Mythos가 잘못된 손에 들어갈 경우 무기화될 수 있어 공개 배포를 계획하지 않는다고 밝혀왔습니다. The Verge에 따르면, Anthropic은 Mythos가 사용자의 지시에 따라 주요 운영체제와 주요 웹 브라우저 전반에서 취약점을 식별·악용할 수 있다는 취지로 설명해 왔습니다.
이번 의혹 보도에서 특히 주목되는 부분은, 무단 접근을 얻은 것으로 알려진 그룹이 모델을 일정 기간 정기적으로 사용한 정황을 보였다는 점입니다. BBC는 보도에 따르면 해당 그룹이 Mythos에 접근한 뒤 사용해 왔지만, 악용 목적(해킹 등)보다는 탐색·회피를 염두에 둔 방식이었다고 전했습니다. 그럼에도 모델의 실제 성능과 한계가 외부로 노출될 수 있으며, 더 나아가 다른 형태의 악용으로 이어질 수 있다는 점에서 규제·보안 측면의 파급이 큽니다.
향후 관전 포인트: 공급망 통제, 벤더 환경 분리, 접근 로그
앞으로 앤스로픽이 어떤 방식으로 조사를 마무리하는지가 핵심입니다. 회사는 현재 제3자 벤더 환경을 중심으로 접근이 이뤄졌는지, 그리고 그 과정이 앤스로픽의 다른 시스템이나 내부 데이터로 이어졌는지에 대한 확인이 필요합니다. BBC는 영국의 NCSC(National Cyber Security Centre) 수장 리처드 혼(Richard Horne)의 발언을 함께 전하며, AI 공격 능력이 확대되는 만큼 기본 보안 위생(principles: 패치, 업데이트, 기본 설정)이 더 중요해졌다고 강조합니다.
다만 제3자 접근·권한 체계가 관건이라는 점은 이번 사례가 분명히 드러냅니다. Mythos 같은 고위험 모델을 “소수 파트너에게만” 제공한다고 해도, 실제 접근 경로가 벤더 환경과 연결되는 순간 운영 통제의 난이도가 급격히 올라갑니다. 향후에는 모델 제공 기업들이 벤더 환경의 분리 수준, 접근 권한의 범위, 로그 추적 체계, 그리고 권한 오남용을 조기에 탐지하는 보안 장치를 더 촘촘히 요구받을 가능성이 큽니다.
앤스로픽은 현재 “무단 접근 보고”를 조사 중이며, 추가 결과가 나올 경우 모델 유출 범위와 재발 방지책이 공개될 것으로 보입니다. 이와 함께 업계 전체는 프런티어 AI를 둘러싼 통제 체계가 ‘배포 제한’만으로는 충분하지 않다는 과제를 직면하게 됐습니다.
댓글