Gemini Chrome, 프롬프트 주입 방어 강화

Share

Google, Gemini 기반 Chrome 브라우징 에이전트 보안 강화: 프롬프트 주입 공격 방어

Google이 Gemini 기반 Chrome 브라우징 에이전트의 보안을 강화하기 위해 두 번째 AI 모델을 배치했습니다. 이는 에이전트가 프롬프트 주입 공격에 취약하여 승인되지 않은 작업을 수행할 수 있다는 점을 인정한 데 따른 조치입니다. 이 새로운 보안 모델은 사용자 의도와 에이전트의 행동을 비교하여 악성 프롬프트 주입으로 인한 피해를 최소화하는 데 초점을 맞추고 있습니다.

프롬프트 주입 공격의 위험성

프롬프트 주입 공격은 AI 시스템, 특히 LLM(대규모 언어 모델) 기반 에이전트에서 가장 심각한 취약점 중 하나로 부상했습니다. 공격자는 웹 페이지, iframe 또는 사용자 생성 콘텐츠에 악성 명령을 숨겨 에이전트가 금융 거래를 시작하거나 민감한 데이터를 유출하는 등 원치 않는 작업을 수행하도록 유도할 수 있습니다. 특히 Chrome 브라우징 에이전트의 경우 사용자가 로그인한 사이트에서 사용자의 모든 권한을 갖게 되므로 위험성이 더욱 큽니다. 이는 사이트 격리 보호를 우회하여 웹 사이트 간 데이터 접근을 허용할 수 있습니다.

Google의 이중 AI 모델 방어 전략

Google은 이러한 위험에 대응하기 위해 이중 AI 모델 방어 전략을 채택했습니다. 핵심은 Gemini 모델이 웹 콘텐츠를 읽고 수행할 작업을 결정하는 반면, 사용자 정렬 검증 모델은 제안된 작업에 대한 메타데이터만 확인하고 악성 명령이 포함될 수 있는 웹 콘텐츠에는 접근하지 못하도록 분리하는 것입니다. 검증 모델은 에이전트가 수행하려는 작업이 사용자의 의도와 일치하지 않는다고 판단하면 해당 작업을 차단하고, Gemini 모델에게 피드백을 제공하여 접근 방식을 재고하도록 합니다.

추가적인 보안 조치

Google은 사용자 정렬 검증 모델 외에도 에이전트가 상호 작용할 수 있는 웹 사이트의 범위를 제한하기 위해 "Origin Sets"라는 개념을 도입했습니다. 이 시스템은 에이전트가 읽을 수 있는 사이트와 클릭 또는 입력과 같은 작업을 수행할 수 있는 사이트 목록을 유지 관리합니다. 또한 Chrome은 브라우징 에이전트가 은행 또는 의료 사이트로 이동하거나 Google 비밀번호 관리자를 통해 저장된 비밀번호를 사용하거나 구매를 완료하기 전에 사용자 확인을 요구합니다. 이러한 추가적인 보안 조치는 프롬프트 주입 공격의 잠재적 피해를 더욱 줄이는 데 도움이 됩니다.

프롬프트 주입 공격 방어의 어려움

프롬프트 주입 공격은 LLM이 명령과 데이터를 안정적으로 구별할 수 없기 때문에 완전히 완화하기 어려운 문제입니다. 영국의 국가 사이버 보안 센터(NCSC)는 프롬프트 주입 공격이 "혼란스러운 대리자" 취약점이라고 경고했습니다. 이는 신뢰할 수 있는 시스템이 신뢰할 수 없는 당사자를 대신하여 작업을 수행하도록 속이는 것을 의미합니다. 따라서 조직은 AI 시스템이 공격받을 것이라고 가정하고 접근 권한과 권한을 제한하여 위험을 관리해야 합니다.

Google의 지속적인 노력

Google은 브라우징 에이전트의 안전성을 보장하기 위해 지속적으로 노력하고 있습니다. 사용자 정렬 검증 모델 및 Origin Sets 외에도 프롬프트 주입 시도를 확인하는 분류기를 구축하고 악성 테스트 사이트를 생성하는 자동화된 레드팀 시스템을 운영하고 있습니다. 이러한 노력은 브라우징 에이전트를 더욱 안전하게 만들고 사용자 데이터를 보호하는 데 도움이 될 것입니다.

맺음말

Google의 Gemini 기반 Chrome 브라우징 에이전트 보안 강화는 AI 기반 브라우징 에이전트가 직면한 보안 문제를 해결하기 위한 중요한 단계입니다. 프롬프트 주입 공격은 여전히 어려운 문제이지만, Google의 이중 AI 모델 방어 전략과 추가적인 보안 조치는 사용자 데이터를 보호하는 데 큰 도움이 될 것입니다. 앞으로도 Google은 지속적인 연구와 개발을 통해 AI 기반 브라우징 에이전트의 보안을 더욱 강화해 나갈 것입니다.

이것도 좋아하실 수 있습니다...