개인정보보호위원회는 2024년 2월 5일 개정된 ‘가명정보 처리 가이드라인’을 공개하였습니다. 이번 개정은 기존 가이드라인이 ‘정형데이터’에 대한 처리기준만 제시하고 있었던 한계를 보완하여, 이미지·영상·음성·텍스트 등 인공지능 기술개발의 핵심인 ‘비정형데이터’에 대한 가명처리 기준을 새롭게 마련하기 위한 것입니다.

※ 정형데이터와 비정형데이터의 차이점

구분 정형데이터 비정형데이터
정의 정해진 규칙에 맞게 구조화된 형식으로 존재하는 데이터 일정한 규격이나 정해진 형태가 없이 구조화되지 않은 데이터
특징 데이터 연산, 분석 등 데이터 처리 방식, 가명처리 기술·방법이 비교적 단순 연구목적·환경에 따라 데이터 처리방식 및 가명처리 기술·방법이 복잡·다양
예시 DB에 열과 행으로 저장된 테이블형식의 자료 등 사진·이미지, 비디오, 통화음성, 대화기록, 논문·보고서, 블로그 등

이번 개정을 통해 ‘가명정보 처리 가이드라인’에는 (i) 비정형데이터 가명처리 기준, (ii) 비정형데이터 가명처리 기술 및 예시 및 (iii) 비정형데이터 가명처리 시나리오 예시 등이 추가되었으며, 주요내용을 아래에서 더 자세히 살펴보도록 하겠습니다.

 

주요내용

1. 비정형데이터 가명처리 기준

  • 데이터 처리목적·환경, 민감도 등을 종합적으로 고려하여 개인식별 위험성이 있는 정보를 판단하고, 합리적인 처리 방법·수준 설정
    1. 개인식별위험이 있는 정보가 비교적 명확히 구분되는 정형데이터와 달리 비정형데이터는 개인식별 가능 정보에 대한 판단이 상황에 따라 달라질 수 있음
    2. 연구목적 달성에 필수적인 정보항목을 남기는 대신 그 외 정보항목에 대한 가명처리 수준을 높이거나, 다른 정보 및 소프트웨어(SW) 반입 제한 등 충분한 안전조치를 보완하여 활용
  • 가명처리 기술의 한계 등을 보완하기 위해 사전 준비단계(연구 및 기술개발 기획)부터 위험성을 충실히 검토하고 적절한 안전조치를 수행
    1. 비정형데이터에 내재된 개인식별 위험 요인을 완벽하게 탐지하여 처리할 수 있는 기술이 아직 없음
    2. 가명처리 기술의 한계를 보완하기 위해 다음 조치를 이행할 것을 권고
① 가명처리 기술의 적절성·신뢰성을 확인할 수 있는 근거 작성·보관
② 가명처리 기술 적용 이후, 처리 결과에 대해 자체적인 검수 수행
③ 가명처리 적정성 검토 과정에서 ①, ②를 포함하여 점검(외부전문가 과반 이상 참여 바람직)
  • 데이터 복원기술 발달 등에 대응하여, 가명처리된 비정형데이터 활용 시 관련 시스템·SW의 접근·사용 제한 등 통제방안 마련
    1. 또한, AI 서비스 제공 과정에서도 개인식별 위험 등 정보주체 권익 침해 가능성을 지속 모니터링


2. 비정형데이터 가명처리 기술 및 예시

  • 영상정보: 이미지 필터링 기술, 이미지 암호화, 얼굴 합성(프라이버시 보존형 데이터 마이닝), 인페인팅(Inpainting), AI 이용 영상정보 가명처리 등
  • 음성정보: 음성정보 자체에 대한 가명처리(VT, VC, GMM매핑, DROPSY), 텍스트로 변환 후 가명처리 등
  • 텍스트정보: 규칙기반 개인정보 삭제 혹은 마스킹, 스크러빙(Scrubbing), 정규표현식(Regular Expression), 주석 달기(Annotation), AI기반 텍스트정보 가명처리, 텍스트를 테이블 형식으로 변환 등


3. 비정형데이터 가명처리 시나리오 예시

  • 의료데이터, CCTV 영상, 음성 대화·상담 정보를 활용하는 바이오·헬스, 인공지능, 데이터 솔루션 개발 등 다양한 분야에서의 가명정보 활용 전 과정을 상세히 안내
    1. 주요 분야별 비정형데이터 가명처리 시나리오 예시
분야 비정형데이터 예시
의료 이미지, 영상, 텍스트 유방암·골밀도 감소 여부 진단 AI 개발
의료 이미지 구강질환 진단 AI 개발
의료 이미지, 영상 안면골 골절 진단 AI 개발
교통 이미지, 영상 자율주행차 주행 시 비정상 상황 인지 AI 개발
교통 이미지 고속도로 다인승전용차 단속 AI 개발
대화·검색 텍스트 한국어 대화가 가능한 AI 챗봇 제작
대화·검색 음성, 텍스트 콜센터 직원 교육용 가상상담 시나리오 생성 AI 개발

 

시사점

  • AI 기술과 컴퓨팅 자원의 발달로 ‘비정형데이터’에 대한 활용수요는 폭발적으로 증가하였음에도 기업, 연구기관 등은 비정형데이터의 적합한 가명처리 방법이나 수준을 정확히 알 수 없었습니다. 
  • 이번 개정 ‘가명정보 처리 가이드라인’에 포함된 비정형데이터 가명처리 사례 내지 시나리오는 단순 참고용으로 각 사업자의 데이터 활용 분야·상황에 맞게 가명처리 방법·수준 등을 자유롭게 적용할 수 있는데, 가이드라인에서 제시된 사례 등을 통해 비정형데이터를 활용하는 다양한 신기술 영역에서 현장의 불확실성을 어느정도 해소할 수 있을 것으로 보입니다. 
  • 이번 가명처리 가이드라인 개정 외에도 개인정보보호위원회는 「가명정보 활용 확대방안」(23.7)을 발표하는 등 안전한 데이터 활용을 진흥하고자 하는바, 추후에도 이와 관련한 정부의 주요 동향들을 지속적으로 파악할 필요가 있습니다. 

 

About Shin & Kim’s ICT Group

법무법인(유) 세종은 개인정보 분야의 독보적인 전문성과 인적 네트워크(윤종인 전 개인정보보호위원회 위원장, 김영호 전 행정안전부 차관, 최재유 전 과학기술정보통신부 차관 등)를 보유하고 있으며, 기업들을 위하여 개인정보보호법과 GDPR을 비롯한 국내외 개인정보 규제, 개인정보 유출사건 대응, 개인정보보호 컴플라이언스 체계 수립 등 개인정보보호에 관한 전문적인 자문을 제공하고 있습니다. 특히, 데이터 3법 개정 및 하위법령 제정, 관련 제도개선에 있어 민간영역에서 주도적인 역할을 수행한 바 있으며, 가명정보, 데이터 활용, ICT 산업 전반에 대한 규제 동향 파악 및 대관, 입법컨설팅, 규제영향력 분석과 기업의 전략 수립 등에 대한 법률자문을 제공하고 있으므로, 보다 전문적인 내용이나 궁금하신 사항이 있으면 언제든지 연락 주시기 바랍니다.