사용자가 업로드한 문서 내 텍스트를 추출, 실시간으로 개인정보를 탐지
파일 업로드 시점에 실시간으로 탐지할 수 있도록 SDK 로 제공, 기존 게시판 기능에 적용하여 사용자 편의성을 유지하면서 개인정보 보호 정책을 반영했습니다. 운영자가 정기·비정기적으로 개인정보 탐지 현황을 파악할 수 있게 대시보드를 제공하고, 오탐 여부를 확인할 수 있도록 탐지된 정보를 제공하는 등 편의 기능도 함께 제공했습니다.
추출 엔진과 데이터 파이프라인을 결합해, 업로드되는 모든 문서에서 텍스트를 추출하고 개인정보(PII) 패턴을 실시간으로 탐지합니다. 운영자 대시보드, 오탐 검수, 배치 분석까지 한 자리에서.
게시글, 첨부 파일, 정보공개 문서, 사내 문서 — 개인정보는 어디에든 숨어 있고, 사후에 발견하면 이미 늦습니다.
라이트스택은 추출 엔진(Docpler)과 데이터 엔지니어링 파이프라인을 결합해, 파일이 업로드되는 그 시점에 텍스트를 추출하고 개인정보 패턴을 즉시 탐지합니다. 실시간·배치 두 모드를 모두 지원합니다.
한국관광공사, 한국저작권위원회 같은 공공기관에서 검증된 도입 사례를 가지고 있습니다.
파일이 업로드되는 시점에 텍스트를 추출하고 개인정보(PII) 패턴을 실시간으로 검출합니다. 사용자 흐름을 끊지 않습니다.
시스템 내 누적된 문서를 배치로 일괄 분석합니다. 정기·비정기 점검에 활용할 수 있습니다.
HWP, PDF, Office, 이미지 등 모든 업무 문서 포맷에서 동일하게 동작합니다.
탐지 현황을 시계열로 시각화하고, 오탐 여부를 검수할 수 있도록 탐지된 정보를 함께 노출합니다.
게시판·CMS·업로드 모듈에 SDK 또는 REST API 로 자연스럽게 끼워 넣습니다. 기존 사용자 편의성을 그대로 유지합니다.
조직별 개인정보 보호 정책에 맞춰 탐지 패턴·마스킹 규칙을 조정합니다. 컴플라이언스 요건을 그대로 받아냅니다.
파일 업로드 시점에 실시간으로 탐지할 수 있도록 SDK 로 제공, 기존 게시판 기능에 적용하여 사용자 편의성을 유지하면서 개인정보 보호 정책을 반영했습니다. 운영자가 정기·비정기적으로 개인정보 탐지 현황을 파악할 수 있게 대시보드를 제공하고, 오탐 여부를 확인할 수 있도록 탐지된 정보를 제공하는 등 편의 기능도 함께 제공했습니다.
시스템 내의 문서를 실시간 혹은 배치로 분석하여 개인정보를 탐지해야 하는 시스템에서 SDK 형태의 텍스트 추출 도구가 유용하게 도입되었습니다.