Doc2DB

HWP/DOC/XLS/PDF 등 디지털 문서에
입력된 정보를 추출하여

정형화된 DB 데이터로 변환 및 저장

HWP 텍스트, 이미지, 사용자 입력정보 추출, HWP 파싱

사내보고서, 대고객 신청서, 학술자료 및 연구 보고서 등 전자문서화 된 자료를 약속된 규칙에 의해 가공, 추출하여 DB화 하는 비정형 데이터 DB화 솔루션 패키지입니다.

서식을 통하여 사용자가 입력한 데이터 값 추출 등 고객사 고유 서식에 연계하여 맞춤화된 데이터 추출을 지원하며,
바이너리 규격의 HWP,DOC,XLS,PPT,PDF 및 XML 기반 HWPX, DOCX, XLSX, PPTX 등의 문서 규격 모두를 지원합니다.

입력정보 전체 추출부터 고객사 서식에 입력된 사용자 입력정보 추출

주요특징

  • 비정형 데이터인 사내 문서를 정형화하여 정보에 대한 접근성 및 활용성 제고
  • 사용자 입력 정보에 대한 유효성 검사를 지원하므로 잘못된 정보가 입력된 문서에 대한 대응 기반 구축

    신청서식 등 서식지의 필수 항목 누락여부, 한글∙영문∙숫자 등록여부 체크, 전화번호 등 패턴 유효성 검사 등 지원
    개인정보가 있을 경우 필요 시 개인정보 마스킹 지원 ( 주민번호 뒷 자리 마스킹 등 )

  • 외부 플러그인 또는 API를 사용하지 않으므로 도입 후 안정적 서비스 환경 유지
  • 플랫폼 독립적이며, 서버용/윈도우 애플리케이션 등 다양한 서비스 환경 지원

사용자 입력정보 DB화 흐름도

how work 1
문서별 추출항목 설정

how work 2
입력정보 추출

how work 3
값에대한 XML생성

how work 4
DB정보입력

  • 환경설정 정보를 참조하여 사용자 입력정보 중 추출 대상 정보를 추출하여 XML 규격으로 정보 값 생성 또는 DB에 저장

  • 필터링 대상 항목에 대한 유효성 검사(한글, 영문, 숫자 등)를 지원

  • 보고서 및 신청서 등 서식에 입력한 사용자 정보 중 필요 정보를 선택적으로 추출하여 저장(HWP,DOC,PDF 등 모든 문서 유형 지원)

도입에 따른 기대효과

01.

 문서 관리체계 확립
  • 각 부서에 방치되어 있는 문서에 대한 정리 및 색인DB 구축작업을 통하여 보존가치가 높은 문서에 대한 유실 및 멸실을 방지하고 담당자의 업무효율성 제고
  • 문서 관리체계의 획기적 개선 및 활용성 제고

02.

 업무의 효율화
  • 보유문서에 대한 정확한 현황 파악으로 정확하고 신속한 정보 공유 및 활용
  • 전자문서 전산입력 등 업무 비효율성 제거
  • 고객 또는 연계 부처 간 정보 공유 효율성 제고
  • 정보 접근 이력 및 접근 권한에 대한 관리 효율성 제고

03.

 선진화된 대고객 서비스 기반 구축
  • 접수되는 대고객 서비스 신청서 등에 대한 실시간 관리시스템 연계로 관련 문서와 데이터 간 상호 연계성 확보 가능
  • 대민 지원서비스 및 연계 문서를 손쉽게 검색 및 열람 가능
  • 입력정보 무결성 검증을 통해 전자서식 작성 중 필수항목 누락 등 작성오류 방지 및 신속 정확한 서비스 지원환경 구축