LEADTOOLS OCR SDK

LEADTOOLS는 .NET(C# 및 VB), C/C++, iOS, macOS, Linux, Java 및 웹 개발자를 위한 빠르고 정확한 광학 문자 인식 SDK 기술을 제공합니다. 고급 LEADTOOLS OCR 툴킷을 사용하여 스캔 문서에서 텍스트를 추출하고 이미지를 PDF, PDF/A, DOC, DOCX, XML 및 XPS와 같은 텍스트 검색 가능한 포멧으로 변환해 주는 강력하고 확장 가능한 고성능 인식 및 문서 처리 응용 프로그램을 신속하게 개발해 보십시오.

LEADTOOLS의 고급 OCR SDK 기술은 양식 인식, 수표 인식 및 문서 변환과 같은 고급 기술을 포함하고 있으며 각기 독립적인 기능으로 사용될 수 있습니다. 프로그래머는 이미지를 텍스트 검색이 가능한 문서로 변환하기 위해 최소한 3 줄의 코드만으로 독자적인 어플리케이션을 만들 수 있습니다.

40개 이상의 문자 세트를 광범위하게 지원함으로 프로그래머는 영어, 스페인어, 프랑스어, 독일어, 일본어, 중국어 및 아랍어를 비롯한 많은 언어들에 동일한 솔루션을 제공하여 고객 기반을 확장할 수 있습니다.


LEADTOOLS OCR SDK 기술의 개요

속도와 신뢰성

  • 모든 어플리케이션 및 환경에서 사용하기 위한 빠르고 정확하며 신뢰할 수 있는 광학 문자 인식
    • 대량의 문서 일괄 처리
    • 단일 및 다중 페이지 문서
    • 태블릿 및 모바일 장치들 지원
    • 웹 및 클라우드 어플리케이션
  • 월등한 성능을 위해 다중 코어 활용

정확성

  • 맞춤법 검사 사전 지원
  • 동일한 문서에서 여러 언어를 자동으로 감지, 구분 및 인
  • 전체 페이지 분석 및 영역 인식 :
    • 자동 테이블 영역 분할
    • 자동 OMR 영역 세분화
    • 오리엔테이션 각도 (예 : 90, 270 또는 0)를 사용하는 자동 수직 텍스트 세분화
    • 수평 텍스트 페이지내 수직 텍스트의 자동 세분화
  • 자동 문서 Cleanup :
    • 무 지향성 노이즈 제거
    • Undither 텍스트
    • Dot matrix 보정
    • 테이블에서 줄을 제거하는 옵션
  • 자동 문서 사전 처리 :
    • 스캔한 문서 Deskew
    • 다중 또는 단일 페이지 모드로 문서 방향 (Flipped 또는 Reversed)을 감지하고 수정
    • 테두리 제거
    • 페이지 분할
  • 스캔한 문서 및 그림에 대한 고유한 색상 및 흑백 이미지 인식 기능은 전경색/배경색에 관계없이 텍스트를 감지할 수 있음
  • PDF, PDF/A, DOC, DOCX, XML, XPS 등과 같은 검색 가능한 텍스트 문서 형식을 출력하여 원본 모양과 느낌을 유지 :
    • 검색된 글꼴 특성 (글꼴 - 가족 이름, 스타일, 크기, 볼드체, 이탤릭체 , 밑줄, Strikeout, 경사각 등)
    • 위치
    • 테이블 재구성
    • 레이아웃
    • 그래픽

다재다능

  • 완벽한 기능을 갖춘 SDK :
    • 이미지에서 최종 문서까지 한번에 인식할 수 있는 고급 기능들
    • 전체 특화를 위한 낮은 수준의 기능들
  • 다양한 텍스트 인식 엔진들 지원
  • 완전히 구성 가능한 인식 엔진
    • 문자 및 숫자 필터로 축소 가능한 결과
    • 정확성 향상을 위한 다중 투표 기술
    • 추적 및 진행 콜백
    • 텍스트만 빠르게 인식할 수 있도록 글꼴 특성 사용/사용안 함
  • 포괄적인 결과 보고
    • 문자 위치, 크기 및 기준선
    • 문자 속성 (단어 끝, 줄 끝, 단락 끝)
    • 글꼴 속성 (고정 폭, 비례, 세리프, 산 세리프, 볼드체, 이탤릭체, 밑줄, 취소 선)
    • 신뢰도
    • 외부 문서에 저장하지 않고 존이나 페이지에 대해 직접 인식된 단어를 획득
  • LEADTOOLS 양식 인식 및 프로세싱 SDK와 완벽하게 통합
  • LEADTOOLS 분산 컴퓨팅 SDK를 사용하여 대규모 분산 OCR 어플리케이션 구현

교차 플랫폼

  • 다양한 플랫폼을 위한 기본 기능의 광학 문자 인식 라이브러리
    • Windows 데스크탑, 서버 및 폰
    • iOS와 macOS
    • Android
    • 웹 서비스
  • 네이티브 모바일 라이브러리는 외부 서비스를 호출할 필요없이 장치에서 실행 가능
  • 실시간 텍스트 인식 및 처리를 위해 휴대폰 및 태블릿에서 카메라 미리보기 활용
  • 모바일 장치 고유의 변형에 대한 특수화된 이미지 처리 및 인식
    • 3D 원근감 기울기 보정
    • 키스톤 보정
    • 고정 초점 카메라 최적화
  • 프로그래밍 인터페이스가 서로 매우 유사하여 다양한 플랫폼에 어플리케이션을 쉽게 포팅할 수 있음


LEADTOOLS OCR 엔진들

LEADTOOLS OCR SDK는 다음과 같은 인식 엔진들을 포함합니다:

LEAD OCR 엔진

Windows x86/x64, .NET(C# 및 VB), Linux, iOS, macOS 및 Android용 네이티브 라이브러리로 자체 개발하였습니다.

자체 개발의 이점

  • 속도와 정확성에 대한 새로운 기능과 향상된 기능이 지속적으로 추가됨
  • 고객 피드백 및 기능 요청이 빠른 기간내 엔진 향상 및 확장에 반영됨

OmniPage OCR 엔진

Nuance OmniPage 20 인식 엔진으로 Windows x86/x64 및 .NET 용 기본 라이브러리를 포함합니다.

상호 교환 가능한 고급 인터페이스

LEADTOOLS는 단 한 줄의 코드로 여러 인식 엔진의 사용을 단순화하는 고급 인터페이스를 제공합니다. 예를들어, 다음과 같은 코드는 개발자의 나머지 코드가 변경되지 않은 상태에서 사용되는 인식 엔진을 결정합니다.

몇 줄의 코드만으로 TIFF를 검색 가능한 PDF로

LEADTOOLS OCR SDK는 개발자가 짧은 시간에 복잡한 인식 어플리케이션을 생성할 수 있게 해주는 고급 프로그래밍 인터페이스를 제공합니다. 예를 들어, AutoRecognizeManager를 사용하면 개발자는 단지 3줄의 코드만으로 150 개 이상의 이미지 포멧들을 PDF 또는 DOC와 같은 텍스트 검색 가능한 포멧으로 변환할 수 있습니다.


OCR 언어들

40개 이상의 언어 및 문자 세트에서 텍스트를 인식합니다

  • English (en)
  • Afrikaans (af)
  • Albanian (sq)
  • Arabic (ar)
  • Azerbaijani (az)
  • Basque (eu)
  • Belarusian (be)
  • Bulgarian (bg)
  • Catalan (ca)
  • Chinese Simplified (zh-Hans)
  • Chinese Traditional (zh-Hant)
  • Croatian (hr)
  • Czech (cs)
  • Danish (da)
  • Dutch (nl)
  • Estonian (et)
  • Faroese (fo)
  • Finnish (fi)
  • French (fr)
  • Galician (gl)
  • German (de)
  • Greek (el)
  • Hungarian (hu)
  • Icelandic (is)
  • Indonesian (id)
  • Italian (it)
  • Japanese (ja)
  • Korean (ko)
  • Latvian (lv)
  • Lithuanian (lt)
  • Macedonian (mk)
  • Malay (ms)
  • Maltese (mt)
  • Norwegian (no)
  • Polish (pl)
  • Portuguese (pt)
  • Portuguese Brazil (pt-BR)
  • Romanian (ro)
  • Russian (ru)
  • Serbian (sr)
  • Sebian Cyrillic (sr-Cyrl-CS)
  • Slovak (sk)
  • Slovenian (sl)
  • Spanish (es)
  • Swahili (sw)
  • Swedish (sv)
  • Telugu (te)
  • Thai (th)
  • Turkish (tr)
  • Ukrainian (uk)
  • Vietnamese (vi)


OCR에 대한 문서 링크들 :


OCR을 포함하고 있는 데모 어플리케이션들 :


비디오


OCR을 사용하는 코드 팁들 :


OCR에 대한 백서들

 
OCR SDK 기술이 포함된 제품군 :
Recognition Imaging SDK
(LEAD OCR 모듈이 포함되어 있음)
Document Imaging Suite SDK
LEAD OCR 모듈이 포함되어 있음)
OCR 모듈이 추가될 수 있는 제품군 :
Document Imaging SDK
Medical Imaging SDK
PACS Imaging SDK
Medical Imaging Suite SDK
OCR SDK 모듈들 :
LEAD OCR
OmniPage OCR
OmniPage OCR + 추가 지원 언어들
ICR 모듈

 




Copyright © 2018 by Hyubwoo. Info. Tech. Co., Ltd. All rights reserved.