일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- jquery
- 공모주 청약
- codeigniter
- 주식 청약 일정
- 맥
- MYSQL
- 공모주 청약 일정
- html
- Stock
- 제이쿼리
- linux
- Oracle
- JavaScript
- IPO
- 리눅스
- php
- SQL
- 주식 청약
- java
- 7월 공모주 청약 일정
- 자바
- 주식
- css
- 6월 공모주 청약 일정
- 코드이그나이터
- 공모주
- Stock ipo
- 오라클
- 자바스크립트
- Eclipse
- Today
- Total
목록Tesseract OCR (2)
개발자의 끄적끄적
[개발참고] Tesseract로 OCR 하기 [펌] OCR은 Optical Character Recognition의 약자로 광학 문자 인식을 일컫는다. 이는 사람이 쓰거나 기계로 인쇄한 문자의 영상을 이미지 스캐너로 획득하여 기계가 읽을 수 있는 문자로 변환하는 것이다. (참조: https://ko.wikipedia.org/wiki/%EA%B4%91%ED%95%99_%EB%AC%B8%EC%9E%90_%EC%9D%B8%EC%8B%9D) OCR을 하기 위해서 사용하는 것 중 하나로 Tesseract가 있다. 테서렉트는 다양한 운영체제에서 사용할 수 있는 광학 문자 인식 엔진이다. 아파치 라이선스 2.0에 따르는 무료 소프트웨어이며 2006년 부터 구글이 개발을 후원하고 있다고 위키피디아에 나와 있다. (참조..
[php] OCR / 이미지 글자 인식 (Tesseract OCR) [펌] Tesseract OCR이라는 라이브러리가 있다 c++로 작성 되있으며, 다른 언어들도 호환하는데 OS에 install 한 후 언어로 연결해주는 형태이다. 지금 윈도우를 쓰니까 윈도우 기준으로 설치를 진행해보겠다. https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows 에서 Windows Installer made with MinGW-w64 from UB Mannheim 를 다운-> 설치한다. 언어 셋팅하는게 있는데 난 중국어 일본어 한국어 이거 3개를 추가했다. 용량이 꽤 크다 . 언어 셋팅하니까 200MB가 더 증가함. 그다음 소스를..