일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 맥
- 공모주
- 7월 공모주 청약 일정
- 코드이그나이터
- linux
- 주식 청약 일정
- 자바
- codeigniter
- Eclipse
- jquery
- MYSQL
- SQL
- Stock
- html
- 주식 청약
- 오라클
- php
- 리눅스
- Stock ipo
- JavaScript
- java
- IPO
- 주식
- css
- 공모주 청약
- 6월 공모주 청약 일정
- 제이쿼리
- Oracle
- 공모주 청약 일정
- 자바스크립트
- Today
- Total
개발자의 끄적끄적
[php] OCR / 이미지 글자 인식 (Tesseract OCR) [펌] 본문
[php] OCR / 이미지 글자 인식 (Tesseract OCR) [펌]
Tesseract OCR이라는 라이브러리가 있다
c++로 작성 되있으며, 다른 언어들도 호환하는데
OS에 install 한 후 언어로 연결해주는 형태이다.
지금 윈도우를 쓰니까 윈도우 기준으로 설치를 진행해보겠다.
https://github.com/tesseract-ocr/tesseract/wiki/4.0-with-LSTM#400-alpha-for-windows
에서
를 다운-> 설치한다. 언어 셋팅하는게 있는데 난 중국어 일본어 한국어 이거 3개를 추가했다.
용량이 꽤 크다 . 언어 셋팅하니까 200MB가 더 증가함.
그다음 소스를 composer로 가져오겠다.
https://github.com/thiagoalessio/tesseract-ocr-for-php
As a composer dependency
{ "require": { "thiagoalessio/tesseract_ocr": "1.1.0" } }
기본적으로 테스트 코드를 실행해보려하면 tesseract 를 찾을수 없다고
오류가 날것이다.
->executable('"D:\ProgramFiles\Tesseract-OCR\tesseract.exe"')
이런식으로 있는 경로에 대해서 쌍따옴표로 감싸줘서 경로 셋팅 후
echo (new TesseractOCR((__DIR__.'\images\admin.bmp')))->executable('"D:\ProgramFiles\Tesseract-OCR\tesseract.exe"')->lang('kor')->run()
이런식으로 실행해보면 된다.
이미지 경로 지정이야 알것이라 판단하고 lang 는 spread형태로 적어주면 된다.
('kor','eng','jpn') 이러한 형태로 만약 오류가 난다면 echo (new TesseractOCR((__DIR__.'\images\admin.bmp')))->executable('"D:\ProgramFiles\Tesseract-OCR\tesseract.exe"')->lang('kor') ->buildCommand()
이러한 형태로 build 를 해서 cmd 창에서 실행해보면 자세한 오류를 알수 있다.
다른 사람들은 잘 된다는데 난..
한글이 잘 인식이 안된다...
영어는 그럭저럭 인식이 되는거 같다.
'개발 > php' 카테고리의 다른 글
[php] mail send of 6 bytes failed with errno=10054 (0) | 2020.01.16 |
---|---|
[php] 메일발송하기 [펌] (0) | 2020.01.14 |
[php] 라이브러리(library) 사이트 (0) | 2020.01.08 |
[php] Windows 10 에 IIS 와 PHP 7 설치 및 연동하기 (0) | 2019.12.28 |
[PHP] Mcrypt 라이브러리 활용 암호화 시스템 [펌] (0) | 2019.12.27 |