Acrobat - 스캔 & 캡쳐한 책 이미지를 PDF로 만들고 OCR 처리하기

Notice

블로그를 소개합니다

Recent Posts

Recent Comments

Today

Total

« 2024/05 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

관리 메뉴

Binnamoo Studio

Acrobat - 스캔 & 캡쳐한 책 이미지를 PDF로 만들고 OCR 처리하기 본문

Study Note/Indesign & Office

Acrobat - 스캔 & 캡쳐한 책 이미지를 PDF로 만들고 OCR 처리하기

binnamoo 2019. 5. 10. 23:42

동네도서관의 eBook을 온라인으로 빌려서 아이패드로 읽는 경우가 종종 있다. 도서관에서 빌린 eBook은 14일이 지나면 반납을 해야하는데 그 중에는 정말 보관해두고 나중에 다시 읽고 싶은 책들이 있다.

   그런 경우에 아이패드로 책의 필요한 부분을 이미지 캡쳐하고 PDF로 만들어 원드라이브에 올려놓고 필요할 때 아이패드에서 꺼내 읽는 방법을 사용한다. 물론 캡쳐한 자료는 개인용도로만 사용해야하고 외부에 유출하면 절대 안된다.

   PDF를 만드는 방법은 여러가지 많지만 나는 나중에 PDF를 읽을 때 필요한 부분을 검색하거나 텍스트를 복사해서 사용할 수 있도록 OCR 처리까지 동시에 병행하기 위해 Acrobat DC를 이용한다. Acrobat을 이용해서 PDF를 만드는 방법을 알아보자.

1. Acrobat을 열고 메뉴에서 Create > Combine Files into a Single PDF 를 클릭한다.

2. Add Files 버튼을 클릭해서 미리 캡쳐하거나 또는 스캔한 이미지의 폴더를 열어 필요한 파일들을 선택을 한 뒤에 열기를 클릭한다.

3. 그런 다음에 Combine 버튼을 눌러 파일을 하나의 PDF로 결합한다.

4. 이제 OCR처리를 해서 PDF를 인식이 가능한 문자로 바꾸는 작업을 한다. 오른쪽 하단의 Enhance Scsns를 클릭하고 이어서 아래와 같이 Recognize > In This File을 선택한다.

5. 그리고 세팅을 열어 한국어, 검색가능한 이미지로 조건을 선택하고 Recognize Text 버튼을 불러 이미지 > 문자 변환작업을 실행한다.

6. 최종 PDF 결과물을 원하는 이름으로 저장한다. 끝~

그런데 변환할 페이지수가 너무 많아서인지 Text 변환 작업 도중에 프로그램이 자꾸 죽어서, 이미지를 두 파트로 나누어 각각 PDF 및 OCR 작업을 한 뒤에 나중에 2개의 PDF 파일을 하나의 PDF로 병합하는 작업을 해야했다.

여러개의 PDF 파일을 하나로 합치기

1. 합치려는 모든 PDF 파일을 불러온다. 내가 직접 해 본 결과 PDF가 합쳐지는 순서는 나중에 불러온 파일이 앞에 오고 먼저 불러온 파일이 뒤에 오는 바람에 많이 햇갈렸다. 순서를 정하는 방법이 보이지 않았다. 아무튼 파일을 불러온 다음에 우측 패널의 Combine Files를 클릭한다. (책 표지는 일부러 블러 처리함)