11/05/2018, 13:47

Hướng dẫn chuyển đổi văn bản từ file PDF và file Hình ảnh

Có một tài liệu PDF mà bạn muốn xuất ra thành văn bản? Hay một file ảnh bạn muốn lấy văn bản từ nó? Đây là vấn đề mà nhiều người hiện nay vẫn còn gặp khó khăn. Trong bài viết này,tôi sẽ hướng dẫn các bạn bằng nhiều cách khác nhau để có thể lấy văn bản từ file PDF và hình ảnh.Nhưng cũng tùy thuộc ...

Có một tài liệu PDF mà bạn muốn xuất ra thành văn bản? Hay một file ảnh bạn muốn lấy văn bản từ nó? Đây là vấn đề mà nhiều người hiện nay vẫn còn gặp khó khăn.
Trong bài viết này,tôi sẽ hướng dẫn các bạn bằng nhiều cách khác nhau để có thể lấy văn bản từ file PDF và hình ảnh.Nhưng cũng tùy thuộc vào chất lượng văn bản trong 2 loại file trên.
Hai phương pháp dưới đây thực hiện hoàn toàn trên Web,nên không cần tải về phần mềm nào cả.
ExtractPDF

ExtractPDF là công cụ miễn phí để lấy văn bản,hình ảnh từ file PDF.Nhược điểm của nó chỉ cho phép up file tối đa 10MB.Cách dùng công cụ này rất đơn giản,chỉ cần bạn chọn file PDF cần chuyển và nhấn Send.Quá trình xử lý sẽ tự động và nhanh chóng cho bạn kết bạn.Mặc khác,bạn có thể xem nội dung đã chuyển trước khi tải về ở mục Text.


Online OCR
Công cụ này có khả năng làm việc đa dạng hơn ExtractPDF.Bước đầu tiền bạn cần làm là truy cập và tạo một tài khoản miễn phí.Thường với người Việt Nam,họ không thích phải làm việc này.Nhưng bạn đừng lo,bởi khi sở hữu 1 tài khoản,bạn có thể chuyển đổi nhiều loại hơn ngoài PDF và tối đa file tải lên là 100MB.Trong khi đó nếu sử dụng như Guest thì bạn sẽ chỉ có 5MB tải lên và chỉ chọn được loại file PDF.

Đầu tiên, chọn ngôn ngữ và sau đó chọn loại định dạng nào bạn muốn cho các tập tin chuyển đổi. Bạn có một vài lựa chọn và bạn có thể chọn nhiều hơn một nếu bạn muốn. Theo tài liệu nhiều trang, bạn có thể chọn số trang và sau đó chỉ chọn các trang web mà bạn muốn chuyển đổi. Sau đó, bạn chọn tập tin và nhấn Convert!

Sau khi chuyển đổi, bạn sẽ được đưa đến phần Documents (nếu bạn đã đăng nhập), nơi bạn có thể xem có bao nhiêu trang mà bạn đã để lại và các liên kết miễn phí để tải về tập tin chuyển đổi của bạn. Tối đa chỉ có 25 trang miễn phí một ngày, vì vậy nếu bạn cần nhiều hơn , bạn sẽ phải đợi một thời gian hoặc mua thêm trang.




Online OCR đã làm một công việc tuyệt vời của việc chuyển đổi các file PDF vì nó có thể duy trì bố cục của văn bản. Tôi sẽ thử nghiệm, tôi lấy một tập doc Word cỡ chữ khác nhau, vv và chuyển đổi nó vào một PDF. Sau đó, tôi sử dụng Online OCR để chuyển đổi nó trở lại định dạng Word và nó đã được khoảng 95% giống như bản gốc. Đó là khá ấn tượng đối với tôi.


Thêm vào đó, nếu bạn đang tìm kiếm để chuyển đổi hình ảnh sang văn bản,Online OCR có thể làm điều đó dễ dàng như chiết xuất văn bản từ file PDF.

Trên đây là hai phương pháp đã được chọn lọc và khả quan.Hi vọng sẽ giúp ích cho các bạn

Nguồn : Vforum.vn(Theo online-tech-tips.com)
0