VNIT

Too lazy to think of a slogan

Trang chủ » Diễn Đàn » Hỏi đáp Tin học » Thuật ngữ Tin học và tiếng Việt trong CNTT » Recognize Vietnamese text using Tesseract OCR

Chủ đề đã bị khóa, bạn không thể xóa, sửa hay trả lời trong chủ đề này!

First Page Previous Page  1   2   3  Next Page Last Page
Locked Re: VietOCR
0
answer Gởi bởi quan (19:53 03-10-2010)
Bài: 390 / Điểm VCS: 376 /

VietOCR v3.0 Release

A Java GUI frontend for Tesseract OCR engine. The release includes the following updates:

* Upgrade Tesseract OCR engine to 3.0, which supports page layout analysis
* Replace old format (2.0x) language data with new format (3.0) language data

Nâng cấp Tesseract OCR engine lên 3.0, phiên bản mới tích hợp khả năng phân tích dàn trang. Như thế văn bản có nhiều cột có thể được xử lý.

Ngoài ra, động cơ mới Tesseract đã có thể nhận dạng được các ngôn ngữ Á Đông, như chữ Hán-Hàn-Nhật. Như thế, nhận dạng chữ Nôm là 1 khả năng có thể có.

http://code.google.com/...eract-ocr/downloads/list
Locked Re: VietOCR
0
answer Gởi bởi quan (9:54 14-11-2010)
Bài: 390 / Điểm VCS: 376 /

VietOCR.NET v1.9 Release

The release includes the following fixes and improvements:

* Integrate Hunspell library to provide spellchecking and spellcheck-as-you-type functionality
* Add support for a custom dictionary
* List in correct order files generated from PDF conversion

Phiên bản mới v1.9 tích hợp thư viện Hunspell để thêm khả năng duyệt chính tả Tiếng Việt trên kết quả nhận dạng.

http://vietocr.sf.net
Locked Re: Recognize Vietnamese text using Tesseract OCR
0
answer Gởi bởi morphine (20:52 26-01-2011)
Bài: 3 / Điểm VCS: 2 /

Cảm ơn vì cập nhật thông tin. Phát huy nha bạn

Thân.
Locked Re: VietOCR
0
answer Gởi bởi quan (18:13 06-02-2011)
Bài: 390 / Điểm VCS: 376 /

VietOCR v2.0/3.1 & VietOCR.NET v2.0 Releases

A Java/.NET GUI frontend for Tesseract OCR engine. The releases include the following fixes and improvements:

* Add support for spellcheck suggestion in context menu
* Improve program accessibility and usability
* Add support for downloading and installing language data packs and appropriate spell dictionaries
* Update Tesseract OCR engine to 3.01 (r551) (v3.1 only)

Phiên bản này tăng tính thân thiện của chương trình và thêm phần hỗ trợ đề ý sửa lỗi chính tả trên kết quả OCR.

http://vietocr.sf.net
Locked Re: Ds-b
0
answer Gởi bởi phuongvan1 (22:35 24-02-2011)
Bài: 2 / Điểm VCS: 1 /

Hiện Vietnamese language data cho Tesseract chỉ gồm hỗ trợ cho các font tiêu chuẩn: Times New Roman, Arial, Verdana, và Courier New. Trên hình ảnh tốt với bốn fonts nêu trên, kết quả OCR chính xác trên 97% cho Tiếng Việt; tuy nhiên, OCR cho hình ảnh có font chữ khác với bốn font hỗ trợ sẽ cho kết quả chính xác suy giảm rõ rệt. Số lượng và kiểu dáng font chữ Việt lại phong phú và đa dạng, cho nên bộ data tiêu chuẩn không thể nào đáp ứng nhu cầu thực tế.

Việc tạo language data tuy không khó khăn lắm và không cần phải lập trình nhưng đòi hỏi nhiều công sức, cần sự đóng góp của nhiều người. Cách thức tạo language data được tóm lược tại Train Tesseract - Tập huấn Tesseract. Mong các bạn hưởng ứng tham gia.
[url=http://ds-b.jp/]ホームページ製作[/url]
[url=http://ds-b.jp/]ホームページ制作[/url]
[url=http://ds-b.jp/]ホームページ作成[/url]
[url=http://ds-b.jp/]ホームページ作成ソフト[/url]
[url=http://ds-b.jp/]ホームページセミナー[/url]
[url=http://ds-b.jp/]CMS[/url]
[url=http://ds-b.jp/]ビジネスブログ[/url]
Tinh nhu chiec la
Locked Re: VietOCR
0
answer Gởi bởi quan (11:21 08-03-2011)
Bài: 390 / Điểm VCS: 376 /

VietOCR v2.0.1/3.1.1 & VietOCR.NET v2.0.1 Release

* Fix a bug which hangs the program if x.DangAmbigs.txt contains entries starting with an equal symbol
* Improve postprocessing performance by caching the word list used; reload only if changes
* Fix a bug that crashes the program when inline spellcheck suggests on empty text (.NET only)
* Incorporate Apple Java Extensions (Java only)

http://vietocr.sf.net
Locked Re: VietOCR
0
answer Gởi bởi quan (14:20 04-06-2011)
Bài: 390 / Điểm VCS: 376 /

VietOCR v2.0.3/3.1.3 & VietOCR.NET v2.0.3 Releases

* Improve program usability, enabling image nagivation and manipulation with keyboard
* Fix an installation issue that was unable to uninstall previous versions (.NET only)
* Fix an EOL issue that broke Remove Line Breaks functionality on Windows (Java only)
* Update Tesseract 3.01 to r585 (v3.1.3 only)
* Replace Vietnamese language pack with an improved version (v3.1.3 only)

Các phiên bản mới này sửa chữa nhiều bug vụn vặt trong các phiên bản cũ và thăng tiến tính khả năng sử dụng chương trình với bàn phím. Đáng lưu ý nhất là bản 3.1.3 Java đã được cải tiến quan trọng với bộ language data mới cho Tiếng Việt. Sự thay đổi này nâng mức chính xác của phân đoạn nhận dạng lên ngang hàng với mức chính xác của language data phiên bản 2.03.

http://vietocr.sf.net
Locked Re: VietOCR
0
answer Gởi bởi quan (20:58 28-06-2011)
Bài: 390 / Điểm VCS: 376 /

VietOCR.NET v3.0 Release

* Use command-line process to invoke Tesseract 3.01 (r585) binary executable
* Include improved Vietnamese language pack

Phiên bản mới sử dụng Tesseract engine 3.01, chạy ổn định hơn bản 2.0x và thêm hỗ trợ phân tích dàn trang.

http://vietocr.sf.net
Locked Re: VietOCR
0
answer Gởi bởi quan (20:55 02-08-2011)
Bài: 390 / Điểm VCS: 376 /

Các phiên bản VietOCR.NET v3.1 & VietOCR v3.1.4 mới được xuất bản.

http://vietocr.sf.net
First Page Previous Page  1   2   3  Next Page Last Page

Thống kê

Hiện tại web site có 85,780 thành viên. Xin chào đón thành viên mới nhất chimregiun.

Các thành viên đã tạo 62,759 chủ đề và 241,881 bài viết trong 30 box.

Hiện có 1 thành viên và 1 khách đang trực tuyến.

chimregiun

Template by styleshout / Icons by Tango Icon Library and FamFamFam.