จุดที่เราชอบ
| จุดที่เราไม่ชอบ
|
OCR (Optical character recognition) เป็นเทคโนโลยีที่เชื่อว่าคนที่ทำงานเกี่ยวกับเอกสารน่าจะรู้จักกันเป็นอย่างดี แต่ขอเล่าความสามารถของมันสักหน่อย เพื่อให้คนที่ยังไม่รู้จักได้เข้าใจด้วย
เทคนิค OCR ใช้ในการ "ดึง" ตัวอักษรที่อยู่ใน "รูปภาพ" ออกมาเป็นข้อความที่สามารถแก้ไขต่อได้บนคอมพิวเตอร์ อย่างเช่น อาจารย์แจกชีทประกอบการสอนมาให้แผ่นนึง หากเราต้องการนำข้อความในชีทแผ่นดังกล่าวไปเข้าโปรแกรม Word แทนที่เราจะมานั่งพิมพ์เองทีละตัวอักษร เราก็ใช้โปรแกรม OCR ดึงตัวอักษรออกจากภาพเลย จะเร็วกว่าเยอะเลย
อันที่จริงโปรแกรม OCR มีให้เลือกใช้เพียบ มีทั้งฟรี และไม่ฟรี แต่เหตุผลที่เราแนะนำให้ใช้ Google Drive ในการทำ OCR ก็เพราะว่า มันฟรี และรองรับภาษามากถึง 226 ภาษา (รวมภาษาไทยด้วย)
เท่าที่เราทดสอบ การแปลงไฟล์รูปภาพ ทำได้แม่นยำมาก หากเป็นตัวหนังสือที่เรียบง่าย และมีทิศทางที่ชัดเจน
ลองใช้กับภาพยากๆ ฟอนต์แปลกๆ หรือเป็นลายมือ ก็ยังพยายามแปลงมาให้ แม้ไม่สมบูรณ์ แต่ผลลัพธ์ก็น่าพึงพอใจพอสมควร
ทดลองแปลง PDF พบว่าหมวดหมู่ถูกสร้างแยกมาให้อัตโนมัติ แต่อย่างไรก็ตาม พบว่าหากเป็นภาษาไทย วรรณยุกต์จะหายไป
ทางแก้ที่พบ คือ กดปุ่ม Printscreen เซฟหน้าที่จะแปลงให้เป็นรูปภาพเสียก่อน แล้วค่อยทำ OCR
ความสามารถในการ OCR ของ Google Drive ทำงานได้ดีอย่างน่าทึ่ง จับฟอนต์ได้หลากหลาย แถมใช้งานได้ฟรี (แต่เสียค่าอินเทอร์เน็ต) ใครที่ยังไม่เคยใช้ ก็ลองใช้กันดูนะครับ :)
|
แอดมินสายเปื่อย ชอบลองอะไรใหม่ไปเรื่อยๆ รักแมว และเสียงเพลงเป็นพิเศษ |