แค่ขึ้นชื่อ OCR กับ OMR ก็ไม่คุ้นหูคุ้นตากันแล้ว แต่ถ้าบอกว่า นี่คือเทคโนโลยีที่เกี่ยวข้องกับเครื่องสแกนเนอร์ และ การตรวจข้อสอบแบบฝนดินสอ 2B หลายคนน่าจะเริ่มเอะใจขึ้นมาบ้าง และขอบอกเลยว่า เทคโนโลยี OCR และ OMR อยู่ในชีวิตประจำวันของทุกคนมานานแล้ว แต่อยู่ในรูปแบบไหน ใช้ประโยชน์อย่างไรไม่ว่าจะในภาคธุรกิจ ภาคประชาชน มาอ่านต่อกันเลย
OCR หรือ Optical Character Recognition หรือ ภาษาไทยคือ "การรู้จำอักขระด้วยแสง" เป็นเทคโนโลยีที่แปลงเอกสาร (Document), รูปภาพ (Picture) หรือแม้แต่ ลายเซ็นอิเล็กทรอนิกส์ (E-Signature) ให้อยู่ในรูปแบบตัวอักษร หรือ ข้อความ (Plain Text) ไฟล์ดิจิทัลที่สามารถสืบค้นได้ด้วยคำค้นหา (Keyword)
ยกตัวอย่าง ไฟล์เอกสารที่มาในรูปแบบ PDF มีข้อดีก็คือไม่สามารถปลอมแปลง แก้ไขได้ แต่ถ้าต้องการแก้ไขข้อความใด ๆ ในนั้นก็เป็นเรื่องยากลำบาก วิธีแก้ไขปัญหาก็คือ แปลงไฟล์ PDF ให้เป็น OCR ซะเลย ซึ่งวิธีการที่ทุกคนน่าจะคุ้นเคยก็คือ การนำแผ่นเอกสาร (Hard Copy) มาสแกนข้อความ ตัวอักษร เส้นตารางและอื่น ๆ ให้เป็นไฟล์ Word หรือ PDF ด้วยเครื่องสแกนเนอร์ (Scanner) หรือกล้องถ่ายภาพนั่นเอง
ภาพจาก : https://lengyi.medium.com/part-1-optical-character-recognition-with-tensorflow-and-keras-ocr-94c271c0a0a3
ส่วนการทำงานของ OCR นั้น หลัก ๆ คือ ใช้การจดจำรูปแบบ เพื่อกำหนดอักขระของแต่ละประเภทไฟล์ จากนั้น ซอฟต์แวร์จะทำการอ่านข้อความและอักขระ แล้วแปลงเป็นไฟล์ที่สืบค้นได้ นอกจากนี้ การทำงานของ OCR ยังขึ้นอยู่กับซอฟต์แวร์ที่ใช้ประมวลผล เพราะนอกเหนือจากการแปลงรูปภาพ อักขระใด ๆ เป็นข้อความแล้ว ซอฟต์แวร์บางตัวสามารถจัดวางรูปแบบข้อความในไฟล์ OCR ได้อีกด้วย
แล้วจะแปลงไฟล์ OCR ออกมาเป็นเอกสารได้ไหม ? คำตอบคือ ได้ แต่ไม่ 100% โดยเอกสารที่มาจาก OCR นั้นจะมีความไม่สมบูรณ์บางประการ ต้องมาพิมพ์ สะกดคำ จัดย่อหน้าใหม่ เช่น การแปลงไฟล์ PDF เป็น Word ที่อาจเป็นทางลัดสำหรับคนขี้เกียจพิมพ์งาน แต่เมื่อเจอไฟล์เอกสารของ Microsoft Word ที่สระลอย วรรณยุกต์หายเพราะแปลงมาจาก PDF เข้าไป บางคนอาจยอมกลับไปพิมพ์ Word ตาม PDF แบบอ่านไปพิมพ์ไปก็ได้
นอกจากนี้แล้ว OCR ยังแบ่งได้หลายแบบ ซึ่งหนึ่งใน OCR ที่น่าสนใจก็คือ ICR (Intelligent Character Recognition) เป็นเทคโนโลยีที่ช่วยจำแนกอักขระในข้อความได้อย่างละเอียด แม้จะเป็นข้อความที่เกิดจากลายมือมนุษย์ที่มักเขียนตัวอักษรไม่เหมือนกันเป๊ะ ๆ เช่น การจดจำตัวอักษรจากความตรง ความเอียงของเส้น หากซอฟต์แวร์จดจำได้ว่าตัวอักษรใดที่มีเส้นเฉียง 2 เส้น และคั่นด้วยเส้นแนวนอน ซอฟต์แวร์ก็จะจำแนกได้ว่าตัวอักษรตามเกณฑ์นี้คือตัว A
ภาพจาก : https://aigencorp.com/blog/what-is-ocr
OMR หรือ Optical Mark Recognition ภาษาไทยคือ "การรู้จำเครื่องหมายด้วยแสง" มาจากชื่อภาษาอังกฤษ จะเป็นการอ่านค่าของเครื่องหมายหรือตำหนิที่สร้างขึ้นมาแทนการอ่านอักขระ (OCR) โดยเครื่องหมายนั้น ๆ ไม่มีข้อมูล ข้อความใด ๆ อยู่ในนั้น แต่เครื่องมือที่ใช้อ่านข้อมูล OMR จะมีการระบุว่าตำแหน่งเครื่องหมายนั้น ๆ ร่วมด้วย
นอกจาก OMR ยังมีอีกชื่อหนึ่งว่า "Optical Mark Reader" หรือเครื่องมือสำหรับสแกนและอ่านค่าตำแหน่ง หลักการทำงานของเครื่อง OMR ก็คือ ภายในมีหัวอ่านเครื่องหมายด้วยแสงในตัว และอุปกรณ์นั้น ๆ ต้องมีซอฟต์แวร์สำหรับประมวลผลข้อมูล เช่น เครื่องสแกน (Scanner) ทั้งรูปแบบตั้งโต๊ะและพกพา (Portable Scanner)
อุปกรณ์ OMR ที่ทุกคนคุ้นเคยกันดีก็คือ เครื่องตรวจข้อสอบ สำหรับตรวจข้อสอบที่ใช้การป้ายสีตรงจุดเฉพาะ เช่น ข้อสอบที่ใช้ ดินสอ 2B หรือเข้มกว่าระบายในช่องคำตอบ แสงจากเครื่อง OMR ก็จะทำการตรวจตรงจุดที่ระบายดินสอไว้ แล้วประมวลผลคะแนนจากข้อสอบแต่ละชุดภายในเวลารวดเร็ว
ภาพจาก : https://www.cps.co.th/product/49024-42530/wac-omr
ความแตกต่างระหว่าง OCR และ OMR ก็คือ ลักษณะของข้อมูลในไฟล์ ในขณะที่ OCR คือ "การรู้จำอักขระด้วยแสง" แน่นอนว่าจะต้องมีอักขระ ข้อความที่สื่อความหมายอยู่ในนั้น ส่วน OMR คือ "การรู้จำเครื่องหมายด้วยแสง" นั่นแปลว่า OMR จะเน้นการสำรวจข้อมูลผ่านจุดที่ทำตำแหน่งเครื่องหมายไว้เป็นหลัก
ฉะนั้น ไฟล์ OCR จึงใช้อุปกรณ์อ่านข้อมูลที่ต่างกัน ทั้งการสร้างไฟล์ OCR ขึ้นมา ก็จะต้องใช้เครื่องสแกนอ่านข้อมูลบนกระดาษ พื้นผิวแล้วนำมาแปลงเป็นไฟล์ดิจิทัลที่อ่านได้โดยซอฟต์แวร์ ส่วน OMR ก็จะทำการอ่านข้อมูลจากจุดที่ซอฟต์แวร์กำหนดไว้ จัดเก็บและประมวลผลข้อมูลออกมา
เทคโนโลยี OCR ช่วยในการจัดเก็บข้อมูลที่สะดวก ประหยัดเนื้อที่ เนื่องจากเป็นการย่อขนาด ลดจำนวนแผ่นกระดาษด้วยการสแกนข้อมูลให้อยู่ในรูปแบบไฟล์ดิจิทัล สามารถสืบค้นได้อย่างง่ายดายผ่าน Keyword ที่ถูกกำหนดในไฟล์นั้น ๆ จัดเก็บบนพื้นที่คลาวด์ (Cloud Storage) ได้ ไม่ต้องเปลืองพื้นที่เก็บเอกสารแถมยังเข้าถึงได้ง่ายกว่า
แท้จริงแล้ว OCR เป็นเทคโนโลยีที่แทรกซึมอยู่ในหลาย ๆ อุตสาหกรรม ธุรกิจ ที่ต้องอาศัยข้อมูลจำนวนมาก ๆ เช่น ข้อมูลประวัติการรักษาของผู้ป่วยที่แพทย์ต้องใช้, ข้อมูลคดีของทนายความที่สามารถค้นหาจาก Keyword สำคัญได้เลย ช่วยประหยัดเวลาในการทำงานได้ดีทีเดียว
ส่วน เทคโนโลยี OMR เข้ามาช่วยจัดการเอกสารที่มีจำนวนมากได้อย่างรวดเร็ว จากตัวอย่างที่ชัดเจนก็คือการตรวจข้อสอบจำนวนมาก เพียงแต่ว่าต้องเตรียมเอกสารให้เข้ากับเครื่องมืออย่างตรวจข้อสอบ หากข้อสอบถูกฝนด้วยดินสอ 2B หรือมากกว่า การตรวจข้อสอบก็จะเป็นไปอย่างรวดเร็ว และยังมีซอฟต์แวร์ที่ช่วยประมวลผล บันทึกข้อมูลอย่างละเอียดอีกด้วย
เทคโนโลยี OCR และ OMR เป็นสิ่งที่อยู่คู่ทุกคนมานาน แต่อาจไม่เคยรู้มาก่อนว่ารายละเอียดของ OCR และ OMR นั้นเป็นอย่างไร และใครจะรู้ว่าเทคโนโลยีทั้งสองแบบนี้ มีความสำคัญและมีความหมายในชีวิตประจำวันเป็นอย่างยิ่ง
|
Web Content Editor ท่านหนึ่ง นิยมการเล่นมือถือเป็นชีวิตจิตใจ |