เราจะสามารถเพิ่มความแม่นยำของ OCR ได้อย่างไร?
ในปัจจุบัน เทคโนโลยี OCR ได้เข้ามามีบทบาทสำคัญต่อองค์กร และอุตสาหกรรมต่างๆ ด้วยการช่วยจัดการเอกสาร ด้วยการแปลงข้อความบนเอกสาร ให้เป็นข้อมูลดิจิทัล ซึ่งจะช่วยลดความยุ่งยาก และความผิดพลาดในการคีย์ข้อมูลในรูปแบบเก่าๆ แต่การที่จะให้ OCR สามารถอ่านข้อมูลได้อย่างถูกต้องแม่นยำนั้น ต้องอาศัยปัจจัยใดบ้าง ในบทความนี้เรารวบรวมมาไว้แล้ว
5 ปัจจัยที่ทำให้ เทคโนโลยี OCR มีความแม่นยำมากยิ่งขึ้น
การใช้เทคโนโลยี OCR ให้มีคุณภาพ และมีความแม่นยำมากยิ่งขึ้น มีปัจจัยขึ้นอยู่กับความชัดเจนของข้อมูลบนเอกสาร โดยปัจจัยที่เพิ่มความแม่นยำให้ OCR มีดังนี้
1. คุณภาพของภาพต้นฉบับ
เทคโนโลยี OCR จะไม่สามารถทำงานได้อย่างแม่นยำหากข้อมูลต้นฉบับบนเอกสารที่ต้องการแสกน ไม่มีคุณภาพเพียงพอ เพราะหากข้อมูลบนเอกสารที่ไม่ชัดเจน อาจทำให้ OCR อ่านข้อมูลผิดพลาด หรือคลาดเคลื่อนได้
ซึ่งวิธีการทดสอบคุณภาพของเอกสารต้นฉบับว่ามีคุณภาพเพียงพอหรือไม่ สามารถพิจารณาจากสายตาของมนุษย์ หากเราสามารถมองเห็นข้อมูลบนเอกสารอย่างชัดเจน และความชัดของข้อความบนเอกสารไม่ต่ำกว่า 20 พิกเซล ยิ่งหากคุณภาพของเอกสารชัดมากแค่ไหนก็ยิ่งช่วยเพิ่มประสิทธิภาพความแม่นยำของ OCR ได้มากเท่านั้น
2. การปรับขนาดที่เหมาะสม
เนื่องจากเอ็นจินของเทคโนโลยี OCR ต้องอาศัยการอ่านข้อมูลในรายละเอียดที่เหมาะสม นอกจากคุณภาพของตัวเอกสารแล้ว ขนาดของข้อความก็ต้องมีความเหมาะสม โดยขนาดของตัวอักษรที่เหมาะสมจะต้องมีขนาด 1/10 ของต้นฉบับ หรืออย่างน้อย 300 DPI ขึ้นไป (Dots Per Inch) หากข้อความมีขนาดต่ำกว่า 300 จะทำให้ OCR สามารถอ่านข้อมูลได้แม่นยำน้อยลง
APPMAN OCR+ ใช้เทคโนโลยี OCR ที่มีประสิทธิภาพสูง โดยสามารถอ่านภาพและเอกสารได้อย่างแม่นยำ แม้ว่าเอกสารนั้นจะมีความละเอียดต่ำกว่า 300 DPI ซึ่งรองรับการใช้งานที่ความละเอียดต่ำสุดที่ 144 DPI
3. ภาพแตก ความไม่ชัดเจนของข้อความ และพื้นหลัง
อีกหนึ่งปัจจัยที่ส่งผลให้เทคโนโลยี OCR ไม่สามารถอ่านข้อมูลได้อย่างแม่นยำ คือเอกสารที่มีภาพแตก ไม่ชัดเจน ที่อาจเกิดขึ้นจากการขยายขนาดข้อความจนใหญ่เกินไป เกินกว่าที่คุณภาพของไฟล์ จนทำให้ไม่สามารถอ่านข้อความบนเอกสารได้แม่นยำเท่าที่ควร
นอกจากนี้อีกปัจจัยที่ลดความแม่นยำของเทคโนโลยี OCR คือเอกสารที่มีภาพพื้นหลัง และข้อความที่กลมกลืนกัน จนไม่สามารถแยกความแตกต่างระหว่างตัวหนังสือและพื้นหลังได้ ดังนั้นเพื่อเพิ่มความแม่นยำให้ OCR ควรทำให้ตัวหนังสือ และพื้นหลังแยกจากกันอย่างชัดเจนมากยิ่งขึ้น
4. สิ่งรบกวนการอ่านข้อมูล
นอกจากปัจจัยภายในจากข้อมูลของเอกสารที่มีผลต่อความแม่นยำของเทคโนโลยี OCR แล้ว ปัจจัยภายนอกยังส่งผลต่อการทำงานไม่แพ้กัน เพราะหากทำการแสกนเอกสารในทำเล หรือพื้นที่ที่ไม่เหมาะสมอาจทำให้เกิดสิ่งรบกวนการทำงานของ OCR ได้ เช่น แสงไฟที่สว่างจนเป็นเงากระทบบนกระดาษจนมองไม่เห็นข้อความบนเอกสาร หรือหากในระหว่างแสกนเอกสารนิ่วมือบังข้อความ ก็เป็นปัจจัยที่ทำให้ OCR อ่านข้อความผิดเพี้ยนได้
ดังนั้นการให้เทคโนโลยี OCR ให้มีความแม่นยำมากยิ่งขึ้น ควรเลือกสถานที่การแสกนที่เหมาะสม ไม่มีแสง หรือสิ่งรบกวนที่บดบังเนื้อหาข้อความบนเอกสาร เพื่อให้ตอนที่แสกนเอกสารได้ข้อความที่เคลียร์ชัดเจน ทำให้ได้ข้อมูลดิจิทัลที่ถูกต้อง ชัดเจน ครบถ้วน
5.เอกสารไม่เอียง หรือกลับหัว
การจัดวางองศาของภาพเป็นอีกปัจจัยที่ส่งผลต่อการทำงานของเทคโนโลยี OCR เพราะหากในระหว่างที่แสกนเอกสาร มีการจัดวางกระดาษเอียง หรือกลับหัว อาจทำให้ OCR ไม่สามารถเข้าใจเนื้อหาของข้อความบนเอกสารที่ผิดเพี้ยนไปจากปกติได้ ดังนั้นควรจัดวางเอกสารให้เป็นแนวตั้ง หรือแนวนอน ที่ OCR สามารถเข้าใจเนื้อหา และแปลงข้อมูลออกมาได้ถูกต้อง
สรุป
จะเห็นได้ว่าการเพิ่มความแม่นยำให้เทคโนโลยี OCR สามารถทำได้โดยการเพิ่มคุณภาพในการแสกนเอกสารในแต่ละครั้ง ตั้งแต่การเลือกสถานที่ที่เหมาะสม แสงที่เพียงพอ รวมถึงคุณภาพของข้อความบนเอกสารที่ชัดเจน เพียงเท่านี้ก็ทำให้การใช้งานเทคโนโลยี OCR เป็นไปอย่างมีประสิทธิภาพ หมดกังวลเรื่องความผิดพลาด