Data Quality (DQ)

Guru DQ เป็นบริการแก้ไขความผิดพลาดของข้อมูลในระบบที่มีข้อมูลจำนวนมหาศาล

ในระบบคอมพิวเตอร์ที่มีการใช้ข้อมูลจำนวนมาก และอาจจะต้องนำเข้าข้อมูลมาจากหลายแหล่ง จะประสบปัญหาเกี่ยวกับคุณภาพของข้อมูลหรือ Data Quality (DQ) ซึ่งทำให้ข้อมูลในระบบไม่สอดคล้องกันและหรือไม่ถูกต้องตามความเป็นจริง เช่นการที่ข้อมูลของบุคคลคนเดียวกันกลับถูกแยกกลายเป็นสองคนจากความผิดพลาดในด้านการสะกดตัวอักษร หรือการที่ที่อยู่ของผู้ใช้ไม่ถูกต้องจนอาจเป็นปัญหาต่อการทำงานของระบบอัตโนมัติ

 

กระบวนการแก้ไขความถูกต้องของข้อมูลจึงเป็นสิ่งที่ต้องกระทำอย่างหลีกเลี่ยงไม่ได้ แต่ปัญหาสำคัญก็คือกับข้อมูลปริมาณมหาศาลซึ่งแรงงานคนไม่สามารถจัดการได้หมด เราจะดูแลคุณภาพได้ด้วยวิธีใดกัน

เพื่อตอบสนองต่อปัญหาที่เกิดขึ้น จึงเกิดขึ้นมาเป็น Guru DQ อันเป็นเครื่องมือที่ถูกสร้างขึ้นมาสำหรับงานนี้โดยเฉพาะ ด้วยการวิเคราะห์ข้อมูลของ Guru DQ ในการเปรียบเทียบข้อมูลอย่างละเอียด จะช่วยให้สามารถแก้ไขข้อมูลที่มีอยู่เดิมได้อย่างถูกต้อง ครบถ้วน และมีประสิทธิภาพ และหลังจากที่ได้ปรับปรุงคุณภาพของข้อมูลเดิมแล้ว จะมีกระบวนการดูแลเพื่อป้องกันความผิดพลาดของข้อมูลใหม่ที่เข้ามาในระบบ ทำให้รักษาคุณภาพของข้อมูลให้มีความสมบูรณ์พร้อมที่จะใช้งานได้ตลอดเวลา

ตัวอย่างการทำงานของ Guru DQ

  • จัดข้อมูลให้อยู่ในรูปแบบมาตรฐานตรงกันได้ เช่น น.ส,น.ส.,นางสาว,นาวสาว แปลงข้อมูลระหว่างปีพุทธศักราชกับคริสตศักราช รูปแบบของวันเดือนปีและเวลา รูปแบบของเลขรหัสและการป้อนข้อมูลเช่นเลขโทรศัพท์มือถือ
  • ตรวจสอบคนๆเดียวกัน ที่มีชื่อต่างกันในหลายฐานข้อมูล เช่น สะกดชื่อผิด สุรพันธ์ -> สุรพันธุ์ หรือ เปลี่ยนนามสกุล วรรณา แซ่ตั้ง -> วรรณา ตั้งจิตดี
  • ใช้เทคโนโลยีที่สามารถจับค้นหาข้อมูลจากการพ้องเสียงพ้องรูปและความคล้ายกันของข้อมูลได้
  • แก้ไขที่อยู่ที่ใช้ทั่วไปที่สะกดผิดหรือไม่ตรงตามรูปแบบ เช่น ราชบุนี->ราชบุรี กทม.->กรุงเทพมหานคร