เราน่าจะได้ยินคำว่า "เมทาดาตา (Metadata)" กันอยู่บ่อยครั้ง แต่อาจจะไม่รู้ว่ามันคืออะไร ? จนตามมาด้วยคำถามอย่าง "Metadata คืออะไร ?" หรือสงสัยว่า "มันมีความสำคัญขนาดไหน ?" คำนี้เราก็มีการเอ่ยถึงอยู่บ่อยครั้ง แต่ก็ไม่เคยอธิบายว่ามันคืออะไรอย่างละเอียดเสียที
บทความนี้ก็เลยจะถือโอกาสมาเล่าสู่กันฟังว่า Metadata นั้นหมายถึงอะไร ?
Metadata นั้นหากแปลเป็นไทยก็คือ "ข้อมูลเกี่ยวกับข้อมูล" อ่านแล้วอาจจะดูงง ๆ (ราวกับชื่อเพลงของวงเก็ตสึโนวา) แต่มันหมายความตามนั้นจริง ๆ โดยนิยามของมันคือ ข้อมูลที่มีไว้เพื่ออธิบายรายละเอียดของข้อมูล เพื่อนำไปช่วยในการบริหาร และจัดการข้อมูลต่าง ๆ ซึ่งก็มีอยู่หลายอย่างขึ้นอยู่กับว่ามันต้องอธิบายรายละเอียดของข้อมูลชนิดไหน
โดยทั่วไปก็จะระบุรายละเอียดไฟล์ว่าเป็นไฟล์ประเภทไหน (File Type), ขนาดไฟล์ (File Size), วันที่แก้ไขล่าสุด (Last Modified) ฯลฯ แต่มันก็สามารถเก็บข้อมูลอื่น ๆ เพื่อให้เหมาะสมกับเนื้อหาของไฟล์ได้ด้วย เช่น หากเป็นไฟล์เอกสารก็อาจจะมีข้อมูลชื่อผู้แต่ง หากเป็นไฟล์รูปก็จะมีข้อมูลกล้องที่ถ่าย, เลนส์ที่ใช้ถ่าย ฯลฯ นั่นเป็นเหตุผลให้ Metadata มีอยู่หลายรูปแบบขึ้นอยู่กับจุดประสงค์ในการนำไปใช้งาน
ข้อมูล Metadata เป็นรากฐานสำคัญของเทคโนโลยีหลายอย่างที่ใช้งานในปัจจุบัน มีใช้กันทั้งในชีวิตประจำวัน และในการทำงาน อย่างในระบบองค์กรที่มีปริมาณไฟล์ดิจิทัลในระบบจำนวนมหาศาล หากไม่มี Metada มาช่วย การดูแลไฟล์ หรือค้นหาไฟล์ที่ต้องการใช้งานจะต้องมีความโกลาหลอย่างแน่นอน
ภาพจาก : https://dataedo.com/kb/data-glossary/what-is-metadata
Jack E. Myers ผู้ก่อตั้งบริษัท Metadata Information Partners (ปัจจุบันคือ The Metadata Co.) ได้อ้างว่าเขาเป็นผู้ริเริ่มคำนี้ขึ้นมาในปี ค.ศ. 1969 (พ.ศ. 2512) และได้ยื่นจดเครื่องหมายการค้าคำว่า "Metadata" ในปี ค.ศ. 1986 (พ.ศ 2529) อย่างไรก็ตาม จากการสืบค้นพบว่าคำนี้มีการใช้มาก่อนหน้านั้น
ในบทความวิชาการที่เผยแพร่ออกมาในปี ค.ศ. 1967 (พ.ศ. 2510) David Griffel และ Stuart McIntosh จากสถาบันเทคโนโลยีแมสซาชูเซตส์ (Massachusetts Institute of Technology (MIT)) ได้มีการอธิบายถึงคำว่า Metadata เอาไว้ว่ามันเป็น "บันทึกรายละเอียดของการบันทึกข้อมูล" เพื่อรวบรวมเป็นบรรณานุกรม ช่วยให้คอมพิวเตอร์สามารถตีความข้อมูล และเข้าใจบริบทที่มีร่วมกันระหว่างข้อมูลต่าง ๆ ได้ ซึ่งเป็นการตีความที่แตกต่างจาก Jack E. Myers ผู้มองว่า Meta เป็นเพียงคำนำหน้าของ Data เท่านั้น
แต่ถ้าเอ่ยถึงการปรากฏขึ้นของคำนี้เป็นครั้งแรก ก็ต้องย้อนไปก่อนหน้านั้นอีกเล็กน้อย ในปี ค.ศ. 1964 (พ.ศ. 2507) ในวิทยานิพนธ์ของนักศึกษาระดับปริญญาตรีสาขาวิทยาการคอมพิวเตอร์ ได้นำเสนอแนวคิดว่า "การสร้างองค์ประกอบของข้อมูลที่ทำงานร่วมกันได้ มันก็ขึ้นอยู่กับว่าเราจะเชื่อมโยงมันให้เข้ากันได้ดีมากขนาดไหน ?" ซึ่งเราอาจจะเรียกมันว่า "Metadata Element"
แตแต่ถึงอย่างไรก็ตาม วิทยานิพนธ์ของเขาถูกปฏิเสธไป แต่ท้ายที่สุดแล้ว มันก็ถูกตีพิมพ์ออกมาในปี ค.ศ. 1969 (พ.ศ. 2512) ภายใต้สัญญากับสำนักงานวิจัยวิทยาศาสตร์ของกองทัพอากาศสหรัฐฯ ( U.S. Air Force Office of Scientific Research)
ในการใช้งาน Metadata ให้เกิดประโยชน์ จะต้องมีการจัดเก็บข้อมูลตามข้อกำหนดลงในฐานข้อมูลอย่างเป็นระเบียบ แม้ Metada จะมีหลายรูปแบบ แต่คุณสมบัติในการทำงานหลักของมันก็จะเหมือนกัน ดังต่อไปนี้
Metadata จะอธิบายข้อมูลของ "ข้อมูล (Data)" อย่างละเอียด โดยมีมาตรฐานที่ถูกกำหนดไว้เพื่อให้การจัดเก็บ (Repository) มีความเป็นระเบียบง่ายต่อการจัดการ และนำไปใช้งานต่อ อย่างเช่น การดึงข้อมูลประเภทเดียวกันมารวมไว้ในชีต (Sheet), การสร้างอัลบัมรูปอัตโนมัติโดยอ้างอิงจากเวลาที่ถ่ายภาพ, หรือทำรายการข้อมูลสินค้าตามประเภท ฯลฯ
หน้าที่หลักที่สำคัญที่สุดของ Metadata คือการสรุปข้อมูลของไฟล์ให้อยู่ในรูปแบบที่เรียบง่าย ผู้ใช้สามารถเข้าถึงไฟล์ที่ต้องการได้อย่างง่ายดายด้วยการค้นหาจาก Metadata ที่มีอยู่ และยังใช้ในการจัดกลุ่มข้อมูลที่เหมือนกัน เพื่อแยกประเภทข้อมูลได้อย่างรวดเร็ว
เรารู้กันดีว่าฐานข้อมูลที่เรามีมันจะมีขนาดใหญ่ขึ้นเรื่อย ๆ ในการบริหารข้อมูลที่เรานิยมใช้งานกันก็จะมีอยู่หลายวิธี เช่น พิจารณาจากอายุไฟล์, การแก้ไขล่าสุด, สิทธิ์ในการใช้งาน ฯลฯ ซึ่งข้อมูลเหล่านี้จะมีเก็บไว้ใน Metadata ด้วย ทำให้การตรวจสอบข้อมูลทำได้โดยสะดวก รู้ว่าไฟล์ไหนยังต้องเก็บไว้, ไฟล์ไหนรอวันเรียกใช้งานอีกครั้ง และไฟล์ไหนที่สามารถลบทิ้งได้ ฯลฯ
การใช้วิธีเก็บข้อมูล Metadata ที่มีมาตรฐาน เป็นประโยชน์ต่อการนำไปใช้งานต่อร่วมกับ ส่วนต่อประสานโปรแกรมประยุกต์ (API) ของซอฟต์แวร์ หรืออุปกรณ์อื่น ๆ เช่น เราถ่ายรูปจากกล้องดิจิทัล ข้อมูลของภาพถ่ายอย่างความละเอียด, ระยะเลนส์ที่ใช้, ค่า ISO ฯลฯ เมื่อนำไปเปิดดูในซอฟต์แวร์ตกแต่งภาพ ก็จะต้องอ่านข้อมูลเหล่านั้นได้
Metadata นั้นมีอยู่หลายประเภท แต่อาจแบ่งออกเป็นประเภทใหญ่ ๆ ได้ดังนี้
ประเภทแรกของ Metadata คือ Structural Metadata เป็นส่วนที่จะเก็บข้อมูลที่ช่วยในการเชื่อมการทำงานระหว่างวัตถุต่าง ๆ ที่อยู่ภายในไฟล์นั้น ๆ ทำให้ผู้ใช้สามารถเข้าใจโครงสร้างของข้อมูลอย่างรวดเร็ว ตัวอย่างเช่น ในไฟล์เอกสารที่มี ตารางเนื้อหา, หน้า, หัวข้อเรื่อง, จำนวนหัวข้อ ฯลฯ
ดังนั้น การที่ข้อมูลเหล่านี้เชื่อมโยงหากันได้จะต้องอาศัยข้อมูลจาก Structural Metadata การที่เราสามารถคลิกหัวข้อบนสารบัญ แล้วกระโดดข้ามไปเนื้อหาดังกล่าวได้ทันที ก็เพราะสิ่งนี้นี่แหละ
Descriptive Metadata นำเสนอข้อมูลที่ช่วยให้การค้นหา หรือระบุแหล่งที่มาของข้อมูล โดยมันจะอธิบายว่านี่คือข้อมูลอะไร, สร้างเมื่อไหร่, สร้างจากไหน และใครสร้าง แล้วก็ยังมีข้อมูลเกี่ยวกับบริบทของเนื้อหาอีกด้วย
โดยมากแล้วก็จะจัดเก็บตามมาตรฐาน ที่นิยมก็อย่างเช่น มาตรฐาน Dublin Core Metadata Element Set (Dublin Core), MARC (MAchine-Readable Cataloging), MODS (Metadata Object Description Schema), Categories for the Description of Works of Art (CDWA), VRA Core Categories ฯลฯ โดยแต่ละมาตรฐานได้ถูกออกแบบมาเพื่อการใช้งานที่แตกต่างกัน
ข้อมูลพื้นฐานของไฟล์ ไม่ว่าจะเป็นชื่อไฟล์, ขนาดไฟล์, ไอคอน, ปกอัลบัม, ประเภท Codec, มาตรฐานของ File Container ฯลฯ ข้อมูลเหล่านี้เรียกว่า Technical Metadata นั่นเอง
Administrative Metadata นำเสนอข้อมูลที่เป็นประโยชน์ต่อการบริหารทรัพยากรอย่าง ข้อมูลการจัดเก็บไฟล์, จัดการสิทธิ์ในการเข้าถึงไฟล์, ข้อมูลผู้ซื้อ-ขาย, ข้อมูลรูปแบบสัญญา ฯลฯ นอกจากนี้ Administrative Metadata ยังนิยมใช้ช่วยในการควบคุณภาพของการจัดเก็บ หรือสำรองข้อมูลไฟล์อีกด้วยเช่นกัน
ภาพจาก https://blog.devart.com/data-vs-metadata.html
ข้อมูลของ Preservation Metadata หมายถึงข้อมูลที่จำเป็นต่อการรวบรวม และเก็บรักษาทรัพยากรด้านข้อมูล โดยจะเกี่ยวข้องทั้งทรัพยากรที่เป็นกายภาพ และดิจิทัล เพื่อนำไปใช้ในการจัดการไฟล์ และปกป้อง สินทรัพย์ดิจิทัล (Digital Asset) ในระยะยาว
นอกจากนี้ Preservation Metadata ยังมีการบันทึกข้อมูลที่จำเป็นในการจัดการโครงสร้างไฟล์, แหล่งอ้างอิง และข้อมูลของผู้ที่เกี่ยวข้องเอาไว้อีกด้วย
Metadata ประเภทนี้นำเสนอข้อมูลที่ใช้ระบุแหล่งที่มาของข้อมูล ซึ่งรวมไปถึงสิทธิ์ความเป็นเจ้าของไฟล์, ความเปลี่ยนแปลงที่เกิดขึ้น, การนำไฟล์ไปใช้ และข้อมูลการจัดเก็บ ซึ่งข้อมูลเหล่านี้จะช่วยให้การตรวจสอบอายุของทรัพยากรมีความแม่นยำมากขึ้น
Provenance metadata จะถูกสร้างขึ้นทุกครั้งเมื่อไฟล์มีการเปลี่ยนแปลง และบันทึกข้อมูลอ้างอิงถึงไฟล์เวอร์ชันเดิมด้วย ช่วยให้ผู้ใช้ค้นหาไฟล์ต้นฉบับได้อย่างรวดเร็ว
ภาพจาก : https://blog.diffbot.com/knowledge-graph-glossary/data-provenance/
Definitional Metadata หมายถึง Metadata ที่ช่วยอธิบายความหมายของข้อมูล เพื่อช่วยให้ผู้ใช้งานเข้าใจข้อมูลที่อาจเป็นข้อมูลเฉพาะทางได้ง่ายขึ้น หรืออาจจะบอกที่มาของข้อมูลว่ามีที่มาที่ไปอย่างไร ? อาจรวมถึงโครงสร้างการทำงานของไฟล์ด้วยก็ได้
|
แอดมินสายเปื่อย ชอบลองอะไรใหม่ไปเรื่อยๆ รักแมว และเสียงเพลงเป็นพิเศษ |