การจัดการข้อมูลด้วยคอมพิวเตอร์และฐานข้อมูล


ข้อมูล (Data) หมายถึง ความจริง (fact) ซึ่งสามารถบันทึกไว้ได้ และมีความหมายอยู่ในตัว
ข้อมูลถือได้ว่าเป็นหัวใจสำคัญของระบบงานคอมพิวเตอร์ เนื่องจากการประมวลผลทางคอมพิวเตอร์ทุกประเภทจะเป็นการประมวลผลข้อมูลในรูปแบบใดรูปแบบหนึ่ง เพื่อให้ได้รับผลลัพธ์ที่ต้องการออกมา หากข้อมูลที่ป้อนให้คอมพิวเตอร์ผิด ผลลัพธ์ที่ได้จากคอมพิวเตอร์ก็จะไม่มีคุณค่าอะไรเลย หรือที่เรียกว่า ป้อนขยะเข้าย่อมได้ขยะออกมา (garbage in - garbage out)
การศึกษาเรื่องของข้อมูล ทั้งในเรื่องของวิธีแทนข้อมูลในคอมพิวเตอร์ วิธีจัดเก็บข้อมูลตลอดจนวิธีการจัดข้อมูลซึ่งมีปริมาณมาก ๆ และมีความสัมพันธ์กัน เป็นหัวข้อพื้นฐานที่ผู้ศึกษาในเรื่องคอมพิวเตอร์ต้องทราบ เพื่อให้สามารถประยุกต์ใช้คอมพิวเตอร์ได้อย่างมีประสิทธิภาพสูงสุดต่อไป
ระบบคอมพิวเตอร์เป็นระบบที่ใช้สัญญาณทางไฟฟ้าในการทำงาน ทำให้มีสองสถานะคือเปิด (ON) และปิด (OFF) จึงต้องหาวิธีในการแทนที่สองสถานะนี้ นั่นคือการใช้เลขฐานสอง (Binary Number System) ซึ่งประกอบจากเลข 0 และ 1 แทนความหมายของข้อมูลต่าง ๆ หากพิจารณาเลขฐานสองเพียงหนึ่งหลัก จะเห็นว่าสามารถแทนข้อมูลได้เพียงสองชนิดเท่านั้นคือ 0 และ 1 ในขณะที่เลขฐานสองสองหลักจะสามารถแทนข้อมูลได้ 4 ชนิดคือ 00 , 01 , 10 และ 11 ดังนั้นหากต้องการใช้เลขฐานสองในการแทนข้อมูลจำนวนมาก เช่น นำมาแทนตัวอักษรต่าง ๆ ทั้งในภาษาไทยและภาษาอังกฤษ ก็จะต้องใช้เลขฐานสองจำนวนหลายหลัก
หน่วยเก็บข้อมูลสำรองของคอมพิวเตอร์จะเก็บข้อมูลในรูปของตัวเลขฐานสอง ซึ่งจะประกอบกันเป็นแฟ้มข้อมูลหรือ ไฟล์ (File) โดยที่ไม่ว่าจะใช้สื่อเก็บข้อมูลชนิดใดก็ตาม ทุกอย่างที่เก็บอยู่ในหน่วยเก็บข้อมูลสำรองต้องอยู่ในรูปของไฟล์ ไฟล์ก็คือบริเวณใดบริเวณหนึ่งบนหน่วยเก็บข้อมูลสำรองที่ถูกกำหนดให้เก็บโปรแกรมหรือข้อมูลต่าง ๆ นั่นเอง
ไฟล์สามารถแบ่งออกเป็นหลายชนิด การอ้างถึงไฟล์ต่าง ๆ สามารถอ้างด้วยชื่อของไฟล์นั้น ไฟล์หลาย ๆ ไฟล์จะถูกจัดเก็บไว้รวมกันอยู่ในไดเรกทอรี่ (Directory) หรือ โฟลเดอร์ (folder) ซึ่งเปรียบเสมือนตู้เอกสารที่เก็บเอกสารหลาย ๆ แฟ้มไว้ด้วยกัน และในหน่วยเก็บข้อมูลหนึ่ง ๆ อาจมีหลาย ๆ ไดเรกทอรี่ใด ซึ่งนิยมพิจารณาจากข้อมูลที่เก็บอยู่ในไฟล์เหล่านั้น โดยหากข้อมูลในไฟล์มีความสัมพันธ์กันก็จะจัดให้อยู่ในไดเรกเทอรี่เดียวกัน หากข้อมูลต่างประเภทกันก็ควรพิจารณาจัดไว้ในไดเรกทอรี่อื่น
จากปัญหาต่าง ๆ ที่เกิดขึ้นในระบบจัดการข้อมูลแบบไฟล์ ทำให้เกิดแนวความคิดที่จะสร้างระบบการจัดการข้อมูลแบบใหม่ ซึ่งสามารถทำการจัดการ ดูแลรักษา ตรลดจนเรียกใช้ได้อย่างรวดเร็วและมีประสิทธิภาพ อันจะทำให้งานการสร้างและใช้งานข้อมูลกระทำได้อย่างรวดเร็วและเสียค่าใช้จ่ายน้อยลง
ระบบการจัดการฐานข้อมูล หรือที่นิยมเรียกว่า ดีบีเอ็มเอส (DBMS) คือชุดของโปรแกรมคอมพิวเตอร์ที่ทำหน้าที่สร้าง ดูแลรักษา และใช้งานส่วนต่าง ๆ ของฐานข้อมูล ดังรูป

ระบบฐานข้อมูล

ระบบการจัดการฐานในระยะแรกจะถูกพัฒนาเพื่อใช้บนเครื่องเมนเฟรม แต่ในปัจจุบันสาารถพบได้ในคอมพิวเตอร์ทุกขนาด โดยมีอัตราการเติบโตของการใช้งานประมาณ 30-35% ต่อปี
โดยปกติแล้ว วิธีการเรียกใช้ ตลอดจนเพิ่มเติมหรือเปลี่ยนแปลงแก้ไขข้อมูลที่จัดเก็บไว้ในฐานข้อมูลมีวิธีต่าง ๆ ดังนี้
·            เชื่อมโยงกับภาษาการโปรแกรม (Programming Language Interfaces) นิยมใช้วิธีนี้ในการเขียนโปรแกรมที่ต้องมีการเรียกใช้หรือแก้ไขค่าของข้อมูลในฐานข้อมูล ตลอดจนการสร้างรายงานที่มีการคำนวณซับซ้อน อาจใช้ภาษาโคบอล (COBOL) ภาษาซี หรือภาษาในระดับสูงและสูงมากอื่น ๆ ในการเชื่อมต่อเข้ากับฐานข้อมูลก็ได้
·            ภาษาในการจัดการข้อมูล (Query language) เป็นภาษาที่ถูกออกแบบมาโดยเฉพาะให้ใช้กับฐานข้อมูล นิยมใช้กันมากในปัจจุบัน เพราะใช้ง่ายแลเรียกดูข้อมูลได้อย่างรวดเร็ว จัดเป็นภาษาในยุคที่ 4 ไม่ต้องมีการแปลภาษา (compile) หรือ เชื่อมโยง (link) ก่อนใช้งาน
·            ตัวรายงาน (Report Generator) ถูกออกแบบมาให้สร้างรายงานที่ซับซ้อนและมีขนาดใหญ่หรือยาวมากได้อย่างรวดเร็ว
·            โปรแกรมอรรถประโยชน์ของระบบ (System utilities) จะเป็นโปรแกรมที่ถูกใช้งานโดย ผู้จัดการระบบ (system manager) หรือที่นิยมเรียกว่า ผู้ดูแลระบบฐานข้อมูล (database administrator) โปรแกรมประเภทนี้นิยมใช้ในการ เก็บสำรอง (backup) ฐานข้อมูล เรียกข้อมูลจากฐานข้อมูล หรือจัดเก็บข้อมูลไว้ในฐานข้อมูลรวมทั้งการ เรียกคืน (restore) ข้อมูลในกรณีที่ระบบมีปัญหา
ฐานข้อมูลและระบบจัดการฐานข้อมูลที่อยู่บนเครื่องคอมพิวเตอร์เพียงเครื่องเดีวที่มีหน่วยเก็บข้อมูลสำรองอยู่ เรียกว่าเป็น ระบบฐานข้อมูลศูนย์กลาง (Centralized database system) เพราะอุปกรณ์ต่าง ๆ ของระบบติดตั้งอยู่บนเครื่องเพียงเครื่องเดียว หรือเรียกว่าไซต์ (site) เดียวเท่านั้น ถึงแม้ว่าฐานข้อมูลดังกล่าวอาจจะถูกเรียกใช้ข้อมูลจากเทอร์มินับระยะไกลที่ติดต่อเข้ามายังเครื่องส่วนกลางนั้น แต่ข้อมูลและระบบจัดการฐานข้อมูลยังคงทำงานอยู่บนเครื่องเพียงเครื่องเดียว
ในปัจจุบันมีการใช้ฐานข้อมูลจากหลาย ๆ เครื่องหรือหลายไซต์ โดยผ่านระบบเครือข่ายการสื่อสาร เรียกว่า ฐานข้อมูลแบบกระจาย (Distributed Database System หรือ DDBSs) ซอฟต์แวร์ที่ใช้ในการจัดการฐานข้อมูลแบบนี้เรียกว่า ระบบจัดการฐานข้อมูลแบบกระจาย (Distributed Database Management System หรือ DDBMS)
ฐานข้อมูลแบบกระจายเป็นที่รวมของข้อมูลซึ่งอยู่บนระบบเดียวกัน แต่ในทางกายภาพมีการจัดเก็บกระจายอยู่บนเครื่องคอมพิวเตอร์หลายเครื่องหรือหลายไซต์ และมีการเชื่อมต่อกันผ่านเครือข่ายคอมพิวเตอร์

0 ความคิดเห็น: