Database (ฐานข้อมูล) คืออะไร ?
คือระบบที่รวบรวมข้อมูลไว้ในที่เดียวกัน ซึ่งประกอบไปด้วยแฟ้มข้อมูล (File) ระเบียน (Record) และ เขตข้อมูล (Field) และถูกจัดการด้วยระบบเดียวกัน โปรแกรมคอมพิวเตอร์จะเข้าไปดึงข้อมูลที่ต้องการได้ อย่างรวดเร็ว ซึ่งอาจเปรียบฐานข้อมูลเสมือนเป็น electronic filing system
ฐานข้อมูล และคลังข้อมูล
โครงสร้างข้อมูล
บิต (bit) ย่อมาจาก Binary Digit ข้อมูลในคอมพิวเตอร์ 1 บิต จะแสดงได้ 2 สถานะคือ 0 หรือ 1 การเก็บข้อมูลต่างๆได้จะต้องนำ บิต หลายๆ บิต มาเรียงต่อกัน เช่นนำ 8 บิต มาเรียงเป็น 1 ชุด เรียกว่า 1ไบต์ เช่น
10100001 หมายถึง ก
10100010 หมายถึง ข
เมื่อเรานำ ไบต์ (byte) หลายๆ ไบต์ มาเรียงต่อกัน เรียกว่า เขตข้อมูล (field) เช่น Name ใช้เก็บชื่อ LastName ใช้เก็บนามสกุล เป็นต้น
เมื่อนำเขตข้อมูล หลายๆ เขตข้อมูล มาเรียงต่อกัน เรียกว่า ระเบียน (record) เช่น ระเบียน ที่ 1 เก็บ ชื่อ นามสกุล วันเดือนปีเกิด ของ นักเรียนคนที่ 1 เป็นต้น
การเก็บระเบียนหลายๆระเบียน รวมกัน เรียกว่า แฟ้มข้อมูล (File) เช่น แฟ้มข้อมูล นักเรียน จะเก็บ ชื่อ นามสกุล วันเดือนปีเกิด ของนักเรียน จำนวน 500 คน เป็นต้น
การจัดเก็บ แฟ้มข้อมูล หลายๆ แฟ้มข้อมูล ไว้ภายใต้ระบบเดียวกัน เรียกว่า ฐานข้อมูล หรือ Database เช่น เก็บ แฟ้มข้อมูล นักเรียน อาจารย์ วิชาที่เปิดสอน เป็นต้น
การเข้าถึงข้อมูลในฐานข้อมูลจึงจำเป็นต้องมีระบบการจัดการฐานข้อมูลมาช่วยเรียกว่า database management system (DBMS) ซึ่งจะช่วยให้ผู้ใช้สามารถจัดการกับข้อมูล ตามความต้องการได้
ในหน่วยงานใหญ่ๆอาจมีฐานข้อมูลมากกว่า 1 ฐานข้อมูลเช่น ฐานข้อมูลบุคลากร ฐานข้อมูลลูกค้า ฐานข้อมูลสินค้า เป็นต้น
ไบต์ (Byte) ประกอบด้วยบิตหลายๆ บิตมาเรียงต่อกัน เช่น นำ 8 บิตมาเรียงกันเป็น 1 ไบต์
เขตข้อมูล (Field) เป็นการนำข้อมูลหลายอักขระมารวมกันเป็นคำเพื่อให้เกิดความหมาย
ระเบียนข้อมูล (Record) คือ กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน ถูกนำมารวมกัน เช่น ระเบียนข้อมูลพนักงาน
ไฟล์ (File) คือ กลุ่มของระเบียนข้อมูลที่มีความสัมพันธ์กันถูกนำมาจัดเก็บไว้ด้วยกัน
ความซ้ำซ้อนของข้อมูล (Data Redundancy) การจัดเก็บข้อมูลมากกว่าหนึ่งแห่ง ทำให้ยากที่จะควบคุมถูกต้องตรงกันของข้อมูล
ความผูกพันระหว่างข้อมูลและโปรแกรม (Program-Data Dependence) คือ ความไม่เป็นอิสระของข้อมูล หากมีการเปลี่ยนแปลงโครงสร้างหรือวิธีการเรียกใช้ข้อมูลย่อมมีผลกระทบต่อโปรแกรม ทำให้ต้องตามแก้โปรแกรมต่างๆ ที่เกี่ยวข้องก่อให้เกิดค่าใช้จ่ายในการบำรุงรักษาโปรแกรมสูง
การไม่สามารถใช้ข้อมูลร่วมกันได้ (Lack of Data Sharing) ข้อมูลที่มีการจัดเก็บแยกจากกันโดนแต่ละส่วนงานจัดเก็บข้อมูลเป็นของตนเองทำให้ความซ้ำซ้อนของการใช้ข้อมูลอยู่ในระดับต่ำ ยากต่อการใช้งานร่วมกันได้
การขาดความคล่องตัว (Lack of Flexibility) ขาดการคล่องตัวในการตอบสนองต่อความต้องการใหม่ๆ เนื่องจากแฟ้มข้อมูลไม่สนับสนุนงานในรูปแบบที่ไม่เคยทำเป็นประจำ
การขาดระบบรักษาความปลอดภัยที่ดี (Poor Security) คือ การกำหนดว่าผู้ใช้รายใดสามารถเข้าถึงข้อมูลได้ในระดับใดได้บ้างจะทำได้ยากโดยการเขียนโปรแกรม วิธีรักษาความปลอดภัยของระบบแฟ้มข้อมูลมีขอบเขตความสามารถค่อนข้างจำกัด
แนวทางในการใช้ฐานข้อมูลในการบริหารจัดการข้อมูล
ลดความซ้ำซ้อน (Minimum Redundancy) การจัดเก็บของแฟ้มข้อมูลเป็นการจัดเก็บข้อมูลเดียวกันไว้หลายแห่ง ทำให้เกิดความซ้ำซ้อนของข้อมูล การนำข้อมูลมารวมกันเพื่อตัดหรือลดส่วนที่ซ้ำกันออกไปจะช่วยลดความซ้ำซ้อนของข้อมูลได้
- มีความเป็นอิสระของข้อมูล (Data Independence) DBMS ช่วยในการดูแลการปรับเปลี่ยนโครงสร้างของข้อมูล ทำให้โปรแกรมต่างๆ เป็นอิสระจากการเปลี่ยนแปลงโครงสร้างของข้อมูล
- สนับสนุนการใช้ข้อมูลร่วมกัน (Improved Data Sharing) การจัดเก็บข้อมูลไว้ในส่วนกลางช่วยให้สามารถใช้ข้อมูลร่วมกันได้ โปรแกรมประยุกต์ที่จะพัฒนาขึ้นใหม่สามารถใช้ข้อมูลที่มีอยู่แล้วได้โดยไม่จำเป็นต้องพิ่มข้อมูลเข้าไปในระบบอีก
- มีความคล่องตัวในการใช้งาน (Improved Flexibility) การเก็บข้อมูลในส่วนกลางจะช่วยใหม่มีความคล่องตัวในการใช้งานเพราะมี DBMS โดยทั่วไปจะมีเครื่องมือสนับสนุนในการสร้างแบบฟอร์มและรายงานต่างๆ ซึ่งช่วยลงขั้นตอนและเวลาในการจัดทำ
- มีระบบรักษาความปลอดภัยของข้อมูลสูง (High Degree of Data Integrity) ฐานข้อมูลมีระบบรักษาความปลอดภัยของข้อมูล โดย DBMS จะตรวจสอบรหัสผ่านเข้าสู่ระบบ และจะอนุญาตให้ผู้ที่มีสิทธิเข้ามาในระบบทำการเรียกดูข้อมูลหรือแก้ไขข้อมูลได้เฉพาะสิทธิที่กำหนดในแต่ละคนเท่านั้น
ระบบฐานข้อมูลประกอบด้วยองค์ประกอบหลัก 4 ส่วน คือ
1. ข้อมูล (Data) ข้อมูลและความสัมพันธ์ของข้อมูลที่จัดเก็บอยู่ในฐานข้อมูล
3. ซอฟต์แวร์ (Software) ระบบปฏิบัติการ (Operating Systems) และระบบจัดการข้อมูล (Database Management System : DBMS)
รูปแบบของฐานข้อมูล (Database Model)
แบบจำลองฐานข้อมูลลำดับชั้น (Hierarchical Database Model) มีโครงสร้างคล้ายโครงสร้างต้นไม้ (Tree Structure)
1. ข้อมูลมีความสัมพันธ์กันในลักษณะ One-to-Many
2. ข้อมูลจะได้รับการจัดเก็บในรูปของ Segment
3. Segment ที่อยู่บนสุดเรียกว่า Root Node ลงมาเรียกว่า Child Node
4. Node ระดับบนจะเป็น Parent Segment ของ Node
5. ระดับล่างลงมาโดยที่ Parent Segment สามารถมี Child Segment ได้มากกว่าหนึ่ง ในขณะที่ Child Segment จะขึ้นอยู่กับ Parent Segment เดียวเท่านั้น
ข้อดีและข้อจำกัด
แบบจำลองฐานข้อมูลเครือข่าย (Network Database Model)
โครงสร้างของข้อมูลที่นำเสนอเป็นลักษณะ Multi-List Structure โดยมีความสัมพันธ์ของข้อมูลเป็นแบบ Many-to-Many โดยที่ Segment สามารถมี Parent ได้มากกว่าหนึ่ง และจะเรียก Parent ว่า Owner ส่วน Child เรียกว่า Member
ข้อดีและข้อจำกัด
ความซ้ำซ้อนของข้อมูลมีน้อยกว่าแบบจำลองฐานข้อมูลลำดับชั้น สามารถเชื่อมโยงข้อมูลแบบไป-กลับได้ โดยใช้พอยน์เตอร์ วิธีนี้จะเปลืองเนื้อที่ในการจัดเก็บพอยน์เตอร์ และยังมีความยุ่งยากอยู่ในการเปลี่ยนแปลโครงสร้างข้อมูลที่มีความซับซ้อน
แบบจำลองฐานข้อมูลเชิงสัมพันธ์ (Relational Database Model)
แสดงโครงสร้างของข้อมูลในรูปแบบตาราง และเรียกตารางว่า รีเลชัน (Relation) โดยแต่ละรีเลชันประกอบด้วย แถวหรือทัพเพิล (Tuple) และ คอลัมน์ซึ่งเรียกว่า แอตทริบิวต์ (Attribute) ในแต่ละรีเลชันจะมีแอตทิรบิวต์หรือกลุ่มของแอตทริบิวต์ ซึ่งเรียกว่า คีย์ (Key)
ข้อดีและข้อจำกัด
มีโครงสร้างที่เข้าใจง่ายกว่าฐานข้อมูลอื่นๆ ผู้ใช้ไม่จำเป็นต้องเข้าใจถึงโครงสร้างการจัดเก็บข้อมูลทางกายภาพ ข้อมูลมีความเป็นอิสระจากโปรแกรม แต่ต้องใช้ฮาร์ดแวร์และซอฟต์แวร์ที่มีคุณภาพสูง
ระบบข้อมูลแบบกระจาย (Distributed Database)
ข้อมูลจัดเก็บไว้ที่เครื่องคอมพิวเตอร์หลายเครื่องตามพื้นที่ต่างๆ แทนที่จะเก็บไว้ที่ส่วนกลางเพียงแห่งเดียว เพื่อความคล่องตัวในการดำเนินงาน โดยเครื่องคอมพิวเตอร์เหล่านี้สามารถสื่อสารถึงกันได้
ข้อดีและข้อจำกัด
ข้อมูลสอดคล้องกับลักษณะการใช้งานจริง ทำให้สามารถเรียกใช้ข้อมูลได้อย่างรวดเร็ว แต่ข้อมูลแบบกระจายจะมีความซับซ้อนในการประมวลผลเพื่อเรียกใช้ข้อมูล การฟื้นสภาพ และการออกแบบฐานข้อมูลมากกว่าระบบฐานข้อมูลแบบรวม
ฐานข้อมูลแบบออบเจ็กต์ (Object-Oriented Database)
เรียกว่า ฐานข้อมูลเชิงวัตถุเกิดจากแนวคิดการเขียนโปรแกรมเชิงวัตถุ (Object-Oriented Program :OOP) เพื่อตอบสนองต่อความต้องการในการจัดเก็บข้อมูลที่มีความสลับซับซ้อน มีขนาดใหญ่ และมีความหลากหลายมากกว่าเดิม เช่น ข้อมูลเสียง รูปภาพ และ วีดิทัศน์
ข้อดีและข้อจำกัด
สามารถเก็บข้อมูลพื้นฐานทั่วไป ข้อมูลวัตถุ และข้อมูลมัลติมีเดียได้ง่าย แต่การประมวลผลรายการ ข้อมูลทั่วไปจะไม่รวดเร็วเท่ากับระบบฐานข้อมูลเชิงสัมพันธ์
คือ ที่เก็บรวบรวมข้อมูลจากหลายแหล่งและหลากหลายชนิด เข้าด้วยกัน เป็นฐานข้อมูลขนาดใหญ่ขององค์การ โดยข้อมูลในคลังข้อมูลอาจได้มาจากฐานข้อมูลของระบบปฏิบัติการในองค์การ และฐานข้อมูลจากแห่งภายนอกองค์การ ซึ่งข้อมูลเหล่านี้จะได้รับการเลือก, กลั่นกรอง และปรับแก้ไขทำให้เป็นมาตรฐานเดียวกัน
ดาต้ามาร์ท (Data Mart)
คือ คลังข้อมูลขนาดเล็กที่มีลักษณะเจาะจง สำหรับใช้ในองค์การธุรกิจ มีค่าใช้จ่ายต่ำกว่าคลังข้อมูล และการจัดทำข้อมูลดาต้ามาร์ท ใช้เวลาที่สั้นกว่าคลังข้อมูล และการนำไปประยุกต์ใช้ในการพัฒนาระบบสนับสนุนการตัดสินใจภายในหน่วยงาน สะดวกกว่าการใช้คลังข้อมูล
คือ การใช้ข้อมูลขององค์การที่มีคุณค่ามาช่วยสนับสนุนการตัดสินใจในการดำเนินงานของธุรกิจ ซึ่งโดยทั่วไปจะเกี่ยวข้องกับการเข้าใช้งานข้อมูล การวิเคราะห์ข้อมูล และการค้นพบโอกาสใหม่ๆ ในการดำเนินการทางธุรกิจ
การวิเคราะห์ข้อมูลหลายมิติและการค้นหาความรู้ในคลังข้อมูล
มี 2 ประเภท1. การประมวลผลเชิงวิเคราะห์แบบออนไลน์ (OLAP) เป็นเครื่องมือที่สามารถในการค้นหาและวิเคราะห์ข้อมูลจากคลังข้อมูลเพื่อตอบสนองความต้องการของผู้ใช้ได้อย่างรวดเร็ว
2. ดาต้าไมนิ่ง (Data Mining) เป็นเครื่องมือและเทคนิคในการสกัด (Extract) ข้อมูลและประมวลผลข้อมูลในเชิงวิเคราะห์ขั้นสูงจากฐานข้อมูลขนาดใหญ่ โดยสามารถค้นหารูปแบบ แนวโน้ม พฤติกรรม และความสัมพันธ์ที่ซ้อนเร้นอยู่ภายในข้อมูลเพื่อให้ความรู้ใหม่ๆ
ความแตกต่างระหว่างคลังข้อมูลกับฐานข้อมูลปฏิบัติการ
ฐานข้อมูลปฏิบัติการ (Operational Database) เป็นระบบที่นำมาช่วยในการรวบรวมและจัดเก็บข้อมูลรายการธุรกรรมจาการดำเนินงานประจำวัน ซึ่งแหล่งข้อมูลเหล่านี้นับวันจะเพิ่มปริมาณมากขึ้น จึงจำเป็นต้องจัดเก็บข้อมูลในอดีตลงในสื่อบันทักข้อมูลที่แยกเก็บต่างหาร เช่น จัดเก็บในเทป หรือ ดิสก์ที่มีความจุสูง
คลังข้อมูล เป็นแหล่งเก็บข้อมูลรวมข้ององค์การ ที่ได้รับการออกแบบมาให้มีความเรียบง่ายต่อการค้นหาและเรียกใช้ได้อย่างรวดเร็ว สามารถรองรับการวิเคราะห์ข้อมูลที่มีปริมาณมาก โดยข้อมูลมีการจัดเก็บในลักษณะที่รวบรวมจัดเก็บเป็นระเบียบตามเนื้อหา และแปรผันตามเวลา ซึ่งข้อมูลในคลังข้อมูลไม่สามารถซ้ำซ้อนได้ นำไปเป็นข้อมูลพื้นฐานให้กับระบบงานเพื่อการบริหารอื่นๆ

+of+19gr8.gif)







ขอบคุณนะ
ตอบลบที่เข้ามาเม้นให้
ดีดีจร้า
ตอบลบอ่านแล้วได้ความรู้เพิ่ม
เข้าใจง่าย
งัยก้เม้นกลับด้วยนะจ๊ะ
Good
ตอบลบเยอกก่าเค้าอิก อิอิ
เนื้อหาเยอะดีนะคร่า
ตอบลบเนื้อหาดี
ตอบลบมีสาระค่ะ
อ่านง่ายดี
ตอบลบมีสาระ
.......
สวยคร่า
ตอบลบมีสาระมากมาย
โอเค
ตอบลบเนื้อหาดี
มีสาระ
อืม ดีจร้ามีเนื้อหาสาระดี
ตอบลบน่าอ่านนะ
เนื้อหาดี
ตอบลบมีสาระ
อืม น่าอ่านดี
ตอบลบมีสาระดี