ความหมายและประโยชน์ของคลังข้อมูล

1.      ความหมายและประโยชน์ของคลังข้อมูล 
คลังข้อมูล (data warehouse) คือ ฐานข้อมูลขนาดยักษ์ที่รวบรวมฐานข้อมูลจากหลายแหล่งหลายช่วงเวลา ซึ่งอาจมี schema แตกต่างกัน มาไว้รวม ณ ที่เดียวกัน (และใช้ schema เดียวกัน) โดยทั่วไปองค์การมักจะมีฐานข้อมูลใช้งานกันอยู่แล้ว ซึ่งฐานข้อมูลในองค์การทั่วไปจะมีลักษณะที่ค่อนข้างทันต่อเหตุการณ์เช่นฐานข้อมูลพนักงานก็จะเก็บเฉพาะพนักงานในปัจจุบันจะไม่สนใจข้อมูลพนักงานเก่าๆในอดีตซึ่งอาจจะมีข้อมูลอะไรบางอย่างที่มีประโยชน์สำหรับผู้บริหารในการวิเคราะห์ประสิทธิภาพและคุณลักษณะต่างๆ ขององค์การ นอกจากนี้แต่ละฐานข้อมูลมักถูกออกแบบมาใช้เก็บข้อมูลเฉพาะด้าน จึงมีข้อมูลเฉพาะบางส่วนขององค์การเท่านั้นและการทำงานกับฐานข้อมูลมักจะอยู่ในช่วงปีงบประมาณนั่นคือจะเก็บไว้อ้างอิงกันเพียงไม่เกิน1ปีส่วนคลังข้อมูลจะเก็บข้อมูลทั้งหมดขององค์การไว้ทำให้มีข้อมูลในอดีตขององค์การอยู่ด้วย แต่ในปัจจุบันเนื่องจากองค์การมีการกระจายบทบาทลงไปในพนักงานอาวุโส ผู้บริหารระดับล่าง และผู้บริหารระดับกลางขององค์การเพื่อการแก้ไขปัญหาปรับปรุงพัฒนาองค์การแล้วความจำเป็นในการที่จะต้องมีสารสนเทศที่อ้างอิงเปรียบเทียบได้ระหว่างปัจจุบันกับอดีตค่อนข้างมีมากขึ้นจนทำให้แทบทั้งองค์การทำงานด้วยการเปรียบเทียบการวิเคราะห์ข้อมูลระหว่างอดีตและปัจจุบันเป็นปกติเป็นประจำและในบางองค์การที่มีการออกแบบคลังข้อมูลได้ดีก็อาจจะมีข้อมูลที่เกี่ยวกับการคาดการณ์หรือแนวโน้มในอนาคตอยู่ด้วยซึ่งอาจจะสามารถแยกความแตกต่างระหว่างฐานข้อมูลกับคลังข้อมูลได้ดังนี้
คลังข้อมูลใช้เพื่อการวิเคราะห์ข้อมูลทั้งในอดีตและปัจจุบัน
ฐานข้อมูล ใช้เพื่อทำการประมวลผลเฉพาะข้อมูลปัจจุบัน ในการรวมฐานข้อมูล อาจมีปัญหาว่า
ฐานข้อมูลแต่ละอัน อาจถูกออกแบบจากผู้ออกแบบหลายๆ คนทำให้มีschema แตกต่างกันไป (schema
ในที่นี้หมายถึงการออกแบบแบบจำลองข้อมูลว่าจะมีกี่ตารางแต่ละตารางเชื่อมกันอย่างไรมีอะไรเป็นคีย์หลักและคีย์นอก เป็นต้น) ปัญหาใหญ่ก็คือจะนำฐานข้อมูลที่มีความแตกต่างกันมารวมกันได้อย่างไร และเมื่อรวมกันแล้วต้องการให้ schema ของคลังข้อมูลมีลักษณะแบบไหน การออกแบบคลังข้อมูลโดยทั่วไปมักจะออกแบบตรงข้ามกับฐานข้อมูลอย่างสิ้นเชิง ซึ่งในการออกแบบฐานข้อมูลเรามักต้องการให้มีschema ที่ปรับปรุงได้ง่ายๆ(เพราะเราต้องประมวลผลบ่อย)คือในแต่ละตารางมีคีย์หลักน้อยๆและมีตารางจำนวนมากเชื่อมต่อกันนั่นคือในฐานข้อมูลมักจะมีหลายๆตาราง
ประโยชน์ของคลังข้อมูล
ให้ผลตอบแทนจากการลงทุนที่สูงถึงแม้ว่าจะมีการลงทุนที่ต่ำก็ตาม
เนื่องจากมีการให้ผลตอบแทนจากการลงทุนที่สูง จึงสามารถทำให้องค์การเกิดความได้เปรียบ
คู่แข่งขันในแง่ของการได้รับข้อมูลและสารสนเทศก่อนคู่แข่งขันเสมอจึงทำให้สามารถวิเคราะห์ข้อมูลเหล่านั้นเพื่อทำการกำหนดเป็นกลยุทธ์และกำหนดทิศทางในการดำเนินงานได้ก่อนคู่แข่งขัน เช่น พฤติกรรมของผู้บริโภคความต้องการทางตลาดและแนวโน้มความต้องการของผู้บริโภค
เพิ่มประสิทธิภาพในการตัดสินใจของผู้ตัดสินใจ เนื่องจากคลังข้อมูลมีข้อมูลจากแหล่งข้อมูลที่
แตกต่างกัน ที่มีความสอดคล้องกัน และวิเคราะห์ตามประเด็นที่ผู้ตัดสินใจต้องการ อีกทั้งข้อมูลที่มีอยู่ใน
คลังข้อมูลก็มีปริมาณมากทั้งข้อมูลในอดีตและปัจจุบัน จึงทำให้การตัดสินใจมีประสิทธิภาพมากขึ้น ทำให้
สะดวกและรวดเร็วในการค้นหาข้อมูลต่างๆและลดความซ้ำซ้อนกันของข้อมูลอีกด้วย
2.   ความแตกต่างระหว่างกฎความสัมพันธ์ (Association Rule) และการจำแนกประเภทข้อมูล (Data Classification)
กฎความสัมพันธ์ (association rule) แสดงความสัมพันธ์ของเหตุการณ์หรือวัตถุที่เกิด
ขึ้นพร้อมกันตัวอย่างของการประยุกต์ใช้กฎเชื่อมโยง เช่นการวิเคราะห์ข้อมูลการขายสินค้า โดยเก็บข้อมูล
จากระบบ ณ จุดขาย(POS) หรือร้านค้าออนไลน์แล้วพิจารณาสินค้าที่ผู้ซื้อมักจะซื้อพร้อมกันเช่นถ้าพบว่า
คนที่ซื้อเทปวิดีโอมักจะซื้อเทปกาวด้วยร้านค้าก็อาจจะจัดร้านให้สินค้า 2อย่างอยู่ใกล้กันเพื่อเพิ่มยอดขาย
หรืออาจจะพบว่าหลังจากคนซื้อหนังสือ ก แล้วมักจะซื้อหนังสือ ข ด้วย ก็สามารถนำความรู้นี้ไปแนะนำผู้ที่
กำลังจะซื้อหนังสือ ก ได้
การจำแนกประเภทข้อมูล (data classification) หากฎเพื่อระบุประเภทของวัตถุจาก
คุณสมบัติของวัตถุ เช่น หาความสัมพันธ์ระหว่างผลการตรวจร่างกายต่างๆ กับการเกิดโรค โดยใช้ข้อมูล
ผู้ป่วยและการวินิจฉัยของแพทย์ที่เก็บไว้เพื่อนำมาช่วยวินิจฉัยโรคของผู้ป่วยหรือการวิจัยทางการแพทย์ใน
ทางธุรกิจจะใช้เพื่อดูคุณสมบัติของผู้ที่จะก่อหนี้ดีหรือหนี้เสีย เพื่อประกอบการพิจารณาอนุมัติเงินกู้
3.    วิธีการจัดเก็บเอกสารอิเล็กทรอนิกส์ 
2.1 การจัดเก็บแบบภาพ
 คือเก็บผ่านการ scan เข้าไปจัดเก็บเป็นภาพ และยังขึ้นกับวิธีการสร้าง เอกสารอิเล็กทรอนิกส์อีกด้วย นั่นคือ สร้างเอกสารจากตัวต้นฉบับของเอกสารโดยการ scan เป็นภาพเก็บ เข้าไป วิธีนี้สามารถเลือกประยุกต์เทคโนโลยีได้2 แนวทาง ระบบเหล่านี้จะทำหน้าที่คล้ายกัน คือ การลง ทะเบียนเอกสาร การใส่รหัสที่ต้องการสำหรับการค้นคืน รายงานสถานะการจัดเก็บหรืออายุการจัดเก็บ เอกสารต่างๆเพื่อบริหารวงจรชีวิตของเอกสารอิเล็กทรอนิกส์สำหรับระบบที่จะมาช่วยในการจัดเก็บเอกสาร อิเล็กทรอนิกส์ได้แก่ ใช้ระบบของบริษัทผู้ผลิตเครื่อง multifunctionที่เราใช้งานอยู่แล้วหรือใช้ระบบของ บริษัทผู้ผลิตระบบจัดการเอกสารอิเล็กทรอนิกส์แต่ต้องพิจารณาจากบริษัทที่สามารถจะทำระบบให้เชื่อมโยง กับscanner ของเราด้วย
 2.2 การจัดเก็บแบบแฟ้มข้อมูล
การจัดเก็บประเภทนี้เหมาะสำหรับกรณีที่เราสร้างแฟ้มข้อมูลด้วย คอมพิวเตอร์ไว้อยู่ก่อนแล้วและต้องการจัดเก็บในรูปแบบของแฟ้มที่สร้างไว้ตัวอย่างเช่นแฟ้มข้อมูลที่สร้าง จากMicrosoftWordMicrosoftExcelMicrosoft VisioMicrosoftPowerpointหรือ Acrobatบางครั้ง ผู้ผลิตจะเพิ่มความสามารถเกี่ยวกับการจัดทำเวอร์ชันของเอกสาร (versioning) และการค้นข้อมูลลงไปใน เนื้อหาของแฟ้มข้อมูลที่เก็บอยู่ในระบบนี้ที่เรียกว่าfull textsearchให้ด้วยนอกจากนี้ผู้ผลิตบางรายได้เพิ่ม ความสามารถให้ระบบสามารถรวมเอกสารทั้งจากเอกสารอิเล็กทรอนิกส์ประเภทภาพ หรือแฟ้มข้อมูลเข้าไป อยู่ในชุดข้อมูลเดียวกันอีกด้วยเพื่อให้สะดวกในการจัดการกับเอกสารอิเล็กทรอนิกส์ทั้งระบบ

 ภาพที่ 1 หน้าเว็บของบริษัทผู้ผลิต Electronic Document System ที่มา: www.infoma.net

ภาพที่ 2 หน้าเว็บของบริษัท Open KM ผู้ผลิต Electronic Management System
 ที่มา: www.openkm.com
  2.3 การจัดเก็บแบบเอกสารอิเล็กทรอนิกส์(electronic form)
การจัดเก็บประเภทนี้ปรับปรุงมาจาก แบบเอกสารอิเล็กทรอนิกส์เดิมที่ทำงานร่วมกับระบบจดหมายอิเล็กทรอนิกส์ระบบสนับสนุนการทำงานของ คนทำงานที่มีภูมิรู้หรือการทำงานในหน่วยงานช่วยลดการสร้างเอกสารด้วยMicrosoft Officeหรือ Acrobat โดยให้ผู้ใช้สร้างเป็นแบบเอกสารอิเล็กทรอนิกส์ที่เป็นเว็บทำให้สามารถนำข้อมูลเข้าระบบฐานข้อมูลและนำ ไปรวม เชื่อมโยง และบูรณาการกับคลังข้อมูลต่อไป ช่วยลดปัญหาของข้อมูลรั่วไหลจากการใช้ข้อมูลภาพ หรือแฟ้มข้อมูลได้ เมื่อเราสามารถรวบรวมสารสนเทศขององค์การผ่านเอกสารอิเล็กทรอนิกส์ได้แล้วแนวคิดเดียวกับ ที่เราใช้ในการจัดการคลังเอกสาร หรือเหมืองข้อมูลก็เริ่มกลับมาถูกใช้ซ้ำอีกครั้งหนึ่ง เพราะสารสนเทศทั้ง แบบที่เรานำใส่เข้าไปโดยตรงในรูปแบบของภาพผ่านการscanหรือการที่เราเก็บแบบเอกสารอิเล็กทรอนิกส์ นั้น พอนานวันเข้าก็จะมีปริมาณมหาศาลความสำคัญประเด็นหนึ่งของการเก็บสารสนเทศต่างๆไว้ในรูปแบบ ของเอกสารอิเล็กทรอนิกส์คือ การมุ่งหวังว่าจะลดพื้นที่ในการจัดเก็บเอกสารได้และที่สำคัญต้องสามารถ ค้นคืนได้อย่างรวดเร็ว เนื่องจากเราต้องการที่จะอ้างอิงกับเอกสารนั้นทั้งชุด และอาจจะต้องมีเอกสารอ้างอิง เป็นจำนวนมาก ซึ่งอาจจะต้องมีการพิมพ์ออกมาด้วย ดังนั้น แม้จะจัดเก็บในแบบภาพหรือเก็บผ่านแบบ เอกสารอิเล็กทรอนิกส์ก็ตามก็ต้องสามารถพิมพ์ออกมาได้เหมือนเอกสารจริงๆ ดังนั้น รูปแบบของการจัดการคลังของเอกสารอิเล็กทรอนิกส์ก็จะคล้ายกับการประยุกต์ใช้เหมือง ข้อมูล นั่นคือ ต้องเข้าใจในโครงสร้าง (structure) และประเภทของเอกสารที่เก็บ (type) วัตถุประสงค์ (objective)ของเอกสารที่จัดเก็บและต้องกำหนดให้ชัดเจนว่าจะใช้เลขรหัสใดไว้สำหรับค้นหรือจะค้นโดยอาศัย full text search หรือจะค้นแบบมีเงื่อนไข (search with criteria) รวมไปถึงการกำหนดวงจรชีวิต ของเอกสารด้วย (document life cycle) ซึ่งก็ไม่ได้ง่ายนักกับการดำเนินการดังกล่าว หากดำเนินการได้ดี การจัดเก็บและค้นคืนเอกสารก็จะทำได้อย่างรวดเร็วและมีประสิทธิภาพ


ไม่มีความคิดเห็น:

แสดงความคิดเห็น