คลังข้อมูล
(data
warehouse) คือ
ฐานข้อมูลขนาดยักษ์ที่รวบรวมฐานข้อมูลจากหลายแหล่งหลายช่วงเวลา ซึ่งอาจมี schema
แตกต่างกัน มาไว้รวม ณ ที่เดียวกัน (และใช้ schema เดียวกัน) โดยทั่วไปองค์การมักจะมีฐานข้อมูลใช้งานกันอยู่แล้ว
ซึ่งฐานข้อมูลในองค์การทั่วไปจะมีลักษณะที่ค่อนข้างทันต่อเหตุการณ์เช่นฐานข้อมูลพนักงานก็จะเก็บเฉพาะพนักงานในปัจจุบันจะไม่สนใจข้อมูลพนักงานเก่าๆในอดีตซึ่งอาจจะมีข้อมูลอะไรบางอย่างที่มีประโยชน์สำหรับผู้บริหารในการวิเคราะห์ประสิทธิภาพและคุณลักษณะต่างๆ
ขององค์การ นอกจากนี้แต่ละฐานข้อมูลมักถูกออกแบบมาใช้เก็บข้อมูลเฉพาะด้าน จึงมีข้อมูลเฉพาะบางส่วนขององค์การเท่านั้นและการทำงานกับฐานข้อมูลมักจะอยู่ในช่วงปีงบประมาณนั่นคือจะเก็บไว้อ้างอิงกันเพียงไม่เกิน1ปีส่วนคลังข้อมูลจะเก็บข้อมูลทั้งหมดขององค์การไว้ทำให้มีข้อมูลในอดีตขององค์การอยู่ด้วย
แต่ในปัจจุบันเนื่องจากองค์การมีการกระจายบทบาทลงไปในพนักงานอาวุโส
ผู้บริหารระดับล่าง
และผู้บริหารระดับกลางขององค์การเพื่อการแก้ไขปัญหาปรับปรุงพัฒนาองค์การแล้วความจำเป็นในการที่จะต้องมีสารสนเทศที่อ้างอิงเปรียบเทียบได้ระหว่างปัจจุบันกับอดีตค่อนข้างมีมากขึ้นจนทำให้แทบทั้งองค์การทำงานด้วยการเปรียบเทียบการวิเคราะห์ข้อมูลระหว่างอดีตและปัจจุบันเป็นปกติเป็นประจำและในบางองค์การที่มีการออกแบบคลังข้อมูลได้ดีก็อาจจะมีข้อมูลที่เกี่ยวกับการคาดการณ์หรือแนวโน้มในอนาคตอยู่ด้วยซึ่งอาจจะสามารถแยกความแตกต่างระหว่างฐานข้อมูลกับคลังข้อมูลได้ดังนี้
– คลังข้อมูลใช้เพื่อการวิเคราะห์ข้อมูลทั้งในอดีตและปัจจุบัน
– ฐานข้อมูล
ใช้เพื่อทำการประมวลผลเฉพาะข้อมูลปัจจุบัน ในการรวมฐานข้อมูล อาจมีปัญหาว่า
ฐานข้อมูลแต่ละอัน
อาจถูกออกแบบจากผู้ออกแบบหลายๆ คนทำให้มีschema แตกต่างกันไป (schema
ในที่นี้หมายถึงการออกแบบแบบจำลองข้อมูลว่าจะมีกี่ตารางแต่ละตารางเชื่อมกันอย่างไรมีอะไรเป็นคีย์หลักและคีย์นอก
เป็นต้น) ปัญหาใหญ่ก็คือจะนำฐานข้อมูลที่มีความแตกต่างกันมารวมกันได้อย่างไร
และเมื่อรวมกันแล้วต้องการให้ schema ของคลังข้อมูลมีลักษณะแบบไหน
การออกแบบคลังข้อมูลโดยทั่วไปมักจะออกแบบตรงข้ามกับฐานข้อมูลอย่างสิ้นเชิง
ซึ่งในการออกแบบฐานข้อมูลเรามักต้องการให้มีschema ที่ปรับปรุงได้ง่ายๆ(เพราะเราต้องประมวลผลบ่อย)คือในแต่ละตารางมีคีย์หลักน้อยๆและมีตารางจำนวนมากเชื่อมต่อกันนั่นคือในฐานข้อมูลมักจะมีหลายๆตาราง
ประโยชน์ของคลังข้อมูล
– ให้ผลตอบแทนจากการลงทุนที่สูงถึงแม้ว่าจะมีการลงทุนที่ต่ำก็ตาม
– เนื่องจากมีการให้ผลตอบแทนจากการลงทุนที่สูง
จึงสามารถทำให้องค์การเกิดความได้เปรียบ
คู่แข่งขันในแง่ของการได้รับข้อมูลและสารสนเทศก่อนคู่แข่งขันเสมอจึงทำให้สามารถวิเคราะห์ข้อมูลเหล่านั้นเพื่อทำการกำหนดเป็นกลยุทธ์และกำหนดทิศทางในการดำเนินงานได้ก่อนคู่แข่งขัน
เช่น พฤติกรรมของผู้บริโภคความต้องการทางตลาดและแนวโน้มความต้องการของผู้บริโภค
– เพิ่มประสิทธิภาพในการตัดสินใจของผู้ตัดสินใจ
เนื่องจากคลังข้อมูลมีข้อมูลจากแหล่งข้อมูลที่
แตกต่างกัน ที่มีความสอดคล้องกัน
และวิเคราะห์ตามประเด็นที่ผู้ตัดสินใจต้องการ อีกทั้งข้อมูลที่มีอยู่ใน
คลังข้อมูลก็มีปริมาณมากทั้งข้อมูลในอดีตและปัจจุบัน
จึงทำให้การตัดสินใจมีประสิทธิภาพมากขึ้น ทำให้
สะดวกและรวดเร็วในการค้นหาข้อมูลต่างๆและลดความซ้ำซ้อนกันของข้อมูลอีกด้วย
2. ความแตกต่างระหว่างกฎความสัมพันธ์
(Association
Rule) และการจำแนกประเภทข้อมูล (Data
Classification)
– กฎความสัมพันธ์ (association
rule) แสดงความสัมพันธ์ของเหตุการณ์หรือวัตถุที่เกิด
ขึ้นพร้อมกันตัวอย่างของการประยุกต์ใช้กฎเชื่อมโยง
เช่นการวิเคราะห์ข้อมูลการขายสินค้า โดยเก็บข้อมูล
จากระบบ ณ จุดขาย(POS)
หรือร้านค้าออนไลน์แล้วพิจารณาสินค้าที่ผู้ซื้อมักจะซื้อพร้อมกันเช่นถ้าพบว่า
คนที่ซื้อเทปวิดีโอมักจะซื้อเทปกาวด้วยร้านค้าก็อาจจะจัดร้านให้สินค้า
2อย่างอยู่ใกล้กันเพื่อเพิ่มยอดขาย
หรืออาจจะพบว่าหลังจากคนซื้อหนังสือ
ก แล้วมักจะซื้อหนังสือ ข ด้วย ก็สามารถนำความรู้นี้ไปแนะนำผู้ที่
กำลังจะซื้อหนังสือ ก ได้
– การจำแนกประเภทข้อมูล
(data classification) หากฎเพื่อระบุประเภทของวัตถุจาก
คุณสมบัติของวัตถุ เช่น
หาความสัมพันธ์ระหว่างผลการตรวจร่างกายต่างๆ กับการเกิดโรค โดยใช้ข้อมูล
ผู้ป่วยและการวินิจฉัยของแพทย์ที่เก็บไว้เพื่อนำมาช่วยวินิจฉัยโรคของผู้ป่วยหรือการวิจัยทางการแพทย์ใน
ทางธุรกิจจะใช้เพื่อดูคุณสมบัติของผู้ที่จะก่อหนี้ดีหรือหนี้เสีย
เพื่อประกอบการพิจารณาอนุมัติเงินกู้
3. วิธีการจัดเก็บเอกสารอิเล็กทรอนิกส์
2.1 การจัดเก็บแบบภาพ
คือเก็บผ่านการ scan เข้าไปจัดเก็บเป็นภาพ
และยังขึ้นกับวิธีการสร้าง เอกสารอิเล็กทรอนิกส์อีกด้วย นั่นคือ
สร้างเอกสารจากตัวต้นฉบับของเอกสารโดยการ scan เป็นภาพเก็บ เข้าไป
วิธีนี้สามารถเลือกประยุกต์เทคโนโลยีได้2 แนวทาง
ระบบเหล่านี้จะทำหน้าที่คล้ายกัน คือ การลง ทะเบียนเอกสาร
การใส่รหัสที่ต้องการสำหรับการค้นคืน รายงานสถานะการจัดเก็บหรืออายุการจัดเก็บ เอกสารต่างๆเพื่อบริหารวงจรชีวิตของเอกสารอิเล็กทรอนิกส์สำหรับระบบที่จะมาช่วยในการจัดเก็บเอกสาร
อิเล็กทรอนิกส์ได้แก่ ใช้ระบบของบริษัทผู้ผลิตเครื่อง multifunctionที่เราใช้งานอยู่แล้วหรือใช้ระบบของ บริษัทผู้ผลิตระบบจัดการเอกสารอิเล็กทรอนิกส์แต่ต้องพิจารณาจากบริษัทที่สามารถจะทำระบบให้เชื่อมโยง
กับscanner ของเราด้วย
2.2 การจัดเก็บแบบแฟ้มข้อมูล
การจัดเก็บประเภทนี้เหมาะสำหรับกรณีที่เราสร้างแฟ้มข้อมูลด้วย
คอมพิวเตอร์ไว้อยู่ก่อนแล้วและต้องการจัดเก็บในรูปแบบของแฟ้มที่สร้างไว้ตัวอย่างเช่นแฟ้มข้อมูลที่สร้าง
จากMicrosoftWordMicrosoftExcelMicrosoft
VisioMicrosoftPowerpointหรือ Acrobatบางครั้ง
ผู้ผลิตจะเพิ่มความสามารถเกี่ยวกับการจัดทำเวอร์ชันของเอกสาร (versioning) และการค้นข้อมูลลงไปใน เนื้อหาของแฟ้มข้อมูลที่เก็บอยู่ในระบบนี้ที่เรียกว่าfull
textsearchให้ด้วยนอกจากนี้ผู้ผลิตบางรายได้เพิ่ม ความสามารถให้ระบบสามารถรวมเอกสารทั้งจากเอกสารอิเล็กทรอนิกส์ประเภทภาพ
หรือแฟ้มข้อมูลเข้าไป อยู่ในชุดข้อมูลเดียวกันอีกด้วยเพื่อให้สะดวกในการจัดการกับเอกสารอิเล็กทรอนิกส์ทั้งระบบ
ภาพที่ 1 หน้าเว็บของบริษัทผู้ผลิต Electronic
Document System ที่มา: www.infoma.net
ภาพที่ 2 หน้าเว็บของบริษัท Open
KM ผู้ผลิต Electronic Management System
ที่มา: www.openkm.com
2.3 การจัดเก็บแบบเอกสารอิเล็กทรอนิกส์(electronic form)
การจัดเก็บประเภทนี้ปรับปรุงมาจาก แบบเอกสารอิเล็กทรอนิกส์เดิมที่ทำงานร่วมกับระบบจดหมายอิเล็กทรอนิกส์ระบบสนับสนุนการทำงานของ
คนทำงานที่มีภูมิรู้หรือการทำงานในหน่วยงานช่วยลดการสร้างเอกสารด้วยMicrosoft Officeหรือ
Acrobat โดยให้ผู้ใช้สร้างเป็นแบบเอกสารอิเล็กทรอนิกส์ที่เป็นเว็บทำให้สามารถนำข้อมูลเข้าระบบฐานข้อมูลและนำ
ไปรวม เชื่อมโยง และบูรณาการกับคลังข้อมูลต่อไป
ช่วยลดปัญหาของข้อมูลรั่วไหลจากการใช้ข้อมูลภาพ หรือแฟ้มข้อมูลได้ เมื่อเราสามารถรวบรวมสารสนเทศขององค์การผ่านเอกสารอิเล็กทรอนิกส์ได้แล้วแนวคิดเดียวกับ
ที่เราใช้ในการจัดการคลังเอกสาร หรือเหมืองข้อมูลก็เริ่มกลับมาถูกใช้ซ้ำอีกครั้งหนึ่ง
เพราะสารสนเทศทั้ง แบบที่เรานำใส่เข้าไปโดยตรงในรูปแบบของภาพผ่านการscanหรือการที่เราเก็บแบบเอกสารอิเล็กทรอนิกส์ นั้น
พอนานวันเข้าก็จะมีปริมาณมหาศาลความสำคัญประเด็นหนึ่งของการเก็บสารสนเทศต่างๆไว้ในรูปแบบ
ของเอกสารอิเล็กทรอนิกส์คือ
การมุ่งหวังว่าจะลดพื้นที่ในการจัดเก็บเอกสารได้และที่สำคัญต้องสามารถ ค้นคืนได้อย่างรวดเร็ว
เนื่องจากเราต้องการที่จะอ้างอิงกับเอกสารนั้นทั้งชุด และอาจจะต้องมีเอกสารอ้างอิง
เป็นจำนวนมาก ซึ่งอาจจะต้องมีการพิมพ์ออกมาด้วย ดังนั้น แม้จะจัดเก็บในแบบภาพหรือเก็บผ่านแบบ
เอกสารอิเล็กทรอนิกส์ก็ตามก็ต้องสามารถพิมพ์ออกมาได้เหมือนเอกสารจริงๆ ดังนั้น
รูปแบบของการจัดการคลังของเอกสารอิเล็กทรอนิกส์ก็จะคล้ายกับการประยุกต์ใช้เหมือง ข้อมูล
นั่นคือ ต้องเข้าใจในโครงสร้าง (structure) และประเภทของเอกสารที่เก็บ
(type) วัตถุประสงค์ (objective)ของเอกสารที่จัดเก็บและต้องกำหนดให้ชัดเจนว่าจะใช้เลขรหัสใดไว้สำหรับค้นหรือจะค้นโดยอาศัย
full text search หรือจะค้นแบบมีเงื่อนไข (search
with criteria) รวมไปถึงการกำหนดวงจรชีวิต ของเอกสารด้วย (document
life cycle) ซึ่งก็ไม่ได้ง่ายนักกับการดำเนินการดังกล่าว
หากดำเนินการได้ดี การจัดเก็บและค้นคืนเอกสารก็จะทำได้อย่างรวดเร็วและมีประสิทธิภาพ
ไม่มีความคิดเห็น:
แสดงความคิดเห็น