วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Lecture 19/01/11

Data Management (ต่อ)

ประโยชน์ของ Data Warehouse
- สามารถเข้าถึงข้อมูลได้สะดวก รวดเร็ว เพราะว่าข้อมูลต่างๆ ถูกเก็บรวบรวมไว้ในที่ที่เดียว
- สามารถเข้าถึงข้อมูลได้ง่ายขึ้น

Data Warehouse Process
กระบวนการของ Data Warehouse จะเริ่มจากการเก็บรวบรวมข้อมูลจากแหล่งต่างๆ ทั้ง Operational Data หรือข้อมูลภายในองค์กร และ External Data หรือข้อมูลภายนอกองค์กร มาเข้าสู่ Meta Data หรือก็คือสิ่งที่เอาไว้ใช้อธิบายข้อมูลที่อยู่ภายใน Data Warehouse จากนั้นก็จะทำ Data Staging หรือ ECTL (Extract, Clean, Transform, Load) และนำข้อมูลที่จะนำมาใช้ใส่ลงไปใน Data Cube ต่อมาก็จะสร้าง Data Warehouse โดยสร้างตาม Business Subject และนำเสนอข้อมูลโดยเลือกมุมมองแบบ Business View เพื่อให้ผู้บริหารเรียกดูในสิ่งต่างๆ

Data Mart
Data Mart เป็น Data Warehouse ที่ถูกนำมาเปลี่ยนแปลงให้มีขนาดเล็กลง โดยออกแบบมาใช้สำหรับแผนกต่างๆ หรือหน่วยงานทางธุรกิจ (Strategic Business Unit : SBU) แบ่งออกได้เป็น 2 ประเภท ดังนี้
- Replicated (Dependent) Data Mart : เป็นการนำข้อมูลจาก Enterprise Data Warehouse เฉพาะส่วนของตนมาสร้าง Data Mart ให้เหมาะสมแต่ละแผนกตามความต้องการ พบได้บ่อยในทางปฏิบัติ
- Stand-alone Data Mart : เป็นกรณีที่องค์กรยังไม่สามารถสร้าง Enterprise Data Warehouse ได้ แผนกต่างๆ หรือหน่วยงานทางธุรกิจจึงสร้าง Data Mart ของตนเองขึ้นมา จากนั้นเมื่อมี Data Mart ครบทุกหน่วยงานแล้วจึงนำมารวมกันเป็น Enterprise Data Warehouse ในกรณีนี้จะพบได้ยากในทางปฏิบัติ

Data Cube
Data Cube หรือ Multidimensional Database หรือ OLAP เป็น Database ที่เราสามารถมองข้อมูลต่างๆ ได้ในหลายๆ มิติด้วยกัน จุดเด่นของมันก็คือ สามารถทำการ Slice & Dice เพื่อตัดส่วนของข้อมูลที่ต้องการวิเคราะห์ได้ในหลายมิติ บอกความสัมพันธ์ของข้อมูลในแต่ละมิติ และสามารถมองข้อมูลในภาพกว้างแล้วลงไปมองในรายละเอียด หรือมองข้อมูลจากรายละเอียดแล้วย้อนขึ้นไปในภาพกว้างได้

Business Intelligence (BI)
เป็นการรวมกันของเครื่องมือต่างๆ Database Applications Methodologies และ Architecture เพื่อเตรียมข้อมูลที่จะนำมาให้ผู้บริหารระดับสูงใช้ในการวิเคราะห์ โดยมีขั้นตอนดังนี้
1. Reporting and Analysis : เป็นการออกรายงานให้กับผู้ใช้ โดยเป็นรายงานในรูปแบบปกติ หรือรูปแบบตามที่ผู้ใช้ต้องการ หรือเรียกว่า Dashboard
2. Analysis : เป็นการใช้เครื่องมือต่างๆ ในการวิเคราะห์ข้อมูล เช่น Predictive Analytic, Data, Text, and Web Mining, และ OLAP
3. Data Integration : เป็นการเตรียมข้อมูลเพื่อใช้ในการวิเคราะห์ เช่น ETL, EII

Data Mining 
Data Mining เป็นการคัดแยกข้อมูลต่างๆ ที่มีประโยชน์ออกจากข้อมูลที่มีอยู่เป็นจำนวนมากใน Database เพื่อนำมาใช้ให้เกิดประโยชน์ และใช้ในการตัดสินใจเชิงธุรกิจ หรือกำหนดกลยุทธ์ขององค์กรต่อไป โดยมี 5 ลักษณะ ดังนี้
1. Clustering : เป็นการจัดกลุ่มข้อมูลโดยไม่มีสมมติฐาน โดยจัดกลุ่มข้อมูลที่มีความสัมพันธ์เดียวกัน เข้าด้วยกัน
2. Classification : เป็นการจัดกลุ่มข้อมูลโดยมีสมมติฐาน
3. Association : เป็นผลสืบเนื่อง เช่น ถ้าลูกค้าเปิดบัญชีออมทรัพย์ของธนาคาร ก็มีโอกาสที่ลูกค้าคนนั้นจะทำบัตร ATM ด้วย เป็นต้น
4. Sequence Discovery : เป็นผลที่เกิดตามมาทีหลัง
5. Prediction : เป็นการ Forecast

วันพุธที่ 12 มกราคม พ.ศ. 2554

Lecture 12/01/11

Data Management
ระบบ (System)
จะต้องมีวัตถุประสงค์เพราะเป็นส่วนที่จะเป็นตัวกำหนด Output โดยจะมีส่วนประกอบดังนี้
     Input ---> Process ---> Output
โดยเราจะต้องมีการควบคุม Feedback ดูว่า Output ที่ได้เป็นไปตามวัตถุประสงค์ที่เราต้องการหรือไม่


ข้อมูล (Data) และ สารสนเทศ (Information)
ข้อมูล คือ ข้อเท็จจริงต่างๆ ที่ได้เก็บรวบรวมมา ซึ่งเป็นแค่หน่วยพื้นฐาน ยังไม่มีความหมายมากนัก ยังไม่สามารถนำไปใช้ต่อได้ ส่วนสารสนเทศ (Information) เป็นการนำข้อมูลมาผ่านกระบวนการต่างๆ เพื่อทำให้สามารถนำมาใช้ประโยชน์ได้ ซึ่งปัจจัยที่เป็นตัวกำหนดว่าเป็น ข้อมูล หรือ สารสนเทศนั้นขึ้นอยู่กับผู้รับสารว่า สิ่งนั้นส่งผลต่อการตัดสินใจหรือมีประโยชน์ต่อผู้รับสารหรือไม่ ถ้าใช่สิ่งนั้นก็เป็นสารสนเทศ ถ้าไม่ใช่สิ่งนั้นก็เป็นเพียงแค่ข้อมูล

ระบบสารสนเทศ (Information System)
ระบบสารสนเทศ เป็นระบบที่รวบรวมข้อมูลจากแหล่งต่างๆ แล้วนำมาผ่านกระบวนการต่างๆ เพื่อสร้างสารสนเทศ และนำเสนอสารสนเทศให้แก่ผู้ที่ต้องการเพื่อนำไปใช้ประโยชน์ต่อไป โดยสารสนเทศที่ได้ก็จะถูกเก็บบันทึกข้อมูลไว้ใน Database เพื่อนำไว้ใช้ต่อไปในอนาคต

องค์ประกอบของระบบสารสนเทศ
1. Hardware
2. Software
3. Data
4. Network
5. Procedure
6. People

Data Management
การบริหารจัดการข้อมูลเป็นเรื่องที่ยากสำหรับองค์กรมาก เพราะว่าข้อมูลมีกระจัดกระจายอยู่ทั่วทั้งองค์กร ดังนั้นทำให้เกิดการซ้ำซ้อนของข้อมูลได้ง่าย ถ้าหากไม่มีการเก็บรวบรวมและการควบคุมข้อมูลอย่างเป็นระบบ อีกทั้งยังต้องคำนึงถึงความปลอดภัยและคุณภาพของข้อมูลอีกด้วย โดย Data Management สามารถแบ่งออกเป็น
1. Data Profiling
2. Data Quality Management
3. Data Integration
4. Data Augment

Data Life Cycle Process
1. เก็บข้อมูลใหม่ๆ จากหลายๆแหล่ง
2. เก็บบันทึกข้อมูลลงใน Database และปรับรูปแบบเพื่อเก็บไว้ใน Data Warehouse
3. ใช้เครื่องมือต่างๆ เพื่อนำข้อมูลที่ได้มาวิเคราะห์แล้วนำไปใช้ประโยชน์ต่อไป

Data Warehouse
Data Warehouse ไม่เหมือนกับ Database แต่จะนำข้อมูลจาก Database เฉพาะส่วนที่จะนำมาใช้เท่านั้น เพื่อนำไปวิเคราะห์ต่อไป โดย Data Warehouse จะมีคุณลักษณะดังนี้
1. Organizational
2. Consistency
3. Time Variant
4. Non-Volatile
5. Relational
6.Client/Server