วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

Lecture 19/01/11

Data Management (ต่อ)

ประโยชน์ของ Data Warehouse
- สามารถเข้าถึงข้อมูลได้สะดวก รวดเร็ว เพราะว่าข้อมูลต่างๆ ถูกเก็บรวบรวมไว้ในที่ที่เดียว
- สามารถเข้าถึงข้อมูลได้ง่ายขึ้น

Data Warehouse Process
กระบวนการของ Data Warehouse จะเริ่มจากการเก็บรวบรวมข้อมูลจากแหล่งต่างๆ ทั้ง Operational Data หรือข้อมูลภายในองค์กร และ External Data หรือข้อมูลภายนอกองค์กร มาเข้าสู่ Meta Data หรือก็คือสิ่งที่เอาไว้ใช้อธิบายข้อมูลที่อยู่ภายใน Data Warehouse จากนั้นก็จะทำ Data Staging หรือ ECTL (Extract, Clean, Transform, Load) และนำข้อมูลที่จะนำมาใช้ใส่ลงไปใน Data Cube ต่อมาก็จะสร้าง Data Warehouse โดยสร้างตาม Business Subject และนำเสนอข้อมูลโดยเลือกมุมมองแบบ Business View เพื่อให้ผู้บริหารเรียกดูในสิ่งต่างๆ

Data Mart
Data Mart เป็น Data Warehouse ที่ถูกนำมาเปลี่ยนแปลงให้มีขนาดเล็กลง โดยออกแบบมาใช้สำหรับแผนกต่างๆ หรือหน่วยงานทางธุรกิจ (Strategic Business Unit : SBU) แบ่งออกได้เป็น 2 ประเภท ดังนี้
- Replicated (Dependent) Data Mart : เป็นการนำข้อมูลจาก Enterprise Data Warehouse เฉพาะส่วนของตนมาสร้าง Data Mart ให้เหมาะสมแต่ละแผนกตามความต้องการ พบได้บ่อยในทางปฏิบัติ
- Stand-alone Data Mart : เป็นกรณีที่องค์กรยังไม่สามารถสร้าง Enterprise Data Warehouse ได้ แผนกต่างๆ หรือหน่วยงานทางธุรกิจจึงสร้าง Data Mart ของตนเองขึ้นมา จากนั้นเมื่อมี Data Mart ครบทุกหน่วยงานแล้วจึงนำมารวมกันเป็น Enterprise Data Warehouse ในกรณีนี้จะพบได้ยากในทางปฏิบัติ

Data Cube
Data Cube หรือ Multidimensional Database หรือ OLAP เป็น Database ที่เราสามารถมองข้อมูลต่างๆ ได้ในหลายๆ มิติด้วยกัน จุดเด่นของมันก็คือ สามารถทำการ Slice & Dice เพื่อตัดส่วนของข้อมูลที่ต้องการวิเคราะห์ได้ในหลายมิติ บอกความสัมพันธ์ของข้อมูลในแต่ละมิติ และสามารถมองข้อมูลในภาพกว้างแล้วลงไปมองในรายละเอียด หรือมองข้อมูลจากรายละเอียดแล้วย้อนขึ้นไปในภาพกว้างได้

Business Intelligence (BI)
เป็นการรวมกันของเครื่องมือต่างๆ Database Applications Methodologies และ Architecture เพื่อเตรียมข้อมูลที่จะนำมาให้ผู้บริหารระดับสูงใช้ในการวิเคราะห์ โดยมีขั้นตอนดังนี้
1. Reporting and Analysis : เป็นการออกรายงานให้กับผู้ใช้ โดยเป็นรายงานในรูปแบบปกติ หรือรูปแบบตามที่ผู้ใช้ต้องการ หรือเรียกว่า Dashboard
2. Analysis : เป็นการใช้เครื่องมือต่างๆ ในการวิเคราะห์ข้อมูล เช่น Predictive Analytic, Data, Text, and Web Mining, และ OLAP
3. Data Integration : เป็นการเตรียมข้อมูลเพื่อใช้ในการวิเคราะห์ เช่น ETL, EII

Data Mining 
Data Mining เป็นการคัดแยกข้อมูลต่างๆ ที่มีประโยชน์ออกจากข้อมูลที่มีอยู่เป็นจำนวนมากใน Database เพื่อนำมาใช้ให้เกิดประโยชน์ และใช้ในการตัดสินใจเชิงธุรกิจ หรือกำหนดกลยุทธ์ขององค์กรต่อไป โดยมี 5 ลักษณะ ดังนี้
1. Clustering : เป็นการจัดกลุ่มข้อมูลโดยไม่มีสมมติฐาน โดยจัดกลุ่มข้อมูลที่มีความสัมพันธ์เดียวกัน เข้าด้วยกัน
2. Classification : เป็นการจัดกลุ่มข้อมูลโดยมีสมมติฐาน
3. Association : เป็นผลสืบเนื่อง เช่น ถ้าลูกค้าเปิดบัญชีออมทรัพย์ของธนาคาร ก็มีโอกาสที่ลูกค้าคนนั้นจะทำบัตร ATM ด้วย เป็นต้น
4. Sequence Discovery : เป็นผลที่เกิดตามมาทีหลัง
5. Prediction : เป็นการ Forecast

ไม่มีความคิดเห็น:

แสดงความคิดเห็น