การ Clean Data เป็นขั้นตอนที่สำคัญในการประเมินมูลค่าทรัพย์สินเพื่อให้ได้ข้อมูลที่แม่นยำที่สุด ในกรณีของ Thonglor Tower ข้อมูลที่เราได้จากการเก็บข้อมูลอาจมีความหลากหลายและซ้ำซ้อน ขั้นตอนนี้จะช่วยกรองข้อมูลที่ไม่จำเป็นออกไป เพื่อให้เหลือเฉพาะข้อมูลที่ใช้ในการวิเคราะห์ได้
การจัดเรียงและการกรองข้อมูล
เมื่อได้ข้อมูลจากเว็บไซต์อสังหาริมทรัพย์เช่น Hipflat เราจะเริ่มต้นด้วยการจัดเรียงข้อมูลตามราคาขายต่อตารางเมตร (Price per Square Meter), ขนาดของห้อง (Square Meters) และชั้นของอาคาร (Floor) การจัดเรียงข้อมูลเหล่านี้จะช่วยให้เราสามารถวิเคราะห์ได้ง่ายขึ้นว่า ข้อมูลใดที่มีลักษณะคล้ายกัน และมีข้อมูลใดที่ควรถูกลบออกไป
การลบข้อมูลที่ซ้ำซ้อน
ในขั้นตอนนี้เราจะใช้ฟังก์ชัน Remove Duplicate เพื่อลบข้อมูลที่ซ้ำซ้อนออกจากชุดข้อมูล ตัวอย่างเช่น ข้อมูลห้องที่มีราคาขายและขนาดพื้นที่เดียวกันในหลายยูนิตจะถูกลบออกไป ทำให้เราสามารถลดจำนวนข้อมูลและทำให้ข้อมูลที่เหลือมีความชัดเจนมากขึ้น ในกรณีของ Thonglor Tower เราพบข้อมูลซ้ำและลบออกได้ 2 รายการ ทำให้ชุดข้อมูลเหลือเพียง 25 ยูนิตที่พร้อมสำหรับการวิเคราะห์เพิ่มเติม
ข้อควรระวังในการทำ Clean Data
หนึ่งในข้อผิดพลาดที่อาจเกิดขึ้นได้ในขั้นตอนนี้คือการลบข้อมูลผิดพลาด หรือการลบข้อมูลที่จำเป็นออกไป ดังนั้น การแยกชุดข้อมูลระหว่าง Raw Data (ข้อมูลดิบ) และ Clean Data (ข้อมูลที่ผ่านการกรองแล้ว) จึงเป็นสิ่งสำคัญ เพื่อให้สามารถตรวจสอบและกลับไปดูข้อมูลดิบได้ในกรณีที่มีข้อผิดพลาด
คำถาม
- เนื้อหาอธิบายเหตุผลในการใช้ข้อมูลทั้งหมด (use all) แม้จะไม่เหมือนกัน (not similar) ในการวิเคราะห์ราคาคอนโดทองหล่อทาวเวอร์อย่างไร และมีข้อดีข้อเสียอย่างไร?
- วิธีการ clean data ที่เนื้อหาแนะนำมีขั้นตอนหลักอะไรบ้าง และเหตุใดจึงต้องทำการ custom sort ก่อนการ remove duplicate?
- เนื้อหาอธิบายความสำคัญของการเก็บ raw data ไว้อย่างไร และมีวิธีการจัดการ raw data และ clean data อย่างไร?
- ในกรณีที่พบข้อมูลที่อาจผิดพลาด (เช่น ตัวเลขผิด) แต่ข้อมูลอื่นๆ ในชุดเดียวกันดูสมเหตุสมผล เนื้อหาแนะนำให้จัดการอย่างไร?
- เนื้อหาอธิบายวิธีการพิจารณาว่าข้อมูลใดควรเก็บไว้หรือตัดออกในกรณีที่มีข้อมูลจำกัดอย่างไร และมีหลักการในการตัดสินใจอย่างไร?
สรุป
การ Clean Data เป็นขั้นตอนที่ช่วยให้ข้อมูลที่ใช้ในการประเมินราคาทรัพย์สินมีความแม่นยำมากขึ้น ในกรณีของ Thonglor Tower การลบข้อมูลซ้ำและการจัดเรียงข้อมูลตามเกณฑ์ต่างๆ ทำให้เราสามารถนำข้อมูลที่ถูกต้องไปใช้ในการคำนวณและวิเคราะห์ได้อย่างมีประสิทธิภาพ ข้อมูลที่ได้จากขั้นตอนนี้จะถูกนำไปใช้ในขั้นตอนต่อไปของการคำนวณราคาต่อตารางเมตร
คำสำคัญ: Thonglor Tower, Clean Data, การประเมินมูลค่า, ราคาต่อตารางเมตร, การลบข้อมูลซ้ำ
อ้างอิง: C112-2-2 Clean data for Example 2 Thonglor Tower
โพสนี้ถูกสรุปสั้นๆ จาก VDO อ้างอิง เพื่อใช้ทวน นักศึกษาควรดูวิดีโอนั้นๆ ตามรหัสวิดีโอ