การ Clean Data สำหรับตัวอย่างที่ 2: Thonglor Tower

การ Clean Data เป็นขั้นตอนที่สำคัญในการประเมินมูลค่าทรัพย์สินเพื่อให้ได้ข้อมูลที่แม่นยำที่สุด ในกรณีของ Thonglor Tower ข้อมูลที่เราได้จากการเก็บข้อมูลอาจมีความหลากหลายและซ้ำซ้อน ขั้นตอนนี้จะช่วยกรองข้อมูลที่ไม่จำเป็นออกไป เพื่อให้เหลือเฉพาะข้อมูลที่ใช้ในการวิเคราะห์ได้

การจัดเรียงและการกรองข้อมูล

เมื่อได้ข้อมูลจากเว็บไซต์อสังหาริมทรัพย์เช่น Hipflat เราจะเริ่มต้นด้วยการจัดเรียงข้อมูลตามราคาขายต่อตารางเมตร (Price per Square Meter), ขนาดของห้อง (Square Meters) และชั้นของอาคาร (Floor) การจัดเรียงข้อมูลเหล่านี้จะช่วยให้เราสามารถวิเคราะห์ได้ง่ายขึ้นว่า ข้อมูลใดที่มีลักษณะคล้ายกัน และมีข้อมูลใดที่ควรถูกลบออกไป

การลบข้อมูลที่ซ้ำซ้อน

ในขั้นตอนนี้เราจะใช้ฟังก์ชัน Remove Duplicate เพื่อลบข้อมูลที่ซ้ำซ้อนออกจากชุดข้อมูล ตัวอย่างเช่น ข้อมูลห้องที่มีราคาขายและขนาดพื้นที่เดียวกันในหลายยูนิตจะถูกลบออกไป ทำให้เราสามารถลดจำนวนข้อมูลและทำให้ข้อมูลที่เหลือมีความชัดเจนมากขึ้น ในกรณีของ Thonglor Tower เราพบข้อมูลซ้ำและลบออกได้ 2 รายการ ทำให้ชุดข้อมูลเหลือเพียง 25 ยูนิตที่พร้อมสำหรับการวิเคราะห์เพิ่มเติม

ข้อควรระวังในการทำ Clean Data

หนึ่งในข้อผิดพลาดที่อาจเกิดขึ้นได้ในขั้นตอนนี้คือการลบข้อมูลผิดพลาด หรือการลบข้อมูลที่จำเป็นออกไป ดังนั้น การแยกชุดข้อมูลระหว่าง Raw Data (ข้อมูลดิบ) และ Clean Data (ข้อมูลที่ผ่านการกรองแล้ว) จึงเป็นสิ่งสำคัญ เพื่อให้สามารถตรวจสอบและกลับไปดูข้อมูลดิบได้ในกรณีที่มีข้อผิดพลาด

คำถาม

  1. เนื้อหาอธิบายเหตุผลในการใช้ข้อมูลทั้งหมด (use all) แม้จะไม่เหมือนกัน (not similar) ในการวิเคราะห์ราคาคอนโดทองหล่อทาวเวอร์อย่างไร และมีข้อดีข้อเสียอย่างไร?
  2. วิธีการ clean data ที่เนื้อหาแนะนำมีขั้นตอนหลักอะไรบ้าง และเหตุใดจึงต้องทำการ custom sort ก่อนการ remove duplicate?
  3. เนื้อหาอธิบายความสำคัญของการเก็บ raw data ไว้อย่างไร และมีวิธีการจัดการ raw data และ clean data อย่างไร?
  4. ในกรณีที่พบข้อมูลที่อาจผิดพลาด (เช่น ตัวเลขผิด) แต่ข้อมูลอื่นๆ ในชุดเดียวกันดูสมเหตุสมผล เนื้อหาแนะนำให้จัดการอย่างไร?
  5. เนื้อหาอธิบายวิธีการพิจารณาว่าข้อมูลใดควรเก็บไว้หรือตัดออกในกรณีที่มีข้อมูลจำกัดอย่างไร และมีหลักการในการตัดสินใจอย่างไร?

สรุป

การ Clean Data เป็นขั้นตอนที่ช่วยให้ข้อมูลที่ใช้ในการประเมินราคาทรัพย์สินมีความแม่นยำมากขึ้น ในกรณีของ Thonglor Tower การลบข้อมูลซ้ำและการจัดเรียงข้อมูลตามเกณฑ์ต่างๆ ทำให้เราสามารถนำข้อมูลที่ถูกต้องไปใช้ในการคำนวณและวิเคราะห์ได้อย่างมีประสิทธิภาพ ข้อมูลที่ได้จากขั้นตอนนี้จะถูกนำไปใช้ในขั้นตอนต่อไปของการคำนวณราคาต่อตารางเมตร

คำสำคัญ: Thonglor Tower, Clean Data, การประเมินมูลค่า, ราคาต่อตารางเมตร, การลบข้อมูลซ้ำ

อ้างอิง: C112-2-2 Clean data for Example 2 Thonglor Tower

โพสนี้ถูกสรุปสั้นๆ จาก VDO อ้างอิง เพื่อใช้ทวน นักศึกษาควรดูวิดีโอนั้นๆ ตามรหัสวิดีโอ