
cleansing data
ต้องเข้าใจว่าการทำการตลาดในปัจจุบัน ทุกบริษัท ฯ จะให้ความสำคัญกับ Database ข้อมูล เป็นอย่างมาก เพราะการได้ข้อมูล Database นั้นสามารถนำไป วิเคราะห์ข้อมูลทางการตลาด /การขาย / วิเคราห์ลูกค้า / อื่น ๆ ทุกอย่างของข้อมูลคือ นำไปต่อยอดช่องทางการขายและการตลาดของสินค้าและบริการ
ซึ่งวันนี้เป็นโจทย์ที่ได้รับมอบหมาย ที่ดูแลรับผิดชอบทางด้าน Content Marketing / Webmaster/ Web Developer ซึ่งเหมารวมว่าตอนนี้รับผิดชอบในคน ๆ เดียว ว่าจะเอารายชื่อตัวแทนจำหน่าย (Retailer Name) ขึ้นบน Website แต่ยังไม่สามารถทำได้ทันทีเพราะ Data ที่ได้มาจากทางฝ่ายขายยังใช้งานไม่ได้ เพราะ ยังไม่ผ่านการ Cleansing Data โดยข้อมูลที่ได้รับมามันไม่สมบูรณ์
จากการรวบรวมรายชื่อประมาณ เกือบ 1000 รายชื่อที่ได้รับมาแล้วจะเจอปัญหาคือ Database มันเรียงมาแบบปนเปทุกอย่างเข้ามาหมด ประมาณนี้
- รายชื่อภาษาไทย ปน ภาษาอังกฤษ (โจทย์คือระบุภาษาไทยเพียงอย่างเดียว)
- เบอร์โทรไม่มี / ถ้ามี จะมีมากกว่า 1 / ใส่ผู้ติดต่อเข้ามาด้วย
- รายชื่อให้มาซ้ำมากกว่า 1 รายชื่อ
- รายชื่อซ้ำกัน แต่อยู่คนละที่อยู่ ต้องการเอาที่อยู่ มาเชื่อมกับรายชื่อ เพื่อจะได้รู้ว่าไม่ซ้ำกัน
- อื่น ๆ
ใช้เวลาทำการบ้านอยู่หลายวันในการศึกษาผ่านทางด้าน You tube และ Group Excel Facebook ก่อนที่จะลงมือ Cleansing จริง ๆ เพราะ การ Cleansing Data สำหรับคนทำงานทางด้านนี้ที่เจอคือ ง่วง + เบื่อมาก ต้องหาแรงบันดาลใจในการทำจริง ๆ
Case ที่ไปศึกษามาน่าสนใจมาก เผื่อใครจะ Cleansing Data ตัวนี้น่าสนใจ

ตัวอย่างนี้ไปได้มาจากทาง สามารถ download กด ได้ที่นี่

เอามาใช้จริงได้ดีมาก เพื่อแยก ชื่อ เบอร์ โทร ออกจากกัน
1. มาเริ่มกันที่ รายชื่อ ซ้ำ แต่ ที่อยู่ ต่างกัน
Excle เราใช้ “string”&”string” ได้ แล้ว paste เป็น Value ก็ได้ชื่อ+ที่อยู่มาแล้วเป็นอันดับแรก ระหว่างทำก็ ดูว่ารายชื่อไหนเป็นภาษาอังกฤษก็ข้ามไปก่อน เพราะ จะง่ายในการแยก รายชื่อภาษาอังกฤษที่ไม่เข้าพวกตอนใช้ Filter

2. รายชื่อที่เป็นภาษาอังกฤษ จะถูกแยกโดยใช้ Filter ทำไว้เป็นอีก 1 Sheet แล้วก็จะได้ Data ที่รวมเอารายชื่อ+ที่อยู่ มาแล้วจำนวนนึงโดยตัดรายชื่อไม่เข้ากลุ่ม คือภาษาอังกฤษออก

3. เบอร์โทร / มีคนติดต่อมาอยู่ในช่องเดียวกัน มีหลายเบอร์โทร
แนะนำให้รู้จัก เครื่องมือ Power Query ใครยังไม่มีไป Download ได้เลย
หน้าที่เราคือต้องแยกเบอร์โทรแล้วจัดเรียง Format ใหม่

ใช้ Spilt Column โดย ใช้ delimiter ถ้าเป็น / หรือ , ให้แยกออกมาอีกตาราง

Copy ทุกอย่างไปไว้ อีก 1 Sheet แต่เบอร์โทรเรากำหนด Format ใหม่ไปเลย โดยตั้ง format เป็น custom เป็น Format เบอร์โทรไปเลย เวลา User พิมพ์ Data ใหม่เข้ามา 0#-####-####
ก็เป็นขั้นตอนคร่าว ๆ ในการ Cleansing ข้อมูล ให้ Data พร้อมใช้ในขั้นตอนต่อไป
4. การนำ Data ขึ้นบน Website (ตัวนี้ Download จาก Github มาน่าสนใจมาก) Search ค้นหาได้ง่าย
