Big Data คือ ข้อมูลขนาดใหญ่มากจนซอฟต์แวร์หรือฮาร์ดแวร์ธรรมดานั้นไม่สามารถที่จะจัดการหรือวิเคราะห์ได้อย่างมีประสิทธิภาพ จึงต้องมีซอฟต์แวร์รองรับ เช่น rapidminer เป็นต้น
Big Data การรวบรวมข้อมูลทั้ง Structured (พวกที่เก็บในโครงสร้างตารางข้อมูล) และ Unstructured (พวกที่เป็น text ยาวๆ รูปภาพ และ วิดีโอต่างๆ) มาทำการประมวลวิเคราะห์ข้อมูลและนำไปใช้ประโยชน์
Big data คือ ข้อมูลที่ประกอบด้วยคุณลักษณะ 4 อย่างคือ
1. Volume size ของข้อมูลที่มีขนาดใหญ่ มีปริมาณข้อมูลมาก ซึ่งสามารถเป็นได้ทั้งข้อมูลแบบ offline หรือ online
2. Variety ข้อมูลมีความหลากหลาย สามารถเป็นได้ทั้งที่มีโครงสร้างและข้อมูลที่ไม่สามารถจับ pattern ได้
3. Velocity ข้อมูลมีการเปลี่ยนแปลงตลอดเวลาอย่างรวดเร็ว มีการส่งผ่านข้อมูลอย่างต่อเนื่องในลักษณะ streaming ทำให้การวิเคราะห์ข้อมูลแบบ manual มีข้อจำกัด
4. Veracity ข้อมูลมีความไม่ชัดเจน (untrusted, uncleaned)
Big data analytics คือ กระบวนการวิเคราะห์เซ็ตข้อมูลขนาดใหญ่เพื่อค้นหารูปแบบความสัมพันธ์ของข้อมูลเหล่านั้นที่ซ่อนอยู่ข้างใน หาสิ่งเชื่อมโยงที่เชื่อมข้อมูลเหล่านั้นเข้าไว้ด้วยกัน หาเทรนด์ทางการตลาด หาความต้องการของลูกค้า และข้อมูลอื่นๆที่เป็นประโยชน์ต่อธุรกิจ ผลการวิเคราะห์ข้อมูลนี้สามารถนำไปสู่การทำแผนการตลาดที่มีประสิทธิภาพ โอกาสในการสร้างผลกำไร การให้บริการที่ดีมากขึ้นแก่ลูกค้า การปรับปรุงการทำงานให้เกิดประสิทธิภาพ ความได้เปรียบเหนือคู่แข่งในการแข่งขันทางการตลาด และผลประโยชน์ทางธุรกิจด้านอื่นๆ
เป้าหมายหลักของ Big data analytics หรือ การวิเคราะห์บิ๊กดาต้า คือ ช่วยในการให้ข้อมูลกับบริษัทเพื่อใช้ในการตัดสินใจทางธุรกิจโดยการใช้ นักวิทยาศาสตร์ข้อมูล (data scientists) นักวิเคราะห์ข้อมูลเชิงสถิติ (predictive modelers) และผู้เชี่ยวชาญในการวิเคราะห์ข้อมูลด้านอื่นๆ มาทำการวิเคราะห์ข้อมูลขนาดใหญ่ที่มีการส่งผ่านภายในองค์กรหรือบริษัท รวมไปถึงข้อมูลที่อยู่ในรูปแบบอื่นๆ ที่อาจซุกซ่อนอยู่ในระบบต่างๆของบริษัท ซึ่งแหล่งข้อมูลที่จะถูกนำมาวิเคราะห์นี้หมายรวมถึง เว็บเซิร์ฟเวอร์ล็อคและการคลิกดูข้อมูลบนอินเตอร์เน็ต คอนเท้นท์บนโซเชี่ยลมีเดียและรายงานกิจกรรมต่างๆบนเครือข่ายสังคมออนไลน์ ข้อความจากอีเมลของลูกค้าและการตอบแบบสอบถาม เสียงบันทึกรายละเอียดทางโทรศัพท์ของลูกค้า และข้อมูลที่มีการบันทึกได้จากเซ็นเซอร์บนอุปกรณ์ที่เชื่อมต่อแบบ Internet of Things
Why big data now?
มีหลายคนที่เกิดคำถามว่าทำไมเรื่อง big data จึงกลายเป็นกระแสในปัจจุบัน
- Demand for better data เกิดกระแสกดดันภายใต้บริบทของการปฏิรูป สภาวะทางเศรษฐกิจ และนวัตกรรมใหม่ๆ
- Supply of relevant data at scale มีการแพร่หลายและไหลเวียนของข้อมูลทั้งข้อมูลทางการแพทย์และข้อมูลอื่นๆที่สามารถเข้าถึงได้ทั่วไป
- Technical capability มีการพัฒนาเทคนิคในการวิเคราะห์ข้อมูลจำนวนมากที่ทันสมัย ทำงานง่ายขึ้นและเข้าถึงได้แพร่หลาย
- Government catalyzing market change มีแรงส่งจากภาครัฐที่ถูกกดดันให้มีการเปิดเผยข้อมูลให้โปร่งใสจนกระจายไปสู่ภาคธุรกิจอื่นๆ
Link VDO : https://youtu.be/SUDzViLAneM
Credit
https://blog.goodfactory.co/big-data
https://medium.com