Monitoring | Dot Enterprise

Monitoring

PostgreSQL Monitoring: Performance Tuning สำหรับ Postgres

PostgreSQL ขึ้นชื่อเรื่องความเสถียรและประสิทธิภาพสูง แต่การทำให้ระบบทำงานได้อย่างเต็มศักยภาพนั้นต้องอาศัยการ Monitoring ที่ครอบคลุมและการ Tuning ที่เหมาะสมกับ Workload จริง การปล่อยให้ฐานข้อมูลทำงานด้วยค่า Default ที่ติดตั้งมาตั้งแต่เริ่มต้นมักนำไปสู่ปัญหา Slow Query, Connection Exhaustion, หรือ Dis

Monitoring

MySQL Exporter: Monitor MySQL Server ด้วย Prometheus

การติดตาม MySQL Server ให้ทำงานได้อย่างมีประสิทธิภาพต้องอาศัย Metrics ที่ครบถ้วนและต่อเนื่อง ทั้ง Query Performance, Connection Usage, InnoDB Buffer Pool, Replication Lag และอื่น ๆ อีกมาก การเก็บข้อมูลเหล่านี้ด้วยตนเองจากคำสั่ง SHOW STATUS หรือ information_schema อาจใช้ได้กับการ debug เฉพาะหน้า แต่ไ

Monitoring

Database Monitoring: MySQL และ PostgreSQL Health Check

Database เป็นหัวใจของระบบ application ส่วนใหญ่ — เมื่อฐานข้อมูลช้าหรือล่ม ผลกระทบจะลามไปทั่วทั้งระบบ การ monitor ที่ดีจึงเน้นการตรวจจับสัญญาณเตือนก่อนที่จะกลายเป็นปัญหา ไม่ใช่รอให้ user แจ้งว่าช้า บทความนี้อธิบาย metric สำคัญสำหรับ MySQL และ PostgreSQL พร้อม query สำหรับ debug และแนวทาง alert rule ท

Monitoring

Network Monitoring: ตรวจสอบ Bandwidth, Latency, Packet Loss

Network monitoring เป็นการตรวจสอบคุณภาพการเชื่อมต่อเครือข่ายใน 3 มิติหลัก คือ bandwidth (ปริมาณข้อมูลที่รับส่งได้), latency (เวลาตอบกลับ) และ packet loss (อัตราการสูญเสียแพ็กเก็ต) ทั้งสามตัวชี้วัดนี้ส่งผลโดยตรงต่อประสบการณ์ใช้งาน — เว็บโหลดช้า, video call กระตุก, database query timeout ล้วนสืบย้อนถึ

Monitoring

Uptime Monitoring Tools: Uptime Kuma vs Statuspage

Uptime monitoring เป็นการตรวจสอบว่าเว็บไซต์หรือ API ยังตอบรับ request ได้หรือไม่ จากจุดภายนอกที่ไม่ใช่เซิร์ฟเวอร์เอง เมื่อระบบล่ม tool เหล่านี้จะแจ้งเตือนผ่าน email, SMS, Slack หรือ webhook ให้ทีม oncall รู้ทันที และบันทึก downtime history เพื่อคำนวณ SLA ในแต่ละเดือน บทความนี้เปรียบเทียบ 6 tool ยอดน

Monitoring

Infrastructure Monitoring: Monitor VPS HealthStatus Uptime

Infrastructure Monitoring คือการเฝ้าระวัง VPS และเซิร์ฟเวอร์ทั้งฝั่ง hardware resource และ service availability เพื่อให้รู้ล่วงหน้าว่าระบบกำลังจะล่ม หรือทรัพยากรใกล้เต็ม ทำให้ทีม DevOps สามารถ scale หรือแก้ไขก่อนที่ user จะได้รับผลกระทบ การ monitor ที่ดีต้องครอบคลุมทั้ง health metrics (CPU, RAM, Dis

Monitoring

Alert Best Practices: สร้าง Alert ที่ Actionable และลด False Positive

ปัญหาที่พบบ่อยที่สุดของทีม oncall คือ notification ท่วมท้นจน engineer เริ่มเพิกเฉย ส่วนใหญ่เกิดจากการตั้งเงื่อนไขแจ้งเตือนที่ไม่ actionable — ปลุกคนกลางดึกโดยไม่มีอะไรต้องทำ, แจ้งซ้ำ ๆ จนกลายเป็น noise, หรือไม่มีบริบทพอที่จะเริ่ม troubleshoot การออกแบบกฎแจ้งเตือนที่ดีจึงเป็นศิลปะที่สำคัญไม่แพ้การเขี

Monitoring

Alertmanager: จัดการ Alerts จาก Prometheus ด้วย Grouping Routing

Alertmanager เป็นส่วนประกอบสำคัญของ Prometheus ecosystem ที่ทำหน้าที่รับสัญญาณจาก Prometheus server แล้วจัดการตั้งแต่การ deduplicate, grouping, silencing, inhibition ไปจนถึงการ route ส่งต่อยังช่องทางปลายทางเช่น email, Slack, PagerDuty หรือ webhook การใช้งานอย่างถูกวิธีจะช่วยลด noise และทำให้ทีม onca

Monitoring

Alert Management: PagerDuty, Opsgenie สำหรับ On-Call Rotation

Alert Management เป็นหัวใจของการทำ on-call ที่ดี — แค่ส่งการแจ้งเตือนเข้า email หรือ Slack ยังไม่พอ เพราะเมื่อมีหลาย service หลายทีม notification จะท่วมท้นจนทีมเริ่มเบื่อหน่าย (alert fatigue) และพลาดเหตุการณ์สำคัญ PagerDuty และ Opsgenie เป็น platform ที่ออกแบบมาสำหรับ on-call rotation โดยเฉพาะ มี es

Monitoring

Elastic APM: Application Performance Monitoring ด้วย Elastic Stack

Elastic APM เป็นเครื่องมือ Application Performance Monitoring ที่ทำงานร่วมกับ ELK Stack (Elasticsearch, Kibana, Beats, Logstash) ให้ความสามารถในการเก็บ traces, metrics และ error log ของแอปพลิเคชันรวมไว้กับ log analytics ในแพลตฟอร์มเดียวกัน ไม่ต้องใช้ backend แยกหลายตัว ลดความซับซ้อนในการ deploy และค