Prometheus Client Libraries: Instrument Python/Node.js/Go Applications

Prometheus Client Libraries: Instrument Python/Node.js/Go Applications

การเลือก Prometheus client library สำหรับภาษาที่ใช้งานเป็นการตัดสินใจที่ส่งผลต่อ reliability, memory footprint และความสะดวกในการ maintain ระยะยาว แต่ละ library มีปรัชญาและข้อจำกัดเฉพาะ — เช่น Python รองรับ multi-process mode ที่พิเศษ, Go มี CounterVec ที่ต้อง pre-register, Node.js ใช้ async collecti

Instrumentation: เพิ่ม Metrics ใน Application

Instrumentation: เพิ่ม Metrics ใน Application

การจะรู้ว่าแอปพลิเคชันทำงานดีหรือไม่ เพียงแค่เช็คว่า process ยังรันอยู่ไม่พอ เพราะแอปอาจรันได้แต่ตอบช้า มี error เยอะ หรือใช้ทรัพยากรเกินงบ การใส่ instrumentation — การเพิ่มโค้ดเก็บ metrics จากภายในแอป — คือวิธีที่ทำให้ทีมเห็นสิ่งที่เกิดขึ้นจริงในเชิงตัวเลข ไม่ใช่แค่การเดา บทความนี้อธิบายแนวคิดของ a

Checkly: API และ Browser Monitoring as Code ด้วย Playwright

Checkly: API และ Browser Monitoring as Code ด้วย Playwright

เมื่อทีม DevOps ต้องการระบบ monitoring ที่ปฏิบัติกับ check เหมือนกับโค้ด — review ผ่าน Pull Request, ทดสอบใน CI, deploy ผ่าน pipeline — เครื่องมือแบบคลิก UI สมัยเดิมไม่ตอบโจทย์อีกต่อไป Checkly เป็นแพลตฟอร์ม Monitoring as Code ที่ใช้ Playwright scripting ช่วยให้ API check และ browser check ถูกเขียนเป

Synthetic Monitoring: Simulate User Interactions เพื่อ Monitor เชิงรุก

Synthetic Monitoring: Simulate User Interactions เพื่อ Monitor เชิงรุก

ในโลกของ web application และ API ที่ซับซ้อน การรอให้ผู้ใช้งานจริงเจอปัญหาแล้วค่อยแก้ ไม่ใช่ทางเลือกที่ดีอีกต่อไป เพราะ downtime แต่ละนาทีอาจหมายถึงรายได้ที่หายไปและความเชื่อมั่นของลูกค้าที่ลดลง Synthetic Monitoring คือเทคนิคที่ช่วยให้เราตรวจจับปัญหาก่อนผู้ใช้งานจะเจอ ด้วยการจำลองพฤติกรรมผู้ใช้งาน (s

Compliance Monitoring: Audit Logs สำหรับ Security Standards

Compliance Monitoring: Audit Logs สำหรับ Security Standards

การทำ Compliance Monitoring คือการติดตามและเก็บหลักฐานการกระทำบนระบบเพื่อยืนยันว่าองค์กรปฏิบัติตามมาตรฐานด้าน security เช่น PCI DSS, HIPAA, ISO 27001, SOC 2 หรือ GDPR — หัวใจสำคัญคือ Audit Log ที่บันทึกทุก event ที่เกี่ยวข้องกับการเข้าถึงและเปลี่ยนแปลงข้อมูล เพื่อพิสูจน์ได้ว่าใครทำอะไร เมื่อไหร่ ที่

Resource Right-Sizing: ลด Cost โดย Optimize Resource Usage

Resource Right-Sizing: ลด Cost โดย Optimize Resource Usage

การซื้อ resource ใน cloud ยืดหยุ่นกว่า on-premise มาก แต่ความยืดหยุ่นนี้เองที่ทำให้เกิดปัญหา — ทีมส่วนมาก provision resource ไว้เผื่อ peak load แล้วลืมปรับลง ทำให้ CPU, memory, disk วิ่งที่ 10-20% ตลอดเวลา ขณะที่จ่ายเงินเต็มจำนวน การทำ Right-Sizing คือการปรับขนาด resource ให้ตรงกับการใช้งานจริง เพื่

Cost Monitoring: ติดตาม Cloud Spending บน AWS/GCP

Cost Monitoring: ติดตาม Cloud Spending บน AWS/GCP

Cloud Spending เป็นหนึ่งในค่าใช้จ่ายที่ควบคุมได้ยากที่สุดของระบบ IT สมัยใหม่ เพราะ resource ถูกสร้างและลบได้ตลอดเวลาโดยทีมต่าง ๆ ทำให้ค่าใช้จ่ายพุ่งขึ้นโดยไม่รู้ตัว การติดตามค่าใช้จ่ายอย่างเป็นระบบจึงจำเป็น ทั้งเพื่อควบคุมงบประมาณและหา opportunity ในการ optimize — ทีมที่ไม่ monitor cost มักพบบิลเกิน

Container Security Monitoring: Runtime Security ด้วย Falco

Container Security Monitoring: Runtime Security ด้วย Falco

Runtime Security เป็นการตรวจจับพฤติกรรมผิดปกติของ workload ที่กำลังทำงานอยู่ — ต่างจาก vulnerability scanning ที่ตรวจก่อน deploy เพราะ Runtime Security จับได้เฉพาะสิ่งที่กำลังเกิดจริง ๆ เช่น shell ที่ spawn ใน pod, การเขียน file ลง /etc, หรือการอ่าน secret ที่ไม่ควรเข้าถึง ซึ่งเป็น signal สำคัญของ c

Container Monitoring Tools: cAdvisor vs Sysdig vs Falco

Container Monitoring Tools: cAdvisor vs Sysdig vs Falco

การใช้งาน Container ในระบบ Production ต้องการเครื่องมือ Monitoring ที่มองเห็นทั้งการใช้ทรัพยากรของแต่ละ Workload, Process ที่กำลังทำงานอยู่ภายใน, และพฤติกรรมที่อาจเป็นภัยต่อความปลอดภัย เครื่องมือสามตัวที่ถูกนำมาเปรียบเทียบบ่อยที่สุดคือ cAdvisor, Sysdig และ Falco — ซึ่งแต่ละตัวถูกออกแบบมาเพื่อตอบโจทย

PostgreSQL Monitoring: Performance Tuning สำหรับ Postgres

PostgreSQL Monitoring: Performance Tuning สำหรับ Postgres

PostgreSQL ขึ้นชื่อเรื่องความเสถียรและประสิทธิภาพสูง แต่การทำให้ระบบทำงานได้อย่างเต็มศักยภาพนั้นต้องอาศัยการ Monitoring ที่ครอบคลุมและการ Tuning ที่เหมาะสมกับ Workload จริง การปล่อยให้ฐานข้อมูลทำงานด้วยค่า Default ที่ติดตั้งมาตั้งแต่เริ่มต้นมักนำไปสู่ปัญหา Slow Query, Connection Exhaustion, หรือ Dis

LINE CHAT