Mengapa Server Anda Butuh smartctl? Panduan Lengkap Deteksi Dini Kerusakan Storage (HDD & SSD)
Dalam pengelolaan server atau komputer workstation, komponen yang paling sering mengalami kegagalan mekanis atau keausan adalah media penyimpanan (storage). Kehilangan data akibat drive yang mati mendadak adalah mimpi buruk setiap administrator sistem.
Untuk mencegah hal tersebut, Linux menyediakan sebuah tool berbasis teks yang sangat kuat bernama smartctl. Artikel ini akan membahas apa itu smartctl, fungsinya, kompatibilitasnya dengan SSD, serta cara menggunakannya untuk mendeteksi kesehatan drive Anda sebelum terlambat.
Apa itu smartctl dan Apa Fungsinya?
smartctl adalah perintah berbasis CLI (Command Line Interface) yang digunakan untuk mengontrol dan memonitor sistem S.M.A.R.T. (Self-Monitoring, Analysis, and Reporting Technology) yang tertanam pada hampir semua Hard Disk (HDD) dan Solid State Drive (SSD) modern.
Fungsi utama dari smartctl antara lain:
Membaca Telemetri Internal: Melihat statistik operasional drive seperti suhu, jumlah jam menyala (Power-On Hours), hingga siklus mati-nyala (Power Cycle).
Deteksi Dini Kerusakan: Menampilkan indikator kegagalan seperti adanya sektor yang rusak (Bad Sectors / Reallocated Sectors).
Menjalankan Uji Mandiri (Self-Test): Memerintahkan drive untuk melakukan pengujian sirkuit dan permukaan piringan/flash secara mandiri guna memastikan tidak ada korupsi data.
Apakah smartctl Hanya untuk HDD atau Bisa untuk SSD?
Sebuah kesalahpahaman umum adalah menganggap smartctl hanya berlaku untuk Hard Disk mekanis (HDD) tua.
Faktanya: smartctl sepenuhnya mendukung SSD, baik yang menggunakan antarmuka SATA maupun NVMe (M.2 / U.2).
Namun, ada perbedaan cara kedua jenis drive ini melaporkan kesehatannya:
Pada HDD: smartctl akan menampilkan atribut mekanis seperti Load_Cycle_Count (gerakan lengan mekanis) dan Spin_Up_Time.
Pada SSD: Karena tidak memiliki komponen bergerak, smartctl akan menampilkan atribut berbasis ketahanan flash (NAND), seperti Percentage Used (tingkat keausan umurnya), Data Units Written (total data yang pernah ditulis/TBW), dan Media and Data Integrity Errors.
Cara Melakukan Pengecekan dengan smartctl
Sebelum menjalankan perintah, Anda harus masuk sebagai pengguna root atau menggunakan akses sudo.
1. Identifikasi Nama Drive Anda
Langkah pertama adalah mengetahui nama drive yang terpasang di sistem (misalnya /dev/sda, /dev/sdb, atau /dev/nvme0n1). Anda bisa mengeceknya dengan perintah:
lsblk
2. Memeriksa Informasi Singkat Kesehatan Drive
Untuk melihat apakah drive Anda secara umum lolos uji kesehatan dasar dari pabrikan, gunakan perintah:
smartctl -H /dev/sdb
Jika hasilnya PASSED, drive Anda masih beroperasi dalam batas normal. Jika FAILED, segera amankan data Anda.
3. Menampilkan Seluruh Atribut SMART (Rekomendasi)
Untuk melihat statistik detail dan angka mentah (raw value) dari kondisi internal drive, gunakan opsi -A (atau -a untuk informasi menyeluruh):
smartctl -A /dev/sdb
Atribut Penting yang Wajib Diperhatikan:
Reallocated_Sector_Count (ID 5): Jika angka mentahnya di atas 0, berarti ada sektor yang rusak dan dialihkan. Ini tanda awal HDD mulai sekarat.
Power_On_Hours (ID 9): Menunjukkan berapa lama drive sudah menyala.
Current_Pending_Sector (ID 197): Sektor tidak stabil yang menunggu untuk dipetakan ulang. Biasanya menyebabkan sistem freezing atau stuck saat membaca data.
Percentage Used (Khusus NVMe SSD): Menunjukkan berapa persen sisa umur sel flash SSD Anda. Jika sudah mendekati 100%, SSD harus segera diganti.
4. Menjalankan Self-Test Secara Mandiri
Jika Anda mencurigai adanya kerusakan tersembunyi, Anda bisa memerintahkan drive untuk memeriksa dirinya sendiri di latar belakang.
Uji Pendek (Short Test - memakan waktu ~2 menit):
smartctl -t short /dev/sdb
Uji Panjang/Menyeluruh (Long Test - memakan waktu hitungan jam):
smartctl -t long /dev/sdb
Untuk melihat hasil dari pengujian tersebut, jalankan perintah:
smartctl -l selftest /dev/sdb
smartctl -a /dev/sdb | grep -A 4 "Self-test execution"
Kesimpulan
smartctl adalah garis pertahanan pertama Anda dalam menjaga integritas data di server. Melakukan pengecekan rutin menggunakan tool ini memungkinkan Anda untuk melakukan migrasi data atau penggantian komponen sebelum hardware benar-benar mati total dan menyebabkan downtime yang merugikan bisnis.
Selalu jadwalkan pengecekan otomatis (menggunakan smartd) agar kesehatan penyimpanan server Anda selalu terpantau setiap saat.
