Self Learner | Information Technology Enthusiast | Hamba Allah

My photo
Pribadi yang berdzikir itu : kalau bicara, bicaranya dakwah, diamnya berdzikir, nafasnya tasbih, matanya penuh ramat Allah, telinganya terjaga, pikirannya baik sangka, tidak suka sinis, pesimis dan tak suka memvonis. . dia tidak sibuk mencari kesalahan orang lain dan asik memperbaiki dirinya . . (Ust.Muhammad Arifin Ilham)

Tuesday, May 31, 2016

Troubleshooting Methodology for VMware NSX




Didalam operasional VMware NSX tentunya (berharap semoga tidak) terkadang timbul masalah pada system yang sedang berjalan, dapat diakibatkan oleh banyak hal misalnya: issue konektivitas Antara vCenter Server dan NSX Manager, NSX Manager dengan NSX Controller, Issue konektivitas antar VM melalui VXLAN, dan masalah-masalah lainnya yang sebenarnya tidak diinginkan.
Berikut ini beberapa langkah-langkah terstruktur yang seharusnya dilakukan ketika melakukan troubleshooting didalam system VMware NSX:

1. Define the Problem
Yang sebenarnya terjadi ketika ada masalah didalam system pastinya ada sesuatu yang salah, banyak factor yang mengakibatkan terjadinya masalah seperti: Configuration Issue, Resource contention, terjadinya serangan, adanya Bug pada software, Hardware failure, dan lainnya.
Pada tahap ini kita harus mendefinisikan, atau setidaknya benar-benar mengetahui masalah apa yang sebenarnya sedang terjadi? Untuk memastikan letak masalah apa yang terjadi sebaiknya lakukan hal-hal berikut:

  • Identifying Symptoms
Membandingkan antara masalah yang terjadi dengan gejala-gejala yang ada, contohnya sebagai berikut:
Symptoms
Problem
Komunikasi antar VM di ESXi host yang berbeda bermasalah Test ping menggunakan semua logical switch yang ada di host tersebut bermasalah
Tidak bisa melakukan pendaftaran vSphere Cluster kedalam system NSX Cek log menunjukan “Name or Service is not known”
Dan contoh-contoh lainnya.
Pada hasilnya, kita dapat meng-kerucutkan akar masalah yang sebenarnya terjadi dimana

  • Gathering Information
Mengumpulkan sebanyak-banyaknya informasi yang berkaitan dengan hasil pengerucutan masalah, misalnya IP address dari DNS Server, NTP Server, vNIC yang digunakan sebagai VTEP, jenis metode uplink yang digunakan ke physical switch dan yang lainnya. Hal tersebut akan sangat berguna nantinya, karena akan memudahkan proses verifikasi konfigurasi untuk solving the issue.

  • Identify recent changes
Mengidentifikasi perubahan apa yang baru dilakukan sebelum terjadinya masalah? Akan sangat lucu jika misalnya problem pada konektivitas Logical switch dan ternyata diakibatkan team network sebelumnya melakukan penggantian IP pada VTEP Gateway.


2. Identify the Cause of the Problem
Setelah menentukan masalah apa yang sebenarnya terjadi, beserta data-data yang sudah dikumpulkan, maka seharusnya akan sangat mudah untuk menentukan root-cause dari masalah tersebut, namun untuk menghasilkan analisa yang tepat sebaiknya lakukan 3 proses berikut:

  • Identify possible cause
Mengumpulkan kemungkinan-kemungkinan penyebab masalah, kumpulkan sebanyak-banyaknya

  • Determining the root cause
Menentukan akar dari penyebab masalah yang terjadi pada system NSX, tentunya bukan sekedar “workaround” agar kedepannya problem tidak terjadi lagi.

3. Implement the Resolution
Setelah menentukan akar dari penyebab masalah yang terjadi pada NSX, maka selanjutnya adalah melakukan koreksi dari kesalahan-kesalahan yang terjadi. Namun agar kedepannya problem tersebut tidak terulang, maka perlu untuk melakukan langkah-langkah berikut:

  • Identify possible solution
Mengumpulkan daftar kemungkinan-kemungkinan langkah perbaikan yang akan dilakukan

  • Implementing the best Solution
Perhatikan daftar langkah-langkah perbaikan yang sudah ada, pertimbangkan besar efek dari masing-masing di list tersebut, kemudian pilih solusi yang efeknya tidak akan berpengaruh menimbulkan issue-issue yang lain.

  • Verifying the resolution
Setelah langkah perbaikan dilakukan, lakukan pengetesan dan pengecekan, apakah masalah benar-benar sudah selesai? Adakah masalah lain yang timbul?

  • Document the resolution
Setelah semuanya dijalankan dengan baik dan problem benar-benar telah solved, maka jangan lupa untuk melakukan dokumentasi atas langkah-langkah perbaikan yang sudah dilakukan. Supaya jika dikemudian hari problem yang sama timbul lagi, maka orang lain dapat mengatasinya dengan baik sebagaimana anda telah melakukannya.

In anyway, these are the key point:
  •   Identifikasi troubleshooting secara terstruktur akan membantu kita mengatasi problem secara efektif
  • Identifikasi antara "Gejala" dan "Problem" adalah langkah yang sangat penting didalam proses troubleshooting
  • Selain itu pengetahuan dan Skill yang kita miliki mengenai cara kerja SDDC VMware didalam infrastructure akan sangat membantu untuk mengetahui "What's going on?"
  • Disamping itu juga skill dasar networking yang mumpuni juga akan sangat membantu, dikarenakan troubleshooting Network Virtualization itu tidak terlalu jauh berbeda konsepnya dengan legacy networking.

Untuk tulisan di awal ini sepertinya masih terlalu general, untuk postingan selanjutnya mungkin akan lebih spesifik dan (sangat) teknis serta menguras tenaga :D

Cheers !

Singapore,
31 May 2016

0 comments:

Post a Comment