fix(latex): clarify PCA component determination and enhance grid-search results presentation

This commit is contained in:
Rifqi D. Panuluh
2025-10-15 05:46:28 +00:00
parent 06ddea8162
commit af31affe07

View File

@@ -187,7 +187,7 @@ Hasil eksplorasi ini menunjukkan bahwa:
komplementer pada tahap pelatihan model.
\end{enumerate}
Temuan ini menjadi dasar untuk menentukan jumlah komponen PCA yang akan digunakan pada \textit{grid search} saat optimasi \textit{hyperparameter} model SVM.
Temuan ini menjadi dasar untuk menentukan potensi jumlah komponen PCA yang akan digunakan pada \textit{grid search} saat optimasi \textit{hyperparameter} model SVM.
\section{Hasil \textit{Coarse Grid-Search}}
\label{sec:grid-results}
@@ -195,18 +195,56 @@ Temuan ini menjadi dasar untuk menentukan jumlah komponen PCA yang akan digunaka
Setelah proses ekstraksi fitur dan pembentukan dataset berlabel,
tahap berikutnya adalah melakukan pencarian \textit{grid}
untuk mengoptimalkan parameter model \gls{svm}
dengan kernel \gls{rbf}.
Tiga parameter yang dioptimalkan adalah:
\begin{enumerate}
\item jumlah komponen utama \(\,n_{\text{components}}\,\) pada reduksi dimensi \gls{pca},
\item parameter regulasi \(C\),
\item parameter kernel \(\gamma\).
\end{enumerate}
dengan kernel \gls{rbf} seperti yang disajikan dalam Tabel~\ref{tab:grid_search_parameters}.
Total kombinasi parameter yang diuji berjumlah \(5\times5\times8 = 200\) kandidat model
dengan skema \textit{stratified 5-fold cross-validation} menghasilkan total 1000 kali \textit{fitting}.
Setiap kombinasi dievaluasi menggunakan metrik akurasi rata-rata
pada data validasi.
pada data validasi. Proses ini memakan waktu hingga 1 jam 38 detik untuk Sensor A dan 1 jam 34 detik untuk Sensor B pada spesifikasi perangkat keras seperti pada Subbab~\ref{sec:hardware}.
\begin{table}[H]
\centering
\begin{tabular}{rrrrr}
\toprule
$n_{\text{components}}$ & $C (\log{2})$ & $\gamma (\log{2})$ & $S_i$ & $T_i$ \\
\midrule
4 & 5 & -5 & 0.80764 & 11.22306 \\
8 & 5 & -5 & 0.97076 & 10.88293 \\
16 & 5 & -5 & 0.99116 & 10.53770 \\
32 & 10 & -10 & 0.99394 & 10.45783 \\
64 & 10 & -10 & 0.99631 & 13.46819 \\
128 & 5 & -10 & 0.99728 & 13.43715 \\
256 & 5 & -10 & 0.99756 & 17.84189 \\
512 & 5 & -10 & 0.99763 & 31.24036 \\
\bottomrule
\end{tabular}
\caption{Hasil ringkasan \textit{coarse grid-search} pada Sensor A ($\mathcal{D}_A$).}
\label{tab:coarse_summary_A}
\end{table}
\begin{table}[H]
\centering
\begin{tabular}{rrrrr}
\toprule
$n_{\text{components}}$ & $C (\log{2})$ & $\gamma (\log{2})$ & $S_i$ & $T_i$ \\
\midrule
4 & 5 & -5 & 0.87845 & 13.77282 \\
8 & 0 & -5 & 0.98051 & 12.51643 \\
16 & 5 & -5 & 0.99443 & 10.90890 \\
32 & 5 & -10 & 0.99596 & 13.42619 \\
64 & 5 & -10 & 0.99735 & 11.40759 \\
128 & 5 & -10 & 0.99728 & 14.54694 \\
256 & 5 & -10 & 0.99777 & 20.27980 \\
512 & 5 & -10 & 0.99791 & 39.63068 \\
\bottomrule
\end{tabular}
\caption{Hasil ringkasan \textit{coarse grid-search} pada Sensor B ($\mathcal{D}_B$).}
\label{tab:coarse_summary_B}
\end{table}
Tabel~\ref{tab:coarse_summary_A} dan~\ref{tab:coarse_summary_B} menunjukkan hasil ringkasan \textit{coarse grid-search} dengan nilai maksimum \textit{mean test score} untuk setiap konfigurasi $n_{\text{components}}$ pada Sensor A ($\mathcal{D}_A$) dan Sensor B ($\mathcal{D}_B$). Kolom $S_i$ menunjukkan akurasi tertinggi yang dicapai, sedangkan kolom $T_i$ mencatat waktu rata-rata (dalam detik) yang dibutuhkan untuk melatih model (\textit{mean fit time}) pada setiap kombinasi parameter.
Dari hasil tersebut, terlihat bahwa $n_{\text{components}}=64$ sudah mencapa akurasi yang cukup tinggi untuk kedua kanal sensor, dengan akurasi $\pm 99.7\%$, dengan peningkatan yang semakin kecil pada jumlah komponen yang lebih besar yaitu kurang dari 0.001\%. Hal ini menunjukkan bahwa data getaran struktur yang diekstraksi dengan \gls{stft} memiliki daya klasifikasi yang kuat terhadap kondisi struktur, dan penggunaan lebih dari 64 komponen utama memberikan peningkatan akurasi yang marginal.
% \subsection{Evaluasi Keseluruhan}
% Distribusi akurasi seluruh kandidat model ditunjukkan pada
@@ -360,12 +398,12 @@ Berdasarkan kombinasi akurasi, waktu pelatihan, dan metrik efisiensi,
konfigurasi dengan $n_{\text{components}}=32$ untuk Sensor A dan $n_{\text{components}}=16$ untuk Sensor B dipilih sebagai
\textit{baseline} optimal untuk model akhir.
Model \textit{baseline} ini akan digunakan sebagai acuan pada tahap evaluasi model dan pencarian \textit{hyperparameter} lanjutan (\textit{fine grid-search})
yang dibahas pada subab berikutnya.
yang dibahas pada subbab berikutnya.
\section{Evaluasi Model \textit{Baseline}}
\label{sec:baseline_performance}
Model \textit{baseline} yang digunakan diperoleh dari \textit{coarse grid-search} pada subab \ref{sec:efficiency_analysis} adalah SVM dengan kernel RBF, 32 komponen PCA, dan parameter $C=2^{10}$, $\gamma=2^{-10}$ untuk Sensor A, sedangkan untuk Sensor B adalah SVM dengan kernel RBF, 16 komponen PCA, dan parameter $C=2^{5}$, $\gamma=2^{-5}$. Pada bagian ini, dilakukan evaluasi performa model \textit{baseline} dengan data uji yang berbeda (\textit{Dataset} B).
Model \textit{baseline} yang digunakan diperoleh dari \textit{coarse grid-search} pada Subbab~\ref{sec:efficiency_analysis} adalah SVM dengan kernel RBF, 32 komponen PCA, dan parameter $C=2^{10}$, $\gamma=2^{-10}$ untuk Sensor A, sedangkan untuk Sensor B adalah SVM dengan kernel RBF, 16 komponen PCA, dan parameter $C=2^{5}$, $\gamma=2^{-5}$. Pada bagian ini, dilakukan evaluasi performa model \textit{baseline} dengan data uji yang berbeda (\textit{Dataset} B).
\subsection{Metrik Klasifikasi}
@@ -436,7 +474,7 @@ Dari Gambar~\ref{fig:confusion-matrix-baseline_A} dan~\ref{fig:confusion-matrix-
\section{\textit{Fine Grid-Search}}
Optimasi model yang dilakukan yaitu dengan melakukan \textit{fine grid-search} pada rentang \textit{hyperparameter} model \textit{baseline} yang digunakan pada Subab~\ref{sec:baseline_performance}. Untuk Sensor A dengan $n_{\text{components}} = 32$ rentang parameter yang dicari adalah
Optimasi model yang dilakukan yaitu dengan melakukan \textit{fine grid-search} pada rentang \textit{hyperparameter} model \textit{baseline} yang digunakan pada Subbab~\ref{sec:baseline_performance}. Untuk Sensor A dengan $n_{\text{components}} = 32$ rentang parameter yang dicari adalah
\begin{align*}
C &= \{\, 2^8,\, 2^{8.5},\, \ldots,\, 2^{12} \,\} \\
\gamma &= \{\, 2^{-12},\, 2^{-11.5},\, \ldots ,\, 2^{-8} \,\},