refactor(latex): Refactor chapter 3

This commit is contained in:
Rifqi D. Panuluh
2025-09-05 10:57:00 +00:00
parent c2f48694c9
commit ebb2c0d686
7 changed files with 56 additions and 23 deletions

View File

@@ -182,4 +182,38 @@ t=0,\dots,512
Karena terdapat total \(6\times5\times513 = 15\,390\) baris, dan setiap baris memiliki \(513\) fitur ditambah satu kolom label, maka bentuk akhir dari data untuk satu sisi sensor adalah:
\begin{equation*}
|\mathcal{D}^{(s)}| = 15\,390 \times 514.
\end{equation*}
\end{equation*}
\subsection{Validasi Silang K-Fold Terstratifikasi}
Untuk mengevaluasi model secara andal dan menghindari \textit{overfitting}, digunakan validasi silang K-Fold terstratifikasi pada masing-masing himpunan data sensor (Sensor A dan Sensor B). Skema ini membagi data menjadi \(K\) lipatan dengan proporsi label yang dipertahankan pada setiap lipatan. Pada iterasi ke-\(k\), model dilatih pada \(\mathcal{D}_{\text{train}}^{(k)}\) (gabungan \(K-1\) lipatan) dan dievaluasi pada \(\mathcal{D}_{\text{val}}^{(k)}\) (lipatan ke-\(k\)). Rata-rata metrik diperoleh sebagai
\begin{equation*}
\mathrm{Metric}_{\mathrm{K\text{-}Fold}}
= \frac{1}{K} \sum_{k=1}^{K} \mathrm{Metric}\bigl(\hat f^{(k)};\, \mathcal{D}_{\text{val}}^{(k)}\bigr),
\end{equation*}
di mana \(\hat f^{(k)}\) adalah model terlatih pada iterasi ke-\(k\). Pada studi ini, nilai \(K\) dipilih \(K=5\) untuk menyeimbangkan variasi estimasi dan biaya komputasi.
\paragraph{Prosedur ringkas:}
\begin{enumerate}
\item Pisahkan fitur dan label dari \(\mathcal{D}^{(s)}\) untuk \(s\in\{\text{A},\text{B}\}\) secara terpisah.
\item Lakukan stratifikasi berdasarkan label kerusakan \(y\) pada \(K=5\) lipatan.
\item Untuk setiap lipatan: latih pengklasifikasi (SVM, LDA, Bagged Trees, Random Forest, XGBoost) pada \(K-1\) lipatan, uji pada lipatan tersisa.
\item Hitung akurasi, presisi, dan \textit{confusion matrix}; ambil rata-rata dan simpangan baku lintas lipatan.
\end{enumerate}
\subsection{Validasi Silang Antar-\textit{Dataset} (Cross-Dataset)}
Selain K-Fold, dilakukan pengujian lintas sumber data untuk menilai generalisasi domain. Diasumsikan tersedia dua himpunan data berbeda (misalnya, Sensor A dan Sensor B, atau dua sesi/penempatan berbeda) yang dilambangkan sebagai \(\mathcal{D}^{(1)}\) dan \(\mathcal{D}^{(2)}\).
\paragraph{Skema latih-uji silang:}
\begin{align*}
ext{Eksperimen-1:}\quad & \hat f_{1} \leftarrow \mathrm{Train}\bigl(\mathcal{D}^{(1)}\bigr), & \mathrm{Eval\ on}\; \mathcal{D}^{(2)} \\
ext{Eksperimen-2:}\quad & \hat f_{2} \leftarrow \mathrm{Train}\bigl(\mathcal{D}^{(2)}\bigr), & \mathrm{Eval\ on}\; \mathcal{D}^{(1)}
\end{align*}
Metrik yang dilaporkan adalah rata-rata kedua arah evaluasi untuk memberikan gambaran seimbang terhadap kemampuan \textit{out-of-domain}:
\begin{equation*}
\mathrm{Metric}_{\mathrm{X\text{-}Domain}}
= \tfrac{1}{2}\Bigl[\,\mathrm{Metric}(\hat f_{1};\, \mathcal{D}^{(2)}) + \mathrm{Metric}(\hat f_{2};\, \mathcal{D}^{(1)})\,\Bigr].
\end{equation*}
\paragraph{Catatan praktis:} Untuk menjaga keadilan komparasi, normalisasi fitur dihitung hanya pada data pelatihan lalu diaplikasikan ke data uji. Bila ukuran kedua himpunan tidak seimbang, dapat digunakan penyeimbangan kelas atau pengambilan sampel berstrata pada tahap pelatihan.

View File

@@ -1,7 +1,7 @@
\chapter{Metode Penelitian}
\input{chapters/id/03_methodology/material/index}
\input{chapters/id/03_methodology/tool/index}
\input{chapters/id/03_methodology/materials}
\input{chapters/id/03_methodology/tools}
\clearpage
\input{chapters/id/03_methodology/steps/index}
\input{chapters/id/03_methodology/data_analysis/index}
\input{chapters/id/03_methodology/data_analysis}

View File

@@ -19,7 +19,7 @@ Alur keseluruhan penelitian ini dilakukan melalui tahapan-tahapan sebagai beriku
\item \textbf{Pengembangan Model:} Membangun dan melatih model klasifikasi berbasis algoritma pemelajaran mesin klasik (SVM, LDA, Bagged Trees, Random Forest, XGBoost) untuk mengklasifikasikan lokasi kerusakan struktur.
\item \textbf{Evaluasi:} Mengevaluasi kinerja model menggunakan metrik akurasi, presisi, dan confusion matrix pada berbagai skenario pengujian.
\item \textbf{Evaluasi:} Mengevaluasi kinerja model menggunakan metrik akurasi, presisi, dan confusion matrix pada berbagai skenario pengujian. Evaluasi dilakukan dengan dua skema: (i) validasi silang K-Fold terstratifikasi pada setiap himpunan data, dan (ii) validasi silang antar-dataset (latih pada Dataset-A, uji pada Dataset-B, dan sebaliknya) untuk menilai kemampuan generalisasi lintas sumber data.
\end{enumerate}
\subsection{Akuisisi Data}

View File

@@ -1,7 +0,0 @@
\section{Alat}
\subsection{Alat Perangkat Keras}
\input{chapters/id/03_methodology/tool/hardware}
\subsection{Alat Perangkat Lunak}
\input{chapters/id/03_methodology/tool/software}

View File

@@ -1,11 +0,0 @@
Berikut merupakan perangkat lunak yang digunakan selama proses penelitian ini:
\begin{itemize}
\item \textbf{Python 3.11} digunakan untuk proses pra-pemrosesan data, pemodelan, dan evaluasi.
\item \textbf{NumPy 1.22.4} digunakan untuk perhitungan deret numerik.
\item \textbf{Pandas 1.5.1} digunakan untuk memanipulasi struktur data.
\item \textbf{Pandas 1.7.3} digunakan untuk memproses sinyal.
\item \textbf{Matplotlib 3.7.1} digunakan untuk menghasilkan plot data.
\item \textbf{Scikit-Learn 1.5.1} digunakan untuk membangun dan melatih model dengan algoritma pemelajaran mesin klasik.
\item \textbf{Jupyter Notebook} digunakan untuk pelatihan model dan percobaan eksperimental secara interaktif.
\end{itemize}

View File

@@ -1,3 +1,6 @@
\section{Alat}
\subsection{Alat Perangkat Keras}
Data getaran struktur yang digunakan dalam penelitian ini diperoleh dari penelitian oleh \textcite{abdeljaber2017}, yang dilakukan menggunakan simulator struktur baja Grandstand di Queens University. Dalam eksperimen tersebut, struktur baja dipasang dengan akselerometer pada setiap sambungan-sambungan (\textit{joints}). Rangkaian perangkat keras yang digunakan untuk pengambilan data meliputi:
\begin{itemize}
@@ -37,3 +40,17 @@ Adapun sumberdaya komputasi yang digunakan untuk pemrosesan semua data dan pemod
\caption{Perangkat akuisisi data (DT9857E-16) dan penguat daya SmartAmp 2100E21-400}
\label{fig:datalogger}
\end{figure}
\subsection{Alat Perangkat Lunak}
Berikut merupakan perangkat lunak yang digunakan selama proses penelitian ini:
\begin{itemize}
\item \textbf{Python 3.11} digunakan untuk proses pra-pemrosesan data, pemodelan, dan evaluasi.
\item \textbf{NumPy 1.22.4} digunakan untuk perhitungan deret numerik.
\item \textbf{Pandas 1.5.1} digunakan untuk memanipulasi struktur data.
\item \textbf{Pandas 1.7.3} digunakan untuk memproses sinyal.
\item \textbf{Matplotlib 3.7.1} digunakan untuk menghasilkan plot data.
\item \textbf{Scikit-Learn 1.5.1} digunakan untuk membangun dan melatih model dengan algoritma pemelajaran mesin klasik.
\item \textbf{Jupyter Notebook} digunakan untuk pelatihan model dan percobaan eksperimental secara interaktif.
\end{itemize}