diff --git a/latex/chapters/id/03_methodology/data_analysis/index.tex b/latex/chapters/id/03_methodology/data_analysis.tex similarity index 69% rename from latex/chapters/id/03_methodology/data_analysis/index.tex rename to latex/chapters/id/03_methodology/data_analysis.tex index aca60f6..319f7df 100644 --- a/latex/chapters/id/03_methodology/data_analysis/index.tex +++ b/latex/chapters/id/03_methodology/data_analysis.tex @@ -182,4 +182,38 @@ t=0,\dots,512 Karena terdapat total \(6\times5\times513 = 15\,390\) baris, dan setiap baris memiliki \(513\) fitur ditambah satu kolom label, maka bentuk akhir dari data untuk satu sisi sensor adalah: \begin{equation*} |\mathcal{D}^{(s)}| = 15\,390 \times 514. -\end{equation*} \ No newline at end of file +\end{equation*} + +\subsection{Validasi Silang K-Fold Terstratifikasi} + +Untuk mengevaluasi model secara andal dan menghindari \textit{overfitting}, digunakan validasi silang K-Fold terstratifikasi pada masing-masing himpunan data sensor (Sensor A dan Sensor B). Skema ini membagi data menjadi \(K\) lipatan dengan proporsi label yang dipertahankan pada setiap lipatan. Pada iterasi ke-\(k\), model dilatih pada \(\mathcal{D}_{\text{train}}^{(k)}\) (gabungan \(K-1\) lipatan) dan dievaluasi pada \(\mathcal{D}_{\text{val}}^{(k)}\) (lipatan ke-\(k\)). Rata-rata metrik diperoleh sebagai +\begin{equation*} +\mathrm{Metric}_{\mathrm{K\text{-}Fold}} += \frac{1}{K} \sum_{k=1}^{K} \mathrm{Metric}\bigl(\hat f^{(k)};\, \mathcal{D}_{\text{val}}^{(k)}\bigr), +\end{equation*} +di mana \(\hat f^{(k)}\) adalah model terlatih pada iterasi ke-\(k\). Pada studi ini, nilai \(K\) dipilih \(K=5\) untuk menyeimbangkan variasi estimasi dan biaya komputasi. + +\paragraph{Prosedur ringkas:} +\begin{enumerate} + \item Pisahkan fitur dan label dari \(\mathcal{D}^{(s)}\) untuk \(s\in\{\text{A},\text{B}\}\) secara terpisah. + \item Lakukan stratifikasi berdasarkan label kerusakan \(y\) pada \(K=5\) lipatan. + \item Untuk setiap lipatan: latih pengklasifikasi (SVM, LDA, Bagged Trees, Random Forest, XGBoost) pada \(K-1\) lipatan, uji pada lipatan tersisa. + \item Hitung akurasi, presisi, dan \textit{confusion matrix}; ambil rata-rata dan simpangan baku lintas lipatan. +\end{enumerate} + +\subsection{Validasi Silang Antar-\textit{Dataset} (Cross-Dataset)} + +Selain K-Fold, dilakukan pengujian lintas sumber data untuk menilai generalisasi domain. Diasumsikan tersedia dua himpunan data berbeda (misalnya, Sensor A dan Sensor B, atau dua sesi/penempatan berbeda) yang dilambangkan sebagai \(\mathcal{D}^{(1)}\) dan \(\mathcal{D}^{(2)}\). + +\paragraph{Skema latih-uji silang:} +\begin{align*} + ext{Eksperimen-1:}\quad & \hat f_{1} \leftarrow \mathrm{Train}\bigl(\mathcal{D}^{(1)}\bigr), & \mathrm{Eval\ on}\; \mathcal{D}^{(2)} \\ + ext{Eksperimen-2:}\quad & \hat f_{2} \leftarrow \mathrm{Train}\bigl(\mathcal{D}^{(2)}\bigr), & \mathrm{Eval\ on}\; \mathcal{D}^{(1)} +\end{align*} +Metrik yang dilaporkan adalah rata-rata kedua arah evaluasi untuk memberikan gambaran seimbang terhadap kemampuan \textit{out-of-domain}: +\begin{equation*} +\mathrm{Metric}_{\mathrm{X\text{-}Domain}} += \tfrac{1}{2}\Bigl[\,\mathrm{Metric}(\hat f_{1};\, \mathcal{D}^{(2)}) + \mathrm{Metric}(\hat f_{2};\, \mathcal{D}^{(1)})\,\Bigr]. +\end{equation*} + +\paragraph{Catatan praktis:} Untuk menjaga keadilan komparasi, normalisasi fitur dihitung hanya pada data pelatihan lalu diaplikasikan ke data uji. Bila ukuran kedua himpunan tidak seimbang, dapat digunakan penyeimbangan kelas atau pengambilan sampel berstrata pada tahap pelatihan. \ No newline at end of file diff --git a/latex/chapters/id/03_methodology/index.tex b/latex/chapters/id/03_methodology/index.tex index 75c9ead..5a28b72 100644 --- a/latex/chapters/id/03_methodology/index.tex +++ b/latex/chapters/id/03_methodology/index.tex @@ -1,7 +1,7 @@ \chapter{Metode Penelitian} -\input{chapters/id/03_methodology/material/index} -\input{chapters/id/03_methodology/tool/index} +\input{chapters/id/03_methodology/materials} +\input{chapters/id/03_methodology/tools} \clearpage \input{chapters/id/03_methodology/steps/index} -\input{chapters/id/03_methodology/data_analysis/index} \ No newline at end of file +\input{chapters/id/03_methodology/data_analysis} \ No newline at end of file diff --git a/latex/chapters/id/03_methodology/material/index.tex b/latex/chapters/id/03_methodology/materials.tex similarity index 100% rename from latex/chapters/id/03_methodology/material/index.tex rename to latex/chapters/id/03_methodology/materials.tex diff --git a/latex/chapters/id/03_methodology/steps/index.tex b/latex/chapters/id/03_methodology/steps/index.tex index 8b95916..0b36566 100644 --- a/latex/chapters/id/03_methodology/steps/index.tex +++ b/latex/chapters/id/03_methodology/steps/index.tex @@ -19,7 +19,7 @@ Alur keseluruhan penelitian ini dilakukan melalui tahapan-tahapan sebagai beriku \item \textbf{Pengembangan Model:} Membangun dan melatih model klasifikasi berbasis algoritma pemelajaran mesin klasik (SVM, LDA, Bagged Trees, Random Forest, XGBoost) untuk mengklasifikasikan lokasi kerusakan struktur. - \item \textbf{Evaluasi:} Mengevaluasi kinerja model menggunakan metrik akurasi, presisi, dan confusion matrix pada berbagai skenario pengujian. + \item \textbf{Evaluasi:} Mengevaluasi kinerja model menggunakan metrik akurasi, presisi, dan confusion matrix pada berbagai skenario pengujian. Evaluasi dilakukan dengan dua skema: (i) validasi silang K-Fold terstratifikasi pada setiap himpunan data, dan (ii) validasi silang antar-dataset (latih pada Dataset-A, uji pada Dataset-B, dan sebaliknya) untuk menilai kemampuan generalisasi lintas sumber data. \end{enumerate} \subsection{Akuisisi Data} diff --git a/latex/chapters/id/03_methodology/tool/index.tex b/latex/chapters/id/03_methodology/tool/index.tex deleted file mode 100644 index d88dbd8..0000000 --- a/latex/chapters/id/03_methodology/tool/index.tex +++ /dev/null @@ -1,7 +0,0 @@ -\section{Alat} - -\subsection{Alat Perangkat Keras} -\input{chapters/id/03_methodology/tool/hardware} - -\subsection{Alat Perangkat Lunak} -\input{chapters/id/03_methodology/tool/software} \ No newline at end of file diff --git a/latex/chapters/id/03_methodology/tool/software.tex b/latex/chapters/id/03_methodology/tool/software.tex deleted file mode 100644 index cd676c5..0000000 --- a/latex/chapters/id/03_methodology/tool/software.tex +++ /dev/null @@ -1,11 +0,0 @@ -Berikut merupakan perangkat lunak yang digunakan selama proses penelitian ini: - -\begin{itemize} - \item \textbf{Python 3.11} – digunakan untuk proses pra-pemrosesan data, pemodelan, dan evaluasi. - \item \textbf{NumPy 1.22.4} – digunakan untuk perhitungan deret numerik. - \item \textbf{Pandas 1.5.1} – digunakan untuk memanipulasi struktur data. - \item \textbf{Pandas 1.7.3} – digunakan untuk memproses sinyal. - \item \textbf{Matplotlib 3.7.1} – digunakan untuk menghasilkan plot data. - \item \textbf{Scikit-Learn 1.5.1} – digunakan untuk membangun dan melatih model dengan algoritma pemelajaran mesin klasik. - \item \textbf{Jupyter Notebook} – digunakan untuk pelatihan model dan percobaan eksperimental secara interaktif. -\end{itemize} \ No newline at end of file diff --git a/latex/chapters/id/03_methodology/tool/hardware.tex b/latex/chapters/id/03_methodology/tools.tex similarity index 74% rename from latex/chapters/id/03_methodology/tool/hardware.tex rename to latex/chapters/id/03_methodology/tools.tex index b540d66..1dbb229 100644 --- a/latex/chapters/id/03_methodology/tool/hardware.tex +++ b/latex/chapters/id/03_methodology/tools.tex @@ -1,3 +1,6 @@ +\section{Alat} + +\subsection{Alat Perangkat Keras} Data getaran struktur yang digunakan dalam penelitian ini diperoleh dari penelitian oleh \textcite{abdeljaber2017}, yang dilakukan menggunakan simulator struktur baja Grandstand di Queen’s University. Dalam eksperimen tersebut, struktur baja dipasang dengan akselerometer pada setiap sambungan-sambungan (\textit{joints}). Rangkaian perangkat keras yang digunakan untuk pengambilan data meliputi: \begin{itemize} @@ -37,3 +40,17 @@ Adapun sumberdaya komputasi yang digunakan untuk pemrosesan semua data dan pemod \caption{Perangkat akuisisi data (DT9857E-16) dan penguat daya SmartAmp 2100E21-400} \label{fig:datalogger} \end{figure} + + +\subsection{Alat Perangkat Lunak} +Berikut merupakan perangkat lunak yang digunakan selama proses penelitian ini: + +\begin{itemize} + \item \textbf{Python 3.11} – digunakan untuk proses pra-pemrosesan data, pemodelan, dan evaluasi. + \item \textbf{NumPy 1.22.4} – digunakan untuk perhitungan deret numerik. + \item \textbf{Pandas 1.5.1} – digunakan untuk memanipulasi struktur data. + \item \textbf{Pandas 1.7.3} – digunakan untuk memproses sinyal. + \item \textbf{Matplotlib 3.7.1} – digunakan untuk menghasilkan plot data. + \item \textbf{Scikit-Learn 1.5.1} – digunakan untuk membangun dan melatih model dengan algoritma pemelajaran mesin klasik. + \item \textbf{Jupyter Notebook} – digunakan untuk pelatihan model dan percobaan eksperimental secara interaktif. +\end{itemize} \ No newline at end of file