Data Preparation (STFT) #23

New Issue

2024-10-19T02:25:30Z

nuluh commented

2024-10-19 02:25:30 +00:00

(Migrated from github.com)

Step 1: Importing Necessary Libraries

Before data preparation begins, the code imports essential libraries for data manipulation, visualization, and machine learning.

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy.signal import stft, hann
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

Step 2: Loading the CSV Files

The code reads vibration data from 16 CSV files, each representing a different bolt loosening case.

# Load CSV files into DataFrames
df1 = pd.read_csv("/kaggle/input/.../Case1/Case1_800.csv")
df2 = pd.read_csv("/kaggle/input/.../Case2/Case2_800.csv")
# ...
df16 = pd.read_csv("/kaggle/input/.../Case16/Case16_800.csv")

Visual Representation:

Each DataFrame (df1, df2, ..., df16) contains raw vibration data:

Channel 1	Channel 2
...	...
...	...

Step 3: Storing DataFrames in a List

All DataFrames are stored in a list for easy iteration.

df = [df1, df2, df3, ..., df16]

Step 4: Renaming Columns for Consistency

The code standardizes the column names across all DataFrames to ensure consistency.

for data in df:
    data.columns = ['sensor 1', 'sensor 2']

Visual Representation:

sensor 1	sensor 2
...	...
...	...

Step 5: Extracting Signals from Each DataFrame

Signals from both sensors are extracted and stored in separate lists.

signal_sensor1 = []
signal_sensor2 = []

for data in df:
    signal_sensor1.append(data['sensor 1'].values)
    signal_sensor2.append(data['sensor 2'].values)

signal_sensor1: List of NumPy arrays containing data from sensor 1 for each case.
signal_sensor2: Similar list for sensor 2.

Visual Representation:

signal_sensor1 = [
    array_case1_sensor1,  # Data from Case 1
    array_case2_sensor1,  # Data from Case 2
    ...
    array_case16_sensor1  # Data from Case 16
]

Step 6: Visualizing Raw Vibration Signals

The code plots the raw signals to understand the data visually.

plt.plot(df1['sensor 1'], label='sensor 1')
plt.plot(df1['sensor 2'], label='sensor 2')
plt.xlabel("Number of samples")
plt.ylabel("Amplitude")
plt.title("Raw vibration signal")
plt.legend()
plt.show()

(Note: As this is a text-based medium, please imagine a plot with two lines representing sensor 1 and sensor 2 signals over time.)

## **Step 1: Importing Necessary Libraries** Before data preparation begins, the code imports essential libraries for data manipulation, visualization, and machine learning. ```python import numpy as np import pandas as pd import matplotlib.pyplot as plt from scipy.signal import stft, hann from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score ``` --- ## **Step 2: Loading the CSV Files** The code reads vibration data from 16 CSV files, each representing a different bolt loosening case. ```python # Load CSV files into DataFrames df1 = pd.read_csv("/kaggle/input/.../Case1/Case1_800.csv") df2 = pd.read_csv("/kaggle/input/.../Case2/Case2_800.csv") # ... df16 = pd.read_csv("/kaggle/input/.../Case16/Case16_800.csv") ``` **Visual Representation:** Each DataFrame (`df1`, `df2`, ..., `df16`) contains raw vibration data: | Channel 1 | Channel 2 | |-----------|-----------| | ... | ... | | ... | ... | --- ## **Step 3: Storing DataFrames in a List** All DataFrames are stored in a list for easy iteration. ```python df = [df1, df2, df3, ..., df16] ``` --- ## **Step 4: Renaming Columns for Consistency** The code standardizes the column names across all DataFrames to ensure consistency. ```python for data in df: data.columns = ['sensor 1', 'sensor 2'] ``` **Visual Representation:** | sensor 1 | sensor 2 | |----------|----------| | ... | ... | | ... | ... | --- ## **Step 5: Extracting Signals from Each DataFrame** Signals from both sensors are extracted and stored in separate lists. ```python signal_sensor1 = [] signal_sensor2 = [] for data in df: signal_sensor1.append(data['sensor 1'].values) signal_sensor2.append(data['sensor 2'].values) ``` - `signal_sensor1`: List of NumPy arrays containing data from sensor 1 for each case. - `signal_sensor2`: Similar list for sensor 2. **Visual Representation:** ```plaintext signal_sensor1 = [ array_case1_sensor1, # Data from Case 1 array_case2_sensor1, # Data from Case 2 ... array_case16_sensor1 # Data from Case 16 ] ``` --- ## **Step 6: Visualizing Raw Vibration Signals** The code plots the raw signals to understand the data visually. ```python plt.plot(df1['sensor 1'], label='sensor 1') plt.plot(df1['sensor 2'], label='sensor 2') plt.xlabel("Number of samples") plt.ylabel("Amplitude") plt.title("Raw vibration signal") plt.legend() plt.show() ``` *(Note: As this is a text-based medium, please imagine a plot with two lines representing sensor 1 and sensor 2 signals over time.)* ---

Sign in to join this conversation.

Branches Tags

main

dev

feature/chapter-2-literature-review

feature/chapter-4-results

feature/chapter-3-methodology-steps

exp/74-exp-cross-dataset-validation

exp/74-exp-cross-dataset-validation-b2bf1b0

feat/103-feat-inference-function

feature/101-feat-time-elapsed-for-training-and-inference

feature/99-exp-alternative-undamage-case-data

feat/90-feat-preserve-trained-model

latex/75-enhance-background-research

wuicace-2025

revert-92-latex/91-bug-expose-maketitle

latex/91-bug-expose-maketitle

latex/documentclass

latex/frontmatter

latex/bib

latex/methodology

latex/literature-review

latex/theoritical-foundation

latex/background

latex/68-feat-refactor-chapter-two

68-feat-refactor-chapter-two

latex/initial-template

59-feat-add-acknowledgement-page

57-feat-add-dynamic-page-style-for-chapter-page

latex/fix-table-of-contents-styling

56-bug-endorsementpage-error

latex/54-doc-summary-table-of-past-realted-research

feature/48-feat-refactor-stft-preprocessing-and-training-pipeline-into-importable-modules

40-feat-add-export-to-csv-method-for-dataprocessor-in-convertpy

43-bug-stft-csv-export-has-incorrect-shape-and-column-format

feature/38-feat-redesign-convertpy

feature/37-feat-add-data-processing-script-for-dataset-b-outside-training-data

stft

feature/19-qugs-data

feature/15-normalize-dataset-by-preprocess-relatives-value-between-two-acceloremeter-sensors

feature/automate-csv-file

revert-8-feature/csv-padding-naming

feature/5-create-fft-script

feature/10-add-labels-column-to-time-domain-feature-extraction-dataframe

feature/csv-padding-naming

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: nuluh/thesis#23