
캐글의 딥러닝 튜토리얼을 바탕으로 정리한 문서입니다. 개인적으로 추가한 내용이 있어서 원문 내용과 차이가 있습니다. 이번에 다루는 내용은 수식에 대한 이해가 되면 수정할 부분이 있을 듯합니다. Intro to Deep Learning https://www.kaggle.com/learn/intro-to-deep-learning 2022. 3. 1 최초작성 레이어를 쌓아서 완전 연결 신경망( fully-connected neural network)을 만들 수 있습니다. 처음 신경망이 생성될 때에는 모든 신경망의 가중치가 보통 무작위로 설정되기 때문에 신경망은 주어진 입력으로부터 추론되어야 하는 예상 가능한 출력을 만들기 위한 정보를 아무것도 갖고 있지 않습니다. 이미지 출처 - https://www.rese..

캐글의 딥러닝 튜토리얼을 바탕으로 정리한 문서입니다. 개인적으로 추가한 내용이 있어서 원문 내용과 차이가 있습니다. Intro to Deep Learning https://www.kaggle.com/learn/intro-to-deep-learning 2022. 2. 27 최초작성 뉴런(neuron) 인공 뉴런 또는 뉴런은 신경망(neural network)의 기본 구성 요소입니다. 생물학적 뉴런에서 영감을 받아 만들어졌기 때문에 생물학적 뉴런과 구조상 유사점이 있습니다. 다음 그림은 하나의 뉴런입니다. 뉴런에 하나의 값 x가 입력되고 하나의 값 y가 출력되고 있습니다. 입력의 값이 뉴런으로 전달될때, 입력과 뉴런 사이에 연결된 에지에 있는 가중치가 곱해집니다. 입력 x는 가중치 w가 곱해져 뉴런에 전달되..

정규화(Normalization), 표준화(standardization), 이상치(outlier) 제거를 구현해본 코드입니다. 2021. 9. 17 - 최초작성 2022. 4. 15 졍규화는 값을 0 ~ 1 사이의 범위로 바꾸는 것이고, 표준화는 평균이 0, 표준편차는 1 인 표준정규분포(standard normal distribution)로 바꾸는 것입니다. 표준화의 경우 값의 범위가 정해지지 않습니다. 아래 링크에 따르면 데이터가 정규분포를 따르는 경우에는 표준화, 정규분포를 따르지 않는 경우에는 정규화를 하는 것이 좋다고 합니다. ( 참고 - https://www.analyticsvidhya.com/blog/2020/04/feature-scaling-machine-learning-normalizat..

표준화 전후로 이상치(Outlier)를 제거하는 Python 예제 코드입니다. 2022. 4. 5 최초작성 이상치는 대부분의 값과 다르게 아주 작거나 아주 큰 값을 의미합니다. 평균 ± 표준편차 × 3 을 벗어나는 것을 이상치로 취급하여 제거해본 예제 코드입니다. 표준화를 적용 전후에 각각 이상치를 제거해봤습니다. 전체 코드입니다. import pandas as pd import numpy as np import matplotlib.pyplot as plt from collections import Counter # 5개의 특징으로 구성된 샘플 40개 생성 a = np.random.randint(1, 13, size=200).reshape(40, 5) df_raw = pd.DataFrame(a) # 0번..

상관 계수(Correlation coefficient) 중 하나인 피어슨 상관 계수(Pearson Correlation Coefficient)의 개념에 대해 정리했습니다. 2022. 5. 23 최초작성 상관 계수 상관 계수는 두 변수 간의 연관성 강도를 측정합니다. 본 글에서는 상관 계수 중 하나인 피어슨 상관 계수에 대해 알아봅니다. 피어슨 상관 계수는 두 변수 간의 선형 연관 강도를 측정합니다. 피어슨 상관 계수 피어슨 상관 계수는 두 변수 간의 선형 연관 강도를 측정합니다. 상관 계수의 범위는 항상 -1과 1 사이입니다. 계수의 부호는 관계의 방향을 알려줍니다. 양수 값은 두 변수가 같은 방향으로 함께 변경됨을 의미하고 음수 값은 두 변수가 반대 방향으로 변경됨을 의미합니다. 양의 상관관계는 한 변..

상관 계수(Correlation coefficient) 중 하나인 피어슨 상관 계수(Pearson Correlation Coefficient)의 개념에 대해 정리했습니다. 2022. 5. 23 최초작성 상관 계수 상관 계수는 두 변수 간의 연관성 강도를 측정합니다. 본 글에서는 상관 계수 중 하나인 피어슨 상관 계수에 대해 알아봅니다. 피어슨 상관 계수는 두 변수 간의 선형 연관 강도를 측정합니다. 피어슨 상관 계수 피어슨 상관 계수는 두 변수 간의 선형 연관 강도를 측정합니다. 상관 계수의 범위는 항상 -1과 1 사이입니다. 계수의 부호는 관계의 방향을 알려줍니다. 양수 값은 두 변수가 같은 방향으로 함께 변경됨을 의미하고 음수 값은 두 변수가 반대 방향으로 변경됨을 의미합니다. 양의 상관관계는 한 변..

상관 계수(Correlation coefficient) 중 하나인 피어슨 상관 계수(Pearson Correlation Coefficient)의 개념에 대해 정리했습니다. 2022. 5. 23 최초작성 상관 계수 상관 계수는 두 변수 간의 연관성 강도를 측정합니다. 본 글에서는 상관 계수 중 하나인 피어슨 상관 계수에 대해 알아봅니다. 피어슨 상관 계수는 두 변수 간의 선형 연관 강도를 측정합니다. 피어슨 상관 계수 피어슨 상관 계수는 두 변수 간의 선형 연관 강도를 측정합니다. 상관 계수의 범위는 항상 -1과 1 사이입니다. 계수의 부호는 관계의 방향을 알려줍니다. 양수 값은 두 변수가 같은 방향으로 함께 변경됨을 의미하고 음수 값은 두 변수가 반대 방향으로 변경됨을 의미합니다. 양의 상관관계는 한 변..

다음 링크의 글을 보면서 정규 분포(Normal Distribution)에 대한 개념을 정리한 문서입니다. 추가로 연속 확률 분포(continuous probability distribution)에 관한 내용을 더 찾아서 넣었습니다. https://medium.com/analytics-vidhya/normal-distribution-and-machine-learning-ec9d3ca05070 2022. 7. 12 최초작성 정규 분포 정규 분포(Normal Distribution) 또는 가우스 분포(Gaussian Distribution)는 연속 확률 분포(continuous probability distribution)입니다. 곡선의 중앙에 점선으로 표시한 데이터의 평균을 중심으로 곡선이 양쪽으로 50%..

아래 링크들을 참고하여 랜덤 포레스트에 대해 간단히 정리했습니다. https://www.section.io/engineering-education/introduction-to-random-forest-in-machine-learning/ https://wooono.tistory.com/104 2022. 10. 13 최초작성 랜덤 포레스트(random forest) 랜덤 포레스트는 회귀(regression) 및 분류(classification) 문제를 해결하는 데 사용할 수 있는 머신 러닝(machine learning) 기법입니다. 여러 개의 의사 결정 트리(decision trees)로 구성되는데 각각의 의사 결정 트리는 출력 결과를 내놓습니다. 최종 결과를 얻기 위해 앙상블 기법중 하나인 배깅(bag..
Keras 모델의 전체 파라미터 개수를 출력하는 예제 코드입니다. 2023. 7. 19. 최초작성 from tensorflow.keras.applications import EfficientNetB0 # 모델을 로드합니다. model = EfficientNetB0(weights='imagenet') # 전체 파라미터 개수를 가져와 출력합니다. total_params = model.count_params() print(f'전체 파라미터 개수 = {total_params}') 실행해보면 EfficientNetB0 모델의 전체 파라미터 개수를 출력해줍니다. 전체 파라미터 개수 = 5330571