반응형

Python/Pandas 14

Pandas 강좌 9 - 결측치(Missing data)

“10 minutes to pandas” 문서를 따라해보며 작성했습니다. https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html 열 이름의 위치가 맞지 않으니 실행하여 결과에서 확인하세요. 2022. 02. 02 최초작성 결측치는 입력이 안되는 등의 이유로 데이터가 있어야 할 위치에 값이 없는 경우를 의미합니다. Pandas에서는 결측치를 np.nan로 나타내며 기본적으로 연산에서 사용하지 않습니다. 자세한 내용은 아래 링크를 참고하세요. https://pandas.pydata.org/pandas-docs/stable/user_guide/missing_data.html#missing-data import numpy as np import p..

Python/Pandas 2023.10.12

Pandas 강좌 8 - Pandas에서 CSV, HDF5, Excel로 저장 및 읽기

“10 minutes to pandas” 문서를 따라해보며 작성했습니다. https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html 열 이름의 위치가 맞지 않으니 실행하여 결과에서 확인하세요. 2022. 02. 02 최초작성 CSV 다음 내용으로 test.csv라는 파일을 작성합니다. 첫줄에 있는 컬럼 헤더에 공백이 없도록 주의하세요. Pandas에서 로드후 공백이 포함된 이름이 됩니다. id,alphabet 1,a 2,b 3,c 4,d 5,e 다음 코드로 csv 파일 로드 및 저장을 테스트합니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt df = pd.rea..

Python/Pandas 2023.10.12

Pandas 강좌 7 - 그래프 그리기(Plotting)

“10 minutes to pandas” 문서를 따라해보며 작성했습니다. https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html 2022. 02. 02 최초작성 matplotlib와 함께 사용하여 그래프를 그릴 수 있습니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt t = np.arange(0, 1000) y = pd.DataFrame(2*np.cos(2*np.pi/180*t), index=t) # 다음 두 가지 방식으로 그래프를 그릴 수 있습니다. #plt.plot(y, c='green') y.plot(c='green') plt.title('signal'..

Python/Pandas 2023.10.12

Pandas 강좌 6 - 시계열(Time series)

“10 minutes to pandas” 문서를 따라해보며 작성했습니다. https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html 2022. 02. 02 최초작성 2022. 3. 20 샘플링 특정 주기로 샘플링된 데이터를 원하는 주기로 리샘플링을 할 수 있습니다. import numpy as np import pandas as pd # 2022년 1월 1일 0시 0분 0초부터 1초 간격으로 20개를 생성합니다. rng = pd.date_range("1/1/2022", periods=20, freq="S") print(rng) print('\n\n') # 앞에서 생성한 시간정보를 인덱스로 하여 0 ~ 10 사이의 숫자를 20개 생성합니다. ts..

Python/Pandas 2023.10.12

Pandas 강좌 5 - 연결 및 그룹핑

“10 minutes to pandas” 문서를 따라해보며 작성했습니다. https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html 2022. 02. 02 최초작성 2022. 03. 20 연결하기 concat 메소드를 사용하여 열방향으로 DataFrame을 연결합니다. import numpy as np import pandas as pd df1 = pd.DataFrame(np.arange(8).reshape(2,4)) print(df1.shape) print(df1) print() df2 = pd.DataFrame(np.arange(8,16).reshape(2,4)) print(df2.shape) print(df2) print() df3 = p..

Python/Pandas 2023.10.12

Pandas 강좌 4 - 연산(Operations)

“10 minutes to pandas” 문서를 따라해보며 작성했습니다. https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html 2022. 02. 02 최초작성 2022. 03. 20 DataFrame이나 Series에 저장된 데이터에 대해 특정 연산을 수행하는 예제들입니다. 행 또는 열을 기준으로 평균을 구합니다. import numpy as np import pandas as pd dates = pd.date_range("20220101", periods=6) df = pd.DataFrame(np.random.randn(6, 4), index=dates, columns=list("ABCD")) print(df) print() # 열을 기..

Python/Pandas 2023.10.12

Pandas 강좌 3 - 데이터 선택하는 방법

“10 minutes to pandas” 문서를 따라해보며 작성했습니다. https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html 2022. 02. 02 최초작성 2022. 03. 19 2022. 08. 20 2023. 6. 17 열 이름과 행 인덱스로 선택하기 df["A"] 또는 df.A 처럼 열의 이름을 지정하여 해당 열을 선택할 수 있습니다. import numpy as np import pandas as pd df = pd.DataFrame([[1, 3, 3, 4],[5, 0, 7, 8],[9, 2, 11, 12]], columns=list("ABCD")) print(df) print() # 열 이름이 A인 열을 선택합니다. print..

Python/Pandas 2023.10.12

Pandas 강좌 2 - 데이터 보는 방법

“10 minutes to pandas” 문서를 따라해보며 작성했습니다. https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html 2022. 1. 30 최초작성 2022. 3. 19 head에 지정한 개수만큼 DataFrame 상단의 행을 볼 수 있습니다. 디폴트 값은 5입니다. 여기에선 3으로 지정하고 있습니다. import numpy as np import pandas as pd df = pd.DataFrame(np.random.randn(20, 2), columns=list("AB")) print(df.head(3)) tail에 지정한 개수만큼 DataFrame 하단의 행을 볼 수 있습니다. 디폴트 값은 5입니다. 여기에선 3으로 지정했..

Python/Pandas 2023.10.12

Pandas 강좌 1 - Pandas 객체 생성

“10 minutes to pandas” 문서를 따라해보며 작성했습니다. https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html 2022. 01. 30 최초작성 2022. 12. 06 값이 저장되어 있는 리스트를 전달하여 Series 객체를 생성합니다. import numpy as np import pandas as pd series = pd.Series([1, 3, 5, np.nan, 6, 8]) print(series) 왼쪽 첫번째 열이 0부터 시작하는 인덱스 열이고 두번째 열이 리스트에 저장되어 있던 값입니다. 마지막 줄에 있는 dtype은 Series 객체에 저장되어 있는 값의 데이터 타입을 의미합니다. float64는 64비트 fl..

Python/Pandas 2023.10.12

pandas의 read_csv 함수에 사용되는 경로 문자열 앞에 r을 붙이는 이유

pandas의 read_csv 함수에 사용되는 경로 문자열 앞에 r을 붙이는 이유를 다룹니다. 2022. 12. 5 최초작성 read_csv 함수에 경로 문자열을 추가시 디렉토리 구분자로 \를 사용할 경우에 문제가 생길 수 있습니다. 디렉토리 이름이 n으로 시작하면 \n이 이스케이프 문자로 인식되어 문제가 되어 다음처럼 에러가 발생합니다. import pandas as pd df = pd.read_csv('.\new\test.csv') Traceback (most recent call last): File "d:\code\Python\pandas_read_csv.py", line 4, in df = pd.read_csv('.\new\test.csv') File "C:\Users\webnautes\mini..

Python/Pandas 2023.10.09
반응형