본문 바로가기
728x90

python/pandas35

pandas - pd.date_range() 와 Frequencies and Offsets(시작날짜와 종료날짜를 설정하면 알아서 채워주고 조건을 넣어 원하는 날짜 데이터를 출력한다.) pd.date_range() 함수 - 시작날짜와 종료날짜를 설정하면, 알아서 날짜를 채워주는 함수 ex ) pd.date_range( 시작날짜, 종료날짜 ) pd.date_range('2022-11-30', '2023-02-05') DatetimeIndex(['2022-11-30', '2022-12-01', '2022-12-02', '2022-12-03', '2022-12-04', '2022-12-05', '2022-12-06', '2022-12-07', '2022-12-08', '2022-12-09', '2022-12-10', '2022-12-11', '2022-12-12', '2022-12-13', '2022-12-14', '2022-12-15', '2022-12-16', '2022-12-17', '.. 2022. 12. 1.
pandas - dataframe의 날짜 형식 여러개의 문자열을 날짜로 인식하게 변환하기 pd.to_datetime() , dtpe= - 기존 datetime의 parse 로는 한 개의 날짜형식 문자열만 날짜로 인식하게 바꿔줄 수 있었다. - 기존의 파이썬 datetime 을 보강하기 위해, date 의 array 도 처리할 수 있게 numpy 에서 64-bit 로 처리하도록 라이브 러리를 강화했다. ex ) np.array('yyyy-mm-dd' , dtype = np.datetime64) someday = np.array('2022-05-11' , dtype = np.datetime64) someday array('2022-05-11', dtype='datetime64[D]') ex)) someday + np.arange(5) array(['2022-05-11', '2022-05-12', '2022-05-13', '2022-05-1.. 2022. 11. 30.
pandas - sb.heatmap을 이용해서 데이터 한눈에 비교하기 heatmap으로 만들어 색깔을 이용해 데이터를 한눈에 비교할 수 있다. - ex ) sb.heatmap(data = 변수) ***여기서 변수는 원본 데이터에서 히트맵으로 만들 데이터를 가져와 또다른 변수에 저장한 것 sb.heatmap(data = df2) - heatmap 함수의 파라미터에 여러가지 파라미터를 넣어서 더 보기 편하게 만들 수 있다. ex) cmap = 색깔 , annot = 수치표현 , fmt = 는 수치 시각설정 (.1f = 소수점 한자리, .0f는 정수) , linewidths = 줄 간격 plt.figure(figsize=(10,8)) sb.heatmap(data = df2, cmap='RdPu', annot = True, fmt='.1f' , linewidths= 0.8) pl.. 2022. 11. 30.
pandas - sb의 pairplot의 x축과 y축 설정( x_vars= , y_vars=) sb의 pairplot 행열 설정 - 전에 배운 pairplot의 형식은 sb.pairplot(data = 변수 , vars = [' 컬럼1' ,'컬럼2','컬럼3']) 이었는데 vars 파라미터 대신 새로운 파라미터 x_vars 와 y_vars 를 이용해서 x축과 y축을 설정할 수 있다. - ex) sb.pairplot(data = 변수 , x_vars=['x축에 넣을 컬럼' ) , y_vars = ['y축에 넣을 컬럼'] ) x_vars , y_vars 각 파라미터에 여러개의 컬럼을 넣을 수 있다. 예시 sb.pairplot(data= crime_anal, x_vars=['인구수', 'CCTV'], y_vars =['살인', '강도']) plt.show() pairplot에 regression 넣기 .. 2022. 11. 30.
728x90