728x90
데이터 전처리를 하다보면 반복작업을 하는 경우가 생기고 데이터 양이 많으면 어느 정도 진행되었는지,
언제 끝나는지 모르는 경우도 생깁니다. 그럴때 tqdm를 사용하여 현재 진행상황을 확인할 수 있습니다.
먼저 tqdm 패키지를 conda install tqdm으로 설치하고, 불러옵니다.
from tqdm import tqdm
1. for문 적용
for문에 적용하는 경우 in 우측 반복할 변수에 씌워주면 됩니다.
for x in tqdm(range(10000000)):
x2 = x^2

2. apply문 적용
apply는 주로 pandas row를 처리하는 경우 사용하는데 이때는 tqdm.pandas()를 선언해준 후
progress_apply 함수를 이용해야합니다.
tqdm.pandas()
x['columns2'] = x['columns1'].progress_apply(lambda x : x^2)

감사합니다 :)
728x90
'AI모델 > AI기술방법론' 카테고리의 다른 글
TF-IDF(Term Frequency - Inverse Document Frequency) (1) | 2022.09.21 |
---|---|
나이브 베이즈(Naive Bayes) (0) | 2022.09.15 |
데이터 자료 형태에 따른 상관분석 방법 (0) | 2022.08.26 |
[패턴] Timeseries 데이터에서 유사한 패턴 index 찾기 (0) | 2022.08.11 |
[scikit-learn] 다항회귀 PolynomialFeatures (0) | 2022.08.01 |