개발 조각글

Python - xlsx to csv

BaekNohing 2022. 7. 29. 13:30
a cute cat snail

xlxs형식을 csv로 바꿀 일이 있어서 찾아보니까, pandas를 쓰면 쉽게 변환할 수 있다고 한다.

Pandas는 주로 데이터 분석에 사용됩니다. Pandas를 사용하면 쉼표로 구분된 값 , JSON , SQL 및 Microsoft Excel과 같은 다양한 파일 형식에서 데이터를 가져올 수 있습니다.  병합 등의 각종 데이터 처리 동작을 허용  재편,  선택뿐만 아니라 청소 데이터 및 데이터 승강이 가능합니다. - 출처

예전 플젝에서 nlp 때문에 pandas 쓸 때는 그냥 dataTable 만드는 라이브러리라고 생각했었는데, 생각해보니 xlsx > table > csv형식으로 변환이 되겠구나. 당연한 일인데 된다는 걸 알기 전에는 딱 떠올리기가 어렵다 ㅎㅎ;

import pandas as pd
import os 

file_list = os.listdir('./')
for f in file_list:
    if f.endswith(".xlsx"):
        print(f)
        df = pd.read_excel(f)
        data_frame = pd.DataFrame(df)
        for colName in data_frame:
            if colName.startswith('//'):
                df.drop(colName, axis=1, inplace=True)
        df.to_csv(f.replace('.xlsx', '.csv'), index=False)