openpyxl을 활용한 파이썬 엑셀 데이터 처리
서론
파이썬은 데이터 처리와 분석에 있어서 매우 편리한 언어로 알려져 있습니다. 그리고 openpyxl이라는 라이브러리를 사용하면 엑셀 파일을 손쉽게 다룰 수 있습니다. 본 글에서는 openpyxl을 활용하여 파이썬에서 엑셀 데이터를 처리하는 방법에 대해 다루고자 합니다.
본론
- 엑셀 파일 열기
openpyxl을 사용하기 위해선 먼저 엑셀 파일을 열어야 합니다. openpyxl.load_workbook()
함수를 사용하여 엑셀 파일을 열고 워크북 객체를 얻을 수 있습니다.
“`python
from openpyxl import load_workbook
wb = load_workbook(‘example.xlsx’)
“`
- 시트 선택하기
워크북 객체를 통해 원하는 시트를 선택할 수 있습니다. wb.sheetnames
속성을 사용하여 워크북 안의 모든 시트의 이름을 확인하고, wb['시트이름']
을 사용하여 원하는 시트를 선택합니다.
python
sheet_names = wb.sheetnames
sheet = wb[sheet_names[0]]
- 데이터 읽기
선택한 시트에서 데이터를 읽어오려면 sheet['셀이름'].value
를 사용하여 각 셀의 값을 얻을 수 있습니다. 모든 데이터를 읽어오기 위해선 반복문을 사용하면 됩니다.
python
for row in sheet.iter_rows():
for cell in row:
value = cell.value
print(value)
- 데이터 쓰기
엑셀 파일에 데이터를 쓰려면 sheet['셀이름'] = 값
을 사용하여 셀에 값을 할당할 수 있습니다. 쓰려는 데이터가 여러 개인 경우, 반복문을 사용하여 여러 셀에 값을 할당할 수 있습니다.
python
for i in range(1, 5):
sheet.cell(i, 1).value = i
- 엑셀 파일 저장
데이터 처리가 끝난 후에는 변경된 내용을 엑셀 파일에 저장해야 합니다. wb.save('저장할_파일명.xlsx')
를 사용하여 워크북을 저장할 수 있습니다.
python
wb.save('output.xlsx')
결론
openpyxl은 파이썬에서 엑셀 데이터를 처리하기 위한 강력한 라이브러리입니다. 본 글에서는 openpyxl을 활용하여 엑셀 파일을 열고, 데이터를 읽고 쓰는 방법에 대해 알아보았습니다. 이를 토대로 파이썬으로 엑셀 데이터를 처리할 수 있는 다양한 작업을 수행할 수 있을 것입니다.