5. 데이터 전처리의 모든 것 : DataFrame 파일 입출력

2024. 4. 18. 16:25·AI/데이터 분석과 모델 학습
목차
  1. 1. 파일 입출력
반응형

1. 파일 입출력


Pandas는 다양한 형식의 파일을 읽고, 쓸 수 있습니다. 대표적인 파일 형식으로는 CSV, Excel, JSON, SQL 등이 있습니다.

(Pandas 공식 User Guide 2.2 기준)

Format Type Data 형태 불러오는 함수 (읽기) 내보내기 함수 (쓰기)
text CSV read_csv to_csv
text Fixed-Width Text File read_fwf  
text JSON read_json to_json
text HTML read_html to_html
text LaTeX   Styler.to_latex
text XML read_xml to_xml
text Local clipboard read_clipboard to_clipboard
binary MS Excel read_excel to_excel
binary OpenDocument read_excel  
binary HDF5 Format read_hdf to_hdf
binary Feather Format read_feather to_feather
binary Parquet Format read_parquet to_parquet
binary ORC Format read_orc to_orc
binary Stata read_stata to_stata
binary SAS read_sas  
binary SPSS read_spss  
binary Python Pickle Format read_pickle to_pickle
SQL SQL read_sql to_sql
SQL Google BigQuery read_gbq to_gbq

 

[파일 읽기 / 불러오기]


CSV 파일 읽기 / 불러오기

# CSV 파일 읽기
df = pd.read_csv('file.csv')

 

Excel  파일 읽기 / 불러오기

# Excel 파일 읽기
df = pd.read_excel('file.xlsx')

 

Json 파일 읽기 / 불러오기

# JSON 파일 읽기
df = pd.read_json('file.json')

 

[파일 쓰기 / 내보내기]

 

CSV 파일 쓰기 / 내보내기

# 예제 DataFrame 생성
data = {'Column1': [1, 2, 3], 'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# CSV 파일로 저장
df.to_csv('output.csv', index=False)  # index를 False로 설정하여 인덱스를 저장하지 않음

 

Excel 파일 쓰기 / 내보내기

 

# 예제 DataFrame 생성
data = {'A': [1, 2, 3],
        'B': ['a', 'b', 'c']}

df = pd.DataFrame(data)

# Excel 파일로 저장
df.to_excel('example.xlsx', index=False)  # index=False를 설정하여 인덱스를 저장하지 않습니다.

 

 

Json 파일 쓰기 / 내보내기

# 예제 DataFrame 생성
data = {'Column1': [1, 2, 3], 'Column2': ['A', 'B', 'C']}
df = pd.DataFrame(data)

# JSON 파일로 저장
df.to_json('output.json', orient='records')  # orient를 'records'로 설정하여 레코드 단위로 저장
반응형
저작자표시 비영리 변경금지 (새창열림)

'AI > 데이터 분석과 모델 학습' 카테고리의 다른 글

ROC Curve와 AUC  (0) 2025.05.18
[데이터 분석] Pandas Cheeting Sheet : 데이터(DataFrame) 전처리  (1) 2024.04.19
5. 데이터 전처리의 모든 것 : 결측치 처리 (확인, 제거, 대체)  (1) 2024.04.18
  1. 1. 파일 입출력
'AI/데이터 분석과 모델 학습' 카테고리의 다른 글
  • ROC Curve와 AUC
  • [데이터 분석] Pandas Cheeting Sheet : 데이터(DataFrame) 전처리
  • 5. 데이터 전처리의 모든 것 : 결측치 처리 (확인, 제거, 대체)
코코도롱
코코도롱
도롱이의 전자공학소코코도롱 님의 블로그입니다.
    반응형
  • 코코도롱
    도롱이의 전자공학소
    코코도롱
  • 전체
    오늘
    어제
    • 분류 전체보기 (60)
      • AI (16)
        • 데이터 분석과 모델 학습 (4)
        • 모델별 정리 (7)
        • (PJT)음성 화자 분류 (4)
      • SW개발 (38)
        • C++ (9)
        • 면접을 위한 CS 전공지식 노트 (24)
        • Django+Vue.js (0)
        • 이런저런 개발이야기 (1)
        • 갑자기 C코테를 봐야할때 (2)
        • RPI5 프로젝트 (1)
        • 트러블슈팅 (1)
      • ESG (2)
        • 내가 쓰는 Assay (1)
        • 뉴스 스크랩 (1)
      • 반도체 (4)
        • 반도체 (3)
        • 슬기로운 학부생활 (1)
        • 회로 (0)
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    ios7계층
    os구조
    전공 지식
    면접을 위한 cs전공지식 노트
    메시지큐
    ESG
    면접을 위한 CS 전공지식 노트
    MySQL
    word 수식
    입출력관리
    데이터전처리 #데이터분석 #딥러닝 #머신러닝 #Pandas #Numpy #Python
    반도체 소자 공학
    반도체 물성
    c언어 입출력
    멀티프로세스
    요약본
    홉바이홉통신
    보고서 수식
    데이터분석 #데이터전처리 #결측치 #머신러닝 #딥러닝 #Pandas #DataFrame
    홉바이홉
    페이징 기법
    CS지식
    데이터분석 #머신러닝 #딥러닝 #데이터사이언스 #알고리즘 #데이터전처리
    LAN
    c io
    파일입출력 #DataFrame불러오기
    정리본
    반도체 공학
    운영체제
    공백포함입력받기
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
코코도롱
5. 데이터 전처리의 모든 것 : DataFrame 파일 입출력
상단으로

티스토리툴바

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.