반응형
지난시간에 판다스를 설치했습니다. 판다스 패키지는 아래 두가지 자료구조를 제공합니다.
- Series
- DataFrame
오늘은 시리즈 자료구조를 배워봅시다. 시리즈는 아래와 같이 엑셀의 한 열이라고 생각하시면 됩니다.
엑셀과 완전히 같지는 않고 차이가 있습니다. 엑셀에서는 열의이름이 A,B,C,D...로 행의 이름이 1,2,3,...으로 정해져 있지만 시리즈에서는 열과 행의 이름을 설정할 수 있습니다.
시리즈를 하나 정의해봅시다. 데이터, 행이름(index), 열이름(name) 순서로 입력합니다. 데이터는 리스트 형태로 입력해줍니다.
>>> import pandas as pd
>>> s1=pd.Series([1,2,3,4,5],index=['A','B','C','D','E'],name='my data')
>>> s1
A 1
B 2
C 3
D 4
E 5
Name: my data, dtype: int64
각 행에는 원하는 자료와 자료구조를 입력할 수 있습니다.
>>> s2=pd.Series([1,'hi',[1,2],(3,5),True],index=['A','B','C','D','E'],name='my data')
>>> s2
A 1
B hi
C [1, 2]
D (3, 5)
E True
Name: my data, dtype: object
반응형
'파이썬 > 통계분석' 카테고리의 다른 글
[파이썬 강의] 86.시리즈(Series)에서 행이름을 이용하여 데이터에 접근 (0) | 2021.11.16 |
---|---|
[파이썬 강의] 85.시리즈(Series)에서 데이터,행이름,열이름에 접근하기 (0) | 2021.11.15 |
[파이썬 강의] 83.판다스 소개 및 설치 (0) | 2021.11.12 |
[파이썬 강의] 82. 지금까지 배운 내용과 앞으로 배울 내용 (0) | 2021.11.09 |
[파이썬 강의] 81. 표본추출 (이항분포) (0) | 2021.11.08 |
댓글