본문 바로가기
파이썬/통계분석

[파이썬 강의] 84.판다스 시리즈 정의해보기

by 만다린망고 2021. 11. 12.
반응형

지난시간에 판다스를 설치했습니다. 판다스 패키지는 아래 두가지 자료구조를 제공합니다. 

 

- Series
- DataFrame

 

오늘은 시리즈 자료구조를 배워봅시다. 시리즈는 아래와 같이 엑셀의 한 열이라고 생각하시면 됩니다. 


엑셀과 완전히 같지는 않고 차이가 있습니다. 엑셀에서는 열의이름이 A,B,C,D...로 행의 이름이 1,2,3,...으로 정해져 있지만 시리즈에서는 열과 행의 이름을 설정할 수 있습니다. 

시리즈를 하나 정의해봅시다. 데이터, 행이름(index), 열이름(name) 순서로 입력합니다. 데이터는 리스트 형태로 입력해줍니다. 

>>> import pandas as pd
>>> s1=pd.Series([1,2,3,4,5],index=['A','B','C','D','E'],name='my data')
>>> s1
A    1
B    2
C    3
D    4
E    5
Name: my data, dtype: int64


각 행에는 원하는 자료와 자료구조를 입력할 수 있습니다. 

>>> s2=pd.Series([1,'hi',[1,2],(3,5),True],index=['A','B','C','D','E'],name='my data')
>>> s2
A         1
B        hi
C    [1, 2]
D    (3, 5)
E      True
Name: my data, dtype: object
반응형

댓글