Python Numpy & Pandas

최대 1 분 소요

① ② Python

pandas 란?

pandas 는 데이타 분석(Data Analysis)을 위해 널리 사용되는 파이썬 라이브러리 패키지이다.

테이블 형식의 데이터 DB처럼 테이블 형식의 데이터를 쉽게 처리할 수 있는 라이브러리이다. 데이터가 테이블 형식(DB Table, csv 등)으로 이루어진 경우가 많아 데이터 분석 시 자주 사용하게 될 Python 패키지이다.

Install & import

pandas는 과학용 파이썬 배포판인 아나콘다(Anaconda)에 기본적으로 제공되지만,

아나콘다를 사용하지 않을 경우에는

pip install pandas

를 통해 설치할 수 있다.

import를 할 때 pandas 라는 네임스페이스를 그대로 사용해도 되지만 pd 라는 축약된 이름을 관례적 사용한다.

import pandas as pd

보통은 배열 구조나 랜덤 값 생성 등의 기능을 활용하기 위한 numpy 와 그래프를 그리기 위한 matplotlib 패키지들도 함께 import 한다.

import numpy as np
import matplotlib.pyplot as plt



데이터 오브젝트 생성

데이터 오브젝트는 ‘데이터를 담고 있는 그릇’이다. 될 데이터 오브젝트는 Series 와 DataFrame 이 있다.

Series 는 1차원 배열,
DataFrame 은 2차원 배열의 데이터를 담는다.

#

  • 참고 :
    • https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html
    • https://wikidocs.net/32829

태그:

카테고리:

업데이트:

댓글남기기