본문 바로가기
통계&데이터사이언스/데이터과학개론

데이터과학개론 12.파이썬을 이용한 데이터 가공 - 1

by 데이터 시오 2024. 12. 23.
728x90
반응형

데이터 프레임

데이터베이스의 테이블과 같은 형태를 가지는 데이터 구조

행과 열을 이차원 배열의 형태

 

라이브러리

pip install yahoo_fin

 

import yahoo_fin.stock_info as si

import numpy as np

import pandas as pd

 

리스트

ticker = "google"

earning_list = si.get_earnings_history(ticker)

 

type(earning_list)

list

 

earning_list[:2]

 

누락데이터

데이터의 누락 (missing) - 관측값이 존재하지 않는 경우

데이터 프레임에서 NaN 표시

누락된 데이터를 채우는 것 imputation

 

fillna

NaN인 부분을 주어진 값으로 채운다

 

dropna

NaN을 포함한 행들을 삭제

728x90