728x90
반응형

데이터 프레임
데이터베이스의 테이블과 같은 형태를 가지는 데이터 구조
행과 열을 이차원 배열의 형태
라이브러리
pip install yahoo_fin
import yahoo_fin.stock_info as si
import numpy as np
import pandas as pd
리스트
ticker = "google"
earning_list = si.get_earnings_history(ticker)
type(earning_list)
list
earning_list[:2]
누락데이터
데이터의 누락 (missing) - 관측값이 존재하지 않는 경우
데이터 프레임에서 NaN 표시
누락된 데이터를 채우는 것 imputation
fillna
NaN인 부분을 주어진 값으로 채운다
dropna
NaN을 포함한 행들을 삭제
728x90
'통계&데이터사이언스 > 데이터과학개론' 카테고리의 다른 글
데이터과학개론 14.파이썬을 이용한 데이터 시각화 - 1 (1) | 2024.12.23 |
---|---|
데이터과학개론 13.파이썬을 이용한 데이터 가공 - 2 (0) | 2024.12.23 |
데이터과학개론 11. ggplot2를 이용한 데이터 시각화 (1) | 2024.12.23 |
데이터과학개론 10. 데이터 시각화의 이해 (0) | 2024.12.23 |
데이터과학개론 09. 새로운 개념의 R 데이터 구조 (2) | 2024.12.23 |