통계&데이터사이언스/R컴퓨팅
데이터 구조(2)
데이터 시오
2024. 5. 23. 15:16
728x90
반응형
배열 Array
배열은 행렬을 2차원 이상으로 확장시킨 객체
배열은 행렬의 확장, 기본적인 성질은 행렬과 비슷하다
배열을 생성하기 위해 대표적인 함수
dim()
# 배열 생성 예시
data <- 1:12
arr <- array(data, dim = c(3, 4)) # 3x4 배열 생성
리스트
리스트는 서로 다른 형태(mode)의 데이터로 구성된 객체
리스트를 구성하는 성분은 서로 다른 형태의 원소를 가질 수 있고 길이도 다를 수 있다
length 자료의 개수
mode 자료의 형태
names 각 구성요소의 이름
리스트를 생성하고 추출하는 방법은 행렬과 배열과 비슷하다
특정한 성분을 추출하거나 성분 내의 특정 원소를 추출하려면 아래와 같은 연산자를 사용
- [[ ]] 를 사용하여 리스트에서의 성분을 추출
- 성분의 이름이 부여되었다면 $ 연산자로 구분됨
- [ ] 연산자를 사용하여 성분 내의 특정 원소를 추출
데이터 프레임
각 열들이 서로 다른 형태의 객체를 가질 수 있다
① 데이터프레임은 형태가 일반화된 행렬 (matrix)
② 데이터프레임이라는 하나의 객체에 여러 종류의 자료가 들어갈 수 있음
③ 데이터프레임의 각 열은 각각 변수와 대응
④ 분석이나 모형 설정에 적합한 자료 객체
read.table() - 외부 텍스트 파일을 불러들인다
data.frame() - 여러 종류의 자료객체들을 서로 결합한다.
as.data.frame() - 다른 형태의 자료객체를 데이터 프레임의 형태로 변환한다.
데이터 프레임의 결합
cbind() - 옆으로 합치기
rbind() - 아래로 합치기
merge() - 병합하
728x90