본문 바로가기

통계&데이터사이언스46

[빅데이터의 이해와활용] 빅데이터의 수집과 활용 2 텍스트데이터의 활용 2한국언론진흥재단의 빅카이즈- 빅카인즈 : 한국언론진흥재단이 언론사 뉴스 통합 데이터베이스에 분석을 접목하여 개발한 뉴스 분석 서비스 뉴스 데이터의 특성- 뉴스 데이터는 검색 데이터에 비해 키워드가 명확- 데이터의 길이가 길어서 분석에 용이웹페이지 데이터의 수집과 활용웹크롤링 : 웹페이지 : 텍스트, 이미지, 영상 등이 포함된다- 데이터분석을 위해 HTML 작성 웹페이지에서 필요 데이터 추출 ➝ 웹 스크래핑, 웹 크롤링- 검색엔진 : 자동화된 웹 크롤러웹사이트에서 데이터를 크롤링 - 웹사이트의 구조 파악 감정 데이터 분석 API를 이용한 데이터의 수집과 활용공공데이터 : 정부와 공공기관이 통계작성, 행정처리 등을 목적으로 수집한 데이터- 세계 주요 국가 정부와 공공기관의 데이터를 개방.. 2024. 10. 7.
[빅데이터의 이해와활용] 빅데이터의 수집과 활용 1 빅데이터의 수집빅데이터의 수집 원천 : 내부 데이터 & 외부 데이터내부데이터- 정부 및 기업의 업무 과정에서 생성- 데이터베이스 등에 저장되어 업무에 활용, 일반적으로는 비공개- 정부 : 행정, 국세정보 등- 기업 : 인사, 회계, 고객 등 내부데이터 수집- 로그 데이터- 각종 센서 데이터, CCTV 등 외부데이터- 웹페이지, 정부 및 기업의 공개 데이터, SNS 데이터 등- 대부분 반정형 , 비정형 데이터 외부데이터 수집- 데이터베이스- 공개 API- 웹 크롤링 빅데이터 수집 : 검색, 수집, 변환의 연속과정- 다양한 원천 데이터를 수집 변환 통합하는 것- 비정형(반정형) 데이터를 정형 데이터로 변화하는 과정을 포함한다 외부데이터통계청 KOSIS정부 공공 데이터 포털AI HUB검색 데이터SNS 데이터뉴.. 2024. 10. 7.
[빅데이터의 이해와활용] 빅데이터의 개요2 데이터 분석  데이터 과학자 데이터경제 2024. 10. 7.
[빅데이터의 이해와활용] 빅데이터의 개요1 빅데이터 시대빅데이터 Big Data크고 다양한 형태를 가지고, 빠르게 생산/유통/소비되는 데이터빅데이터로부터 통찰을 얻는다 빅데이터의 이해⮕ SNS 데이터, 검색 데이터, 뉴스데이터, 동영상, 사진, 위치 데이터 등 DIKW 피라미드데이터 - 정보 - 지식 - 지혜 데이터는 데이터, 정보, 지식을 모두 포함한다  데이터의 구분1. 형태 : 정형, 비정형2. 보안 : 비밀, 민감, 일반3. 개인정보 : 식별, 비식별4. 개인 / 비개인 : 개인, 비개인(비식별, 기계) 가트넌의 하이프사이클  빅데이터의 확산 배경빅데이터의 확산 배경 개요1. 스마트기기 - 모바일 스마트 기기와 센서의 확산2. 인프라 - 빅데이터를 저장, 처리할 수 있는 하드웨어 인프라와 통신의 빠른 발전3. 소프트웨어 - 소프트웨어의 빠.. 2024. 10. 7.
[데이터처리와 활용] 3강 관계형 데이터베이스 설계 정규화 1. 정규화의 필요성- 삭제이상 : 중요한 데이터를 삭제할 때, 원치 않는 다른 데이터도 함께 삭제되는 경우- 삽입이상 : 새로운 데이터를 추가할 때, 다른 관련 데이터가 없으면 추가할 수 없는 경우- 갱신이상 : 데이터 수정 시, 같은 데이터의 여러 복사본을 모두 업데이트해야 하는 경우 2. 함수적 종속성데이터베이스에서 두 개의 속성 간의 관계 3. 정규형- 제 3 정규형 3NF1NF(제 1 정규형): 모든 필드가 원자값(Atomic Value)이어야 하며, 중복된 데이터가 없어야 한다2NF(제 2 정규형): 모든 비주요 속성이 기본 키에 완전 함수적으로 종속되어야 한다3NF: 모든 비주요 속성이 기본 키에 비이행적으로 종속되어야 합니다. 즉, A → B, B → C일 때 A → C가 성립하면 .. 2024. 10. 5.
[데이터처리와 활용] 2강 관계형 데이터베이스 설계 개체 - 관계모델 (E-R 모델)- E-R 모델이란?실제 세계를 Entity와 개체들간의 연관성을 나타내는 관계성으로 모델링 엔터티(Entity): 현실 세계에서 하나의 독립된 객체를 나타내는 것 관계(Relationship): 이 엔터티들 간의 연결  - 일반화/특수화 Generalization / Specialization 일반화 : 여러 개의 특수한 클래스(또는 엔터티)를 하나의 일반적인 클래스로 통합하는 과정 특수화 : 일반적인 클래스로부터 더 세부적인 클래스를 나누는 과정  - 집성화 Aggregation : 관계 자체를 하나의 엔터티로 취급하는 개념 2024. 10. 5.
반응형