Ch3. Introduction to Predictive Modeling: From Correlation to Supervised Segmentation - 숙명여자대학교 소프트웨어학부 데이터사이언스개론 - 박동철 교수님 * Modeling: 새로운 데이터가 들어왔을 때 결과를 예측하기 위함 # Predictive Modeling - 일반적인 과정 > data를 잘 묘사하는 model을 구축 → Bulid a model > 새로운 data의 결과를 예측하기 위해 model을 적용시킴 → Apply the model - 첫 번째로 classification을 고려할 수 있음 > training data를 기반으로 새로운 data가 속할 class를 식별 # Model - 목적에 맞는 현실의 단순화 표현 →..
Ch2. Business Problems and Data Science Solution - 숙명여자대학교 소프트웨어학부 데이터사이언스개론 - 박동철 교수님 # Data Science Process - data science의 원리 > data mining은 상당히 이해되는 단계임 → fairly well-understood = systematic - Data science의 과정 > data scientist들은 현실세계의 문제를 substask로 나눔 > subtask들에 대한 해결은 전반적인 문제를 해결하기 위해 구성됨 - 문제의 밑바탕이 되는 공통된 data mining task가 있음 > ex) classification, regression, clustering, association, rule..
Ch1. Data-Analytic Thinking - 숙명여자대학교 소프트웨어학부 데이터사이언스개론 - 박동철 교수님 # What is data science? - 다양한 형태 안에 데이터로부터 지식과 견해를 추출하고 발견하기 위한 융합적인 학문(interdisciplinary) 분야 - Software Development: Domain/business knowledge를 통해 요구사항을 파악 → C/S로 개발 - Domains/Business Knowledge: 어떤 지식과 insight가 필요한지에 대한 정보 알 수 있음 - Traditional Research: 분석이 대다수 # The Realm of Data Science - 최근 사업(or 다른 분야..)을 진행하는데 있어 데이터를 모으는 능..