Course Logistics

Table of contents

  1. 선수과목
  2. 참고문헌
  3. 평가방법
  4. 프로그래밍 언어

선수과목

다음 과목을 선수 과목으로 한다. • 통계학과 학부교과목 수학통계 1, 2 (326.311, 326.312) • 통계학과 학부교과목 데이터마이닝 방법 및 실습 (326.413) 또는 컴퓨터공학부 학부교 과목 기계학습개론 (4190.420) 즉 선형대수학 기초지식과 참고문헌 Wasserman (2004)에 소개되는 통계이론을 알고 있는 것을 전제로 한다. 만약 위의 선수과목을 수강하지 않으면 담당 교수와 개별 면담을 통해 수강 신청 여부를 결정한다. 다음과 같은 내용을 반드시 숙지해야 한다.

  1. Convergence in probability and distribution.
  2. Maximum likelihood estimation: Fisher information
  3. Hypothesis testing
  4. Bayesian inference
  5. Linear regression
  6. Logistic regression
  7. Regularization
  8. Bayes classifiers.
  9. Support vector machine
  10. Determinants, eigenvalues and eigenvectors

참고문헌

  1. Bishop, C. (2006). Pattern Recognition and Machine Learning. Springer. ISBN 978-
  2. (recommended) - Available at https://www.microsoft.com/en-us/research/publication/pattern-recognition-machine-learning/?OCID=msr_ebook_cbishop_fb.
  3. Murphy, K. (2021). Probabilistic Machine Learning: An Introduction. MIT Press. ISBN 978-0-262-046824 (recommended) - Available at https://probml.github.io/pml-book/book1.html.
  4. Shalev-Shwartz and Ben-David (2014). Understanding Machine Learning: From Theory to Algorithms. Cambridge University Press. ISBN 978-1107057135. (recommended) - Available at https://www.cs.huji.ac.il/~shais/UnderstandingMachineLearningunderstanding-machine-learning-theory-algorithms.pdf
  5. Wasserman, L. (2004). All of Statistics: Concise Course in Statistical Inference. Springer. ISBN 978-0387402727. (recommended) - Available at http://link.springer.com/book/10.1007/978-0-387-21736-9 on campus
  6. Wasserman, L. (2005). All of Nonparametric Statistics. Springer. ISBN 978-0387251455. (recommended) - Available at http://link.springer.com/book/10.1007/0-387-30623-4 on campus

평가방법

격주로 숙제가 나갈 예정이며 숙제는 숙제제출 마감날짜 오후 5시까지 eTL에 통해서 제출하여야 한다. 늦게 제출한 숙제는 0점 처리할 예정임.

시험일정. 중간고사와 기말고사 일정은 다음과 같다.

  • 시험 1: 10월 4일, 오후 6-8시 (금요일)

  • 시험 2: 11월 8일, 오후 6-8시 (금요일)

  • 시험 3: 12월 13일, 오후 6-8시 (수요일)

최종학점은 다음과 같이 계산된다.

  • 수업참여도 5%

  • 숙제 20%

  • 시험 1 25%

  • 시험 2 25%

  • 시험 3 25%

프로그래밍 언어

이 과목에서 사용되는 예제는 모두 R를 사용하여 분석결과를 제시할 예정이다. R은 통계분석에 최적화된 언어로 파이썬, Matlab과 비교시 자료분석에 있어서 여러가지 장점이 있다. R에 관한 다양한 튜터리얼과 참고문헌은 http://www.r-project.org 에서 찾아볼 수 있으며 R에 과한 (조금 오래된) 뉴욕타임즈의 기사는 https://www.nytimes.com/2009/01/07/technology/business-computing/07program.html에서 읽을 수 있다. 한국어로 된 참고문헌으로는 R for Practical Data Analysis http://r4pda.co.kr/ 이나 권재명 (2017) 따라하면서 배우는 데이터 과학 http://dataninja.me/ipds-kr/을 추천한다.