1. Word embedding - 텍스트 유사성 계산, 위키피디아를 이용한 영화 추천 시스템 (Chapter 3, Chapter 4) Outline (1) 기계학습에 사용되는 모든 데이터는 수량화된(Quantified) 값을 입력값 혹은 출력값으로 사용하게 됩니다. 가장 이상적인 것은 우리가 사용할 수 있는 모든 값들이 수량화되어있는 변수인 케이스겠지만, 현실에서 쉽게 접할 수 있는 많은 데이터는 별도의 수량화 작업이 필요한 경우가 많습니다. 물론 단순한 범주형(Categorical) 변수라면, 해당 범주에 해당하는 부분에 1, 그렇지 않은 부분에 0을 코딩하는 one-hot encoding(또는 dummy변수화)과 같은 작업을 통해 간단히 수량화시킬 수 있습니다. 그러나 모델이 언어, 음성, 영상 등을 처리해야 하는 단계에 이르다보면 이 문제는 더욱 복잡해지게 됩니다. 우리가 자연적으로 접하는 경우가 많은 이러한 데이터들은 보통 sp.. 0. [Deep learning cookbook 스터디] 시리즈 소개 1. Introduction (그림) Deep learning cookbook (Douwe Osinga 저, 김백기 외 5인 역) 지금 여러분께서 보고 계신 [Deep learning cookbook 스터디] 시리즈는 머신러닝 또는 컴퓨터공학 전공이 아닌 대학원생 6명이 tensorflowKR Facebook 페이지에 게재된 'Deep learning cookbook' 스터디 그룹 모집 공고를 우연히 발견한 것에서 출발했습니다. 저희 멤버들은 딥러닝에 큰 관심을 가지고 있었고, 관련 수업을 수강하거나 실무적으로 간단하게 인공신경망을 활용하는 수준의 몇몇 프로젝트를 참여하는 등 딥러닝과의 소소한 인연을 만들어가고 있었습니다. 그럼에도 각자의 연구 주제 또는 프로젝트 주제를 벗어나는 넓은 분야의 코딩 경험은.. 이전 1 다음