'분류 전체보기' 카테고리의 글 목록 (10 Page)

딥러닝 스터디02

programming/Deep Learning 2019. 6. 9. 10:56

https://docs.google.com/document/d/1e65KbFCfMDlGAm4guatKLo9sVs-msiHwyXp5dfo58zk/edit?usp=sharing

구조를 엔지니어링하는 것이

특성을 엔지니어링하는 것이다.

어떤 특성이 유용한지 아닌지 사람이 직접 판단하는 어려움은 의미 x

어떤 특성을 주든 딥러닝은 알아서 좀 더 큰 관점에서 특성을 학습함

딥러닝은 알아서 배우기 때문에 결과적으로 힘든 부분은

수작업으로 특성이나 모델을 작업하는 데 있는 것이 아니라

모델 구조의 선택에 있다. 어떤 하이퍼 파라미터를 쓸지

특정 데이터셋에 어떤 신경망이 적합한지를 판단하는게 중요함.

어떤 머신러닝 문제를 다루든 모델을 학습시키기 전에

항상 데이터를 트레이닝과 테스팅으로 나누는 것부터 해야 한다.

추천 시스템에는 두 가지 유형이 있음 = 콘텐츠 기반, 유사성 기반

콘텐츠 기반 - 과거 기록을 통한 예측

유사성 기반(collaborative filtering) - 다른 사용자의 선호도를 바탕으로 예측

> 유사성 기반은 크게 두 가지로 나뉨 - 아이템&아이템, 사용자&아이템 유사성

정밀도와 재현율은 추천 시스템을 평가하기 좋은 방법

정밀도 - 관련 있는 결과값들이 차지하는 비율

재현율 - 관련 있다고 한 결과들 중에 실제 선택한 비율

행렬 분해 기반 추천 시스템 (평점 예측 )

SVD의 결과는 원래 행렬을 인수분해 한 행렬이다.

특이값 분해 적용.

특이값 분해를 하면 세 개의 결과가 나옴 - U(사용자 벡터), S(아이템 벡터), Vt(2차원 상의 점들)

https://darkpgmr.tistory.com/106

저작자표시 비영리 변경금지

'programming > Deep Learning' 카테고리의 다른 글

딥러닝 스터디03 - style transfer (0)	2019.06.17
딥러닝 스터디 01 (0)	2019.06.07
20190527 딥러닝 개념 설명 (0)	2019.05.28
lec06 softmax Regression (0)	2019.04.23
lect05-2 Logistic (regression) classification: cost function & gradient decent (0)	2019.04.23

Posted by 도이(doi)

,

딥러닝 스터디 01

programming/Deep Learning 2019. 6. 7. 11:52

csv파일

','로 구분지은 data txt 파일 포맷

DataFrame

2차원 배열 자료 구조

*'series'는 1차원 배열 자료 구조
2차원 배열 자료 구조가 기본적으로 더 많이 사용 됨.

자료구조

정리방식

*다른 형태의 파일 읽기(read_fwf, read_csv)

read_fwf

고정폭 파일에서 데이터 프레임 읽어오기
공백 구분자로 만들어진 파일 읽음

read_csv

','로 구분되는 파일 읽기
csv파일 읽음

*데이터 핸들링? - 데이터를 다룬다.

*선형회귀 - 이해안됨

회귀분석

무언가를 예측하는 분석, 예측값만 존재, 항상 오차 존재

결정계수

회귀식이 얼마나 정확한지를 나타내는 숫자, r²으로 표현(1에 근사할 수록 정확도 높음)

가설검정

회귀식이 믿을 만한지 의사결정

저작자표시 비영리 변경금지

'programming > Deep Learning' 카테고리의 다른 글

딥러닝 스터디03 - style transfer (0)	2019.06.17
딥러닝 스터디02 (0)	2019.06.09
20190527 딥러닝 개념 설명 (0)	2019.05.28
lec06 softmax Regression (0)	2019.04.23
lect05-2 Logistic (regression) classification: cost function & gradient decent (0)	2019.04.23