KJLab home >> 그들이 설명하지 않는 IT/딥러닝 >>
TF_IDF 한 줄로.
TF_IDF는 "한 문서 내 단어 출현 빈도수 / 전체 문서 중 단어 출현한 문서수" concept.
-> 많은 사람들이 두루 하지 않는 행동을 그 사람이 많이 한다면 그의 특징으로 볼 수 있다.
(적용 - 아빠가 해커랭크 10번 접속했고, 전체 샘플 200 중 20 해커랭크 접속자가 있다면, 10/20 -> 0.5, 아들은 2회 접속했다면 0.01, 아빠는 해커랭크 관심자로 볼 수 있음. 주로 log 걸어 처리...)
여기서 NMF로 이어지고 TF_IDF도 조 선생님(감사합니다!)에 한두말씀 보태서 정리해볼 수도 있겠는데 굳이 내 정리까지 궁금해하는 사람이 없을 것이므로...
그리고 그들이 또 설명하지 않는 부분들이 있는데...
어떻게 생각하세요? 답글을 남겨주세요.
Facebook Comments