KJLab home >> 그들이 설명하지 않는 IT/딥러닝 >>

TF_IDF 한 줄로.

December 10, 2020 6:56 AM | Comments (0)


TF_IDF는 "한 문서 내 단어 출현 빈도수 / 전체 문서 중 단어 출현한 문서수" concept.
-> 많은 사람들이 두루 하지 않는 행동을 그 사람이 많이 한다면 그의 특징으로 볼 수 있다.

(적용 - 아빠가 해커랭크 10번 접속했고, 전체 샘플 200 중 20 해커랭크 접속자가 있다면, 10/20 -> 0.5, 아들은 2회 접속했다면 0.01, 아빠는 해커랭크 관심자로 볼 수 있음. 주로 log 걸어 처리...)

여기서 NMF로 이어지고 TF_IDF도 조 선생님(감사합니다!)에 한두말씀 보태서 정리해볼 수도 있겠는데 굳이 내 정리까지 궁금해하는 사람이 없을 것이므로...

그리고 그들이 또 설명하지 않는 부분들이 있는데...

어떻게 생각하세요? 답글을 남겨주세요.

Facebook Comments