Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- csr
- dok
- 병합 정렬
- sparse matrix
- 파이썬
- 희소행렬
- insertion sort
- jaccard similarity
- 데이터분석
- 파이썬 가상환경
- CSC
- 정렬 알고리즘
- scipy
- 자연어처리
- 자카드 유사도
- 문서-단어 행렬
- merge sort
- 삽입정렬
- 아나콘다 가상환경
- 주피터 노트북
- CountVectorizer
- COO
Archives
- Today
- Total
목록자카드 유사도 (1)
시래 블로그
자카드 유사도의 변형과 활용, 상세 설명
자카드 유사도(Jaccard similarity)는 두 집합의 유사도를 측정할 때 사용하는 방법 중 하나입니다. 2가지 사례만 들어보겠습니다. 뉴스를 언론에서 자체적으로 만들어낼 수도 있지만, 연합뉴스가 취재한 뉴스를 사와서 조금 수정한 뒤 배포하는 경우도 있습니다. 그러면 다양한 언론사에서 수집한 뉴스 데이터라도 비슷하거나 똑같은 뉴스가 있을 수 있는 것이죠. 만약 구글 뉴스처럼 사용자에게 뉴스를 제공하는 일을 한다면 문서 간 유사도를 파악해 비슷한 뉴스는 걸러내서 서비스해야 합니다. 다른 사례는 두 고객 간의 유사도를 파악하는 일입니다. 넷플릭스처럼 고객이 좋아할 만한 영화를 알고리즘으로 추천하는 일을 할 때, 고객 간 유사도를 사용할 수 있습니다. 나와 취향이 유사한 사람이 좋아한 영화는 내가 봐도..
데이터 과학
2020. 2. 6. 00:17