Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 자카드 유사도
- scipy
- 문서-단어 행렬
- sparse matrix
- 정렬 알고리즘
- 병합 정렬
- insertion sort
- dok
- 주피터 노트북
- csr
- merge sort
- 삽입정렬
- 파이썬
- COO
- 파이썬 가상환경
- 희소행렬
- CSC
- 아나콘다 가상환경
- 자연어처리
- CountVectorizer
- jaccard similarity
- 데이터분석
Archives
- Today
- Total
목록scipy (1)
시래 블로그
파이썬 scipy 희소행렬 설명 (coo, csr, dok)
파이썬 sklearn을 사용하다 보면, 희소행렬(sparse matrix)을 반환해줄 때가 있습니다. from sklearn.feature_extraction.text import CountVectorizer s = ['I love you', 'you love me'] count_vec = CountVectorizer() m = count_vec.fit_transform(s) m toarray 메서드를 이용하면 흔히 사용하는 넘파이 배열로 변환할 수 있지만, 애초에 왜 희소행렬을 반환해주는가 의문이 생깁니다. m.toarray() 희소행렬을 사용하는 이유 위에서는 두 개의 문장을 2 x 3 크기의 행렬로 바꾸는 작은 예시를 들었지만, 실전에서는 대규모 행렬을 다루어야 하는 경우가 흔합니다. 이 경우 메모..
데이터 과학
2020. 2. 5. 02:56