'문장 유사도' 태그의 글 목록

250x250

Notice

Recent Posts

Today

Total

Link

관리 메뉴

목록문장 유사도 (2)

DATA101

[NLP] 문서 유사도 분석: (3) 자카드 유사도(Jaccard Similarity)

📚 목차1. 자카드 유사도 개념2. 자카드 유사고 실습1. 자카드 유사도 개념자카드 유사도(Jaccard Similarity)는 $2$개의 집합 $A$, $B$가 있을 때 두 집합의 합집합 중 교집합의 비율입니다. 즉, 두 집합이 완전히 같을 때는 자카드 유사도가 $1$이며, 두 집합에 교집합이 없는 경우는 $0$입니다. 자카드 유사도를 $J$라고 할 때 두 집합 간의 자카드 유사도 수식은 아래와 같습니다. $$ J(A, B) = \frac{|A \cap B|}{|A \cup B|} = \frac{|A \cap B|}{|A| + |B| - |A \cap B|} $$ 자카드 유사도 개념을 자연어처리 분야로 그대로 가져오면, 하나의 집합이 곧 하나의 문서가 해당하는 것입니다. ..

AI & 빅데이터/자연어처리(NLP) 2022. 4. 20. 09:09

[NLP] 문서 유사도 분석: (2) 유클리디안 거리(Euclidean Distance)

📚 목차1. 유클리드 거리 개념2. 유클리드 거리 실습1. 유클리드 거리 개념수학적 관점 접근유클리드 거리(Euclidean Distance)는 두 점 사이의 거리를 계산하는 기법입니다. 두 점 $p$와 $q$가 각각 $(p_1, p_2, ..., p_n)$, $(q_1, q_2, ..., q_n)$ 좌표를 가질 때, 두 점 사이의 거리를 유클리드 거리 공식으로 표현하면 아래와 같습니다. $$ \sqrt{(q_1 - p_1)^2 + (q_2 - p_2)^2 + ... + (q_n - p_n)^2} = \sqrt{\displaystyle\sum_{i=1}^{n}(q_i - p_i)^2}$$ 다차원이 아닌 2차원 공간에서 유클리드 거리를 쉽게 알아보겠습니다(그림 1 참고). 두 점 \..

AI & 빅데이터/자연어처리(NLP) 2022. 4. 19. 08:39

이전 Prev 1 Next 다음

목록문장 유사도 (2)

DATA101

티스토리툴바