반응형 토픽 모델링(topic modeling)1 토픽 모델링: 텍스트 데이터에서 숨겨진 주제 찾기 토픽 모델링(Topic Modeling)이란?토픽 모델링은 텍스트 데이터에서 잠재적인 주제(토픽)를 자동으로 식별하는 기법입니다. 문서나 텍스트 컬렉션 안에서 유사한 단어들을 그룹화하여 주제의 구조를 파악할 수 있도록 도와줍니다. 이는 비지도 학습 기법의 일종으로, 텍스트 데이터에 사전 레이블이 없는 경우에도 효과적으로 사용할 수 있습니다.1. 잠재 디리클레 할당(LDA, Latent Dirichlet Allocation)문서가 여러 주제의 혼합으로 이루어져 있다는 가정에 기반.각 문서는 특정 비율로 여러 주제에 속하며, 각 주제는 특정 단어들의 분포로 표현됨.가장 널리 사용되는 토픽 모델링 기법.2. 비음수 행렬 분해(NMF, Non-negative Matrix Factorization)문서를 행렬로 .. 2025. 3. 6. 이전 1 다음 반응형