텍스트 마이닝: 비정형 데이터를 활용한 정보 추출의 기술
텍스트 마이닝(Text Mining)이란?텍스트 마이닝은 대량의 비정형 텍스트 데이터를 분석하여 유용한 정보를 추출하는 기술이나 과정을 의미합니다. 자연어 처리(NLP), 통계, 기계 학습 등을 활용해 텍스트 데이터를 구조화하거나 패턴과 트렌드를 발견합니다. 이는 빅데이터 분석의 한 분야로, 비즈니스, 학문, 공공 데이터 분석 등 다양한 분야에서 사용됩니다.1. 데이터 수집분석할 텍스트 데이터를 수집합니다.예: 뉴스 기사, 소셜 미디어 게시물, 리뷰, 이메일, 연구 논문 등2. 전처리(Preprocessing)텍스트를 분석 가능한 형태로 변환하는 단계입니다.토큰화(Tokenization): 문장을 단어 단위로 나눔불용어 제거(Stopwords Removal): 의미 없는 단어 제거 (예: "그리고", "..
2025. 3. 7.
빵과 페이스트리의 차이
Bread는 한국어로 빵이라고 합니다.Pastry는 한국어로 특별한 단어로 번역되기보다는 페이스트리로 그대로 사용하거나, 상황에 따라 구운 과자 또는 디저트 빵으로 표현됩니다.빵: 기본적으로 밀가루, 물, 이스트로 만든 식품. 주로 간단한 식사나 간식으로 사용됩니다.예: 식빵, 바게트, 단팥빵페이스트리: 버터나 쇼트닝 같은 지방 성분이 많이 들어가고, 종종 달콤한 맛이 나는 고급스럽고 섬세한 빵이나 디저트.예: 크루아상, 타르트, 에끌레어빵: 간단하고 담백한 맛 중심.페이스트리: 달콤하거나 풍미가 풍부한 디저트로 주로 사용.한국에서는 빵과 페이스트리를 모두 빵집(베이커리)에서 판매하지만, 페이스트리는 좀 더 고급스러운 느낌으로 인식되기도 합니다.1. 재료의 차이빵: 밀가루, 물, 이스트, 소금과 같은 기..
2025. 3. 4.