이 레슨과 관련된 학습 키워드
인공지능(AI) — 기계가 생각하는 법 → 자연어처리(NLP) — 기계가 언어를 이해하다 → NLP 응용 — 번역, 요약, 질의응답 → 실전 응용
감성 분석의 모든 것: 사전 기반부터 BERT fine-tuning, ABSA, 다국어, LLM zero-shot까지
고객 리뷰 수만 건을 사람이 일일이 읽고 분류하는 건 현실적으로 불가능해요.
{sentiment→센티먼트} {analysis→어낼리시스}, 즉 감성 분석은 텍스트에서 감정과 의견을 자동으로 파악하는 NLP 핵심 기술이에요.
다이어그램 왼쪽을 보시면, 입력 데이터 소스가 나와 있어요 — 제품 리뷰, 소셜 미디어, 고객 지원 로그, 뉴스 기사까지 다양해요.
이 원시 텍스트들이 바로 분석에 들어가는 건 아니에요. 중간에 전처리 파이프라인을 반드시 거쳐야 해요.
전처리 단계를 보시면, 토큰화, 불용어 제거, 정규화, 이모지 처리가 순서대로 진행돼요.
전처리가 끝나면 분석 엔진으로 넘어가요. 사전 기반 방식부터 트랜스포머까지 네 가지 접근법이 있어요.
{VADER→베이더}라는 사전 기반 도구는 규칙만으로 빠르게 감성을 판단하고, ML 방식은 나이브 베이즈나 SVM을 사용해요.
딥러닝으로 가면 CNN이나 LSTM이 텍스트의 패턴과 순서를 학습하고, BERT 같은 트랜스포머가 최고 성능을 보여줘요.
오른쪽 출력 결과를 보시면, 단순히 긍정과 부정만 나누는 게 아니라 중립과 세분화된 감정까지 분류할 수 있어요.
분노, 기쁨, 슬픔, 놀라움 같은 세밀한 감정 분류를 emotion detection이라고 불러요.
하단의 산업별 활용 사례를 보세요. 전자상거래에서는 리뷰 기반 추천에, 금융에서는 뉴스를 통한 시장 심리 분석에 활용돼요.
헬스케어에서는 환자 피드백을 분석하고, 정치 분야에서는 여론 동향을 실시간으로 추적해요.
HR 부서에서도 직원 만족도를 텍스트 기반으로 측정하는 데 감성 분석을 적극 활용하고 있어요.
매일 수억 건의 텍스트가 생성되기 때문에, 감성 분석의 자동화는 선택이 아니라 필수예요.
이 기술은 NLP에서 가장 상업적 가치가 높은 태스크 중 하나로, 거의 모든 산업에 영향을 미치고 있어요.
이번 강의에서는 사전 기반부터 BERT {fine-tuning→파인튜닝}까지, 감성 분석의 전체 스펙트럼을 단계별로 살펴볼 거예요.
각 방법의 장단점과 실전 적용 전략을 함께 비교하면서 가장 적합한 접근법을 찾아보겠습니다.
그럼 먼저 감성 분석의 종류부터 자세히 알아볼까요?
Binary에서 시작해서 {aspect→어스펙트} 기반까지, 분류 체계의 진화를 따라가 봅시다.
준비되셨으면, 다음 슬라이드로 넘어가겠습니다.