AI 및 Data Analysis/Deep Learning
[Asymmetric Attributes] Concepts
doraemin_dev
2025. 4. 18. 03:35
Asymmetric Attributes (비대칭 속성)
비대칭 속성(asymmetric attributes)이란,
속성값 중에서 '존재(presence)'만 중요하고, '부재(absence)'는 중요하지 않은 속성을 말합니다.
▶︎ 예시: 문서 내 단어 출현 여부 (텍스트 마이닝)
문서 A | 문서 B |
"apple", "banana", "grape" | "apple", "grape" |
- 여기서 단어 "banana"가 문서 A에만 등장하고, B에는 없다고 해도,
우리는 보통 "banana가 없다는 사실"을 중요하게 여기지 않습니다. - 중요한 건 어떤 단어가 **"포함돼 있느냐"**지, 포함돼 있지 않다는 건 비교에 큰 영향을 주지 않아요.
▶︎ 예시: 고객 구매 내역 (장바구니 분석)
- A고객: 우유, 계란, 치즈
- B고객: 우유, 계란
→ 이 경우, "치즈를 샀다"는 정보는 중요,
하지만 B고객이 "치즈를 안 샀다"는 건 덜 중요한 정보로 간주됩니다.
🔹 왜 '비대칭'일까?
- 일반적으로 속성은 '0'과 '1'을 대칭적으로 해석하지만,
- 비대칭 속성은 **1(존재)**만 유의미하고,
**0(부재)**는 그냥 무시하거나 정보로 간주하지 않는다는 점에서 **"비대칭적"**입니다.
실전에서의 처리
- 거리 계산에서 Jaccard 계수 같은 비대칭 유사도 측정 도구 사용
(부재 정보는 무시하고, 공통 존재 항목만 비교)