AI 및 Data Analysis/Deep Learning

[Asymmetric Attributes] Concepts

doraemin_dev 2025. 4. 18. 03:35

Asymmetric Attributes (비대칭 속성)

비대칭 속성(asymmetric attributes)이란,
속성값 중에서 '존재(presence)'만 중요하고, '부재(absence)'는 중요하지 않은 속성을 말합니다.

▶︎ 예시: 문서 내 단어 출현 여부 (텍스트 마이닝)

문서 A 문서 B
"apple", "banana", "grape" "apple", "grape"
  • 여기서 단어 "banana"가 문서 A에만 등장하고, B에는 없다고 해도,
    우리는 보통 "banana가 없다는 사실"을 중요하게 여기지 않습니다.
  • 중요한 건 어떤 단어가 **"포함돼 있느냐"**지, 포함돼 있지 않다는 건 비교에 큰 영향을 주지 않아요.

▶︎ 예시: 고객 구매 내역 (장바구니 분석)

  • A고객: 우유, 계란, 치즈
  • B고객: 우유, 계란

→ 이 경우, "치즈를 샀다"는 정보는 중요,
하지만 B고객이 "치즈를 안 샀다"는 건 덜 중요한 정보로 간주됩니다.


🔹 왜 '비대칭'일까?

  • 일반적으로 속성은 '0'과 '1'을 대칭적으로 해석하지만,
  • 비대칭 속성은 **1(존재)**만 유의미하고,
    **0(부재)**는 그냥 무시하거나 정보로 간주하지 않는다는 점에서 **"비대칭적"**입니다.

실전에서의 처리

  • 거리 계산에서 Jaccard 계수 같은 비대칭 유사도 측정 도구 사용
    (부재 정보는 무시하고, 공통 존재 항목만 비교)