파이썬 사진 메타데이터 분석
우리가 스마트폰으로 찍는 모든 사진에는 메타데이터가 기록되어 있습니다.
메타데이터에는 사진이 찍혔던 위치, 시간 등이 기록되어 있습니다.
사진이 찍힌 위치와 시간이 유사한 케이스별로 그룹화볼 수 있습니다.
여러 클러스터링 기법들이 있지만,
DBSCAN (Density-based spatial clustering of application with noise) 밀도 기반 클러스터링이 많은 경우 잘 쓰입니다.
좀 더 기초적인 클러스터링 방법으로는 k Means clustering, 또는 Hierarchical Clustering도 있습니다.
이 두 방법은 모두 군집 간의 거리를 이용해서 클러스터링을 하는 방식입니다.
반면 DBSCAN은 좀 더 발전된 기법으로, 밀도 기반의 클러스터링 방식입니다. 즉, 어느 점을 기준으로 반경 x내에 점이 n개 이상 있으면 하나의 군집으로 인식합니다.
여기서 '어느 점'을 core point라고 부르고, 서로 다른 core point 간의 거리가 가까우면 그 둘을 서로 같은 군집으로 간주합니다.
그리고 군집에 있으나 core point가 아닌 점은 border point라고 부릅니다.
어느 클러스터에도 속하지 않는 점은 Noise point라고 부릅니다.
사용결과
(참조)
클러스터링 #3 - DBSCAN (밀도 기반 클러스터링) DBSCAN (밀도 기반 클러스터링) 조대협(http://bcho.tistory.com)기본 개념이번에는 클러스터링 알고리즘중 밀도 방식의 클러스터링을 사용하는 DBSCAN(Density-based spatial clustering of applications with noise) 에 대해서 알아보도록 한다.앞에서 설명한 K Means나 Hierarchical 클러스터링의 경우 군집간의 거리를 이용하여 클러스터링을 하는 방법인데, 밀도 기반의 클러스터링은 점이 세밀하게 몰려 있어서 밀도가 높은 부분을 클러스터링 하는 방식이다. 쉽게… DBSCAN (밀도 기반 클러스터링) 조대협(http://bcho.tistory.com)기본 개념이번에는 클러스터링 알고리즘중 밀도 방식의 클러스터링을 사용하는 DBSCAN(Density-based spatial clustering of applications with noise) 에 대해서 알아보도록 한다.앞에서 설명한 K Means나 Hierarchical 클러스터링의 경우 군집간의 거리를 이용하여 클러스터링을 하는 방법인데, 밀도 기반의 클러스터링은 점이 세밀하게 몰려 있어서 밀도가 높은 부분을 클러스터링 하는 방식이다. 쉽게…

