데이터 포터빌리티에 딴지걸기

개인적으로 한번 만나본 적도 있는 Forrester Research의 유명 애널리스트 Charlene Li가, "Graphing Social Patterns" 컨퍼런스에서 키노트 스피치를 했다. 발표 자료는 아래 Slideshare를 참고.


요새 대략 이러한 쪽의 주제들이 화두로 등장하는 것 같다. 유저의 프로필과 관계 데이터를 따로따로 들고있는 서비스들이 자꾸 늘어나다 보니, 크게 두 가지 이슈가 대두되는 것 같다. 첫째로 유저의 프로필과 관계데이터는 유저에게 귀속되어야지 서비스 업체에 귀속되면 안된다는 소유권의 이슈와 (참고로 일본의 믹시는 이걸 잘 이해하지 못하고 있는것 같다), 두번째로 여러 서비스마다 프로필과 관계데이터를 따로따로 정의해야 하는 불편함의 이슈인 듯하다.

이러한 논의를 가속화 시킨 사람들은 여러 명이 있다. 라이브저널의 제작자이자 지금은 구글에 가있는 브래드 피츠패트릭이 데이터 포터빌리티를 강력히 주창하고 있고, 특히나 인터넷의 창시자라고까지 불리는 팀 버너스 리는 차세대 웹을 가르켜 "Giant Global Graph"라고 부르고 있다. 초기의 웹이 "III", 즉 "International Information Infrastructure" 였고, 현재의 웹이 "WWW", 즉 "World Wide Web"이라면, 이제 향후에 올 웹은 "GGG"라는 것이다. (기막힌 조어(造語) 능력은 인정한다손 치더라도, GGG를 한글로 발음하면 어째 이름이 좀;;;)

GGG란? 오래전부터 이야기하던 시맨틱웹을 말하는 것과 유사한 듯한데, 단순히 도큐먼트들과 그들의 링크로 주로 표현되는 현재의 웹이 아닌, 각각의 데이터가 의미를 지님으로써 데이터간의 관계성이 잘 도출될 수 있고, 이에 따라 사람이 아닌 시스템끼리도 알아서 데이터를 주고 받을 수 있는 그런 웹을 말하는 듯하다.

이러한 비전을 실행하기 위해서 주창되고 있는 표준들은 실제 그 내용을 들여다보면 실은 매우 간단하다. (TNF의 신정규님이 이야기하는 것처럼, 다양성이 표출되기 위해서는 common한 기반은 오히려 간단해야 할 것이다. 인간의 염색체를 보라.) 무식하게 이야기하자면 대략 이런 것 같다. 오픈아이디로 서로 다른 서비스에서의 프로필 입력 및 인증을 처리하고, 유저가 입력한 프로필 정보 및 관계 데이터는 hCardXFN등의 마이크로포맷을 사용해 마크업함으로써 이러한 정보들이 시스템에 의해서 인지될 수 있도록 하며, 관계데이터 (소셜 그래프)는 FOAF라는 RDF형태로써 이동성(포터빌리티)을 가질 수 있도록 지원하자는 것이다. 물론 한 서비스가 다른 서비스에게 유저 정보중 일부에 대한 액세스를 요청할 수 있는 OAuth같은 규약도 이야기되고 있다.

그럼 이렇게 했을 때 좋은 점이 무엇인가? 유저들이 자기 자신에 대한 정보(프로필) 및 자신의 네트워크에 대한 정보(소셜 그래프)를 보다 잘 (여기서 "보다 잘"이란 "기계가 볼때 보다 잘"이 되겠다) 정의해 놓으면, 서비스 (또는 보다 확장된 의미의 오픈 인터넷) 에서는 "관계 정의"의 맵을 따라감으로써 흥미로운 짓거리(?)를 할 수 있다는 것이다.

생각해 보자. 예를 들어 "한양대학교 공과대학 친구"로 규정되어 있는 전 국민을 추출할 수도 있고, "나는 친구로 규정하였는데 상대방은 나를 애인으로 규정한 사람들의 집합"도 뽑아낼 수 있겠다. 또한 내 미투데이 친구들이 쓴 티스토리 글만을 골라서 볼 수도 있겠고, 내가 "와인전문가"라고 규정한 사람들이 주로 보는 블로그 글이 어떤 것인지를 뽑아서 보여줄 수도 있을 것이다. 비슷한 예로 흔히 아마존과 페이스북의 예시가 거론되는데, 아마존 사이트의 상품평이 출력되는 곳에 조건을 걸어놔서, 작성자가 내 페이스북 친구일 경우 해당 div id의 CSS는 다른 것이 먹여지게 함으로써, 내 페이스북 친구가 작성한 리뷰 컨텐츠는 아마존에서 뻘건색으로 보일 수 있도록 하는것도 가능할 것이다. 또한 자기 자신의 데이터를 한 곳에 모으는 것은 rel="me"로 정의된 곳의 데이터만 모으면 될 것이다. 가장 골치가 아픈 스팸의 경우, XFN을 통해 믿을 수 있는 사람으로 마킹된 사람들은 스패머가 아닌 사람들의 리스트, 즉 "whitelist" 목록에 자동으로 추가해 주는 시도도 나오고 있다.

머 하여간 여러가지 재미있는 일을 할 수 있을 것 같긴 하다. 그러나, 여기서 살짝 딴지아닌 딴지를 걸게 되는 대목들이 있다...

첫째, 마크업에 대한 부분이다. 글에 태그를 매기는 빈도수가 현저히 낮다는 것은 다 알려진 사실인데, 마찬가지로 자신과 관계하는 사람에 대해서 일일히 마크업 하는 빈도수 역시 낮지 않을까? 트위터에서는 "Follow" 버튼 한번만 누르면 되지만 XFN 블로그롤에서는 유저가 일일이 관계데이터를 정의하는 수고를 해주어야 한다. 유저들에게 많은 것을 요구하는 것은 아닌지? 그렇다고 Facebook처럼 미리 정의된 셋트를 주고 알맞은 관계를 고르라는 객관식 문제를 내주는 것 역시 그닥 맞아보이진 않고, 페이스북에서 그랬던 것처럼 유저들의 원성에 직면할 수도 있다. 싸이월드 일촌이 무척 제한적이긴 한데, 나름 편한건 있다.

두번째, 프로필의 규정 문제이다. 일례로 프로필 포터빌리티를 지원하는 hcard의 경우 vcard 포맷에서 온 것으로써 전화번호, 직장, 이메일 등의 "리얼 월드" 아이덴티티를 많이 요청한다. 블로그같은 서비스에서 프로필 정보의 포터빌리티라는 베네핏을 주기 위해서 회원가입시 오프라인적인 아이덴티티 정보의 입력을 요청하기는 어려워 보인다. (아무리 옵셔널 항목으로 넣는다고 해도 말이다.) 오히려 블로거의 프로필을 규정하는 정보는 해당 블로거의 블로깅 패턴에서 추출된 (혹은 유저 자신이 자신의 블로그 아이덴티티에 맞추어 규정한) 메타데이터를 프로필의 일부로 되돌려 귀속시켜 줌으로써, 컨텐츠 생산에 따라서 자신의 프로필도 enrich되는 "컨텐츠=>프로필 reinforcement" 기작을 두는게 더 맞을 것이다. 그런데 이러한 blog-specific한 프로필 정보들은 천상 블로그 안에서만 의미를 갖는 정보이므로, 블로그 서비스 내부의 소위 "siloed" 정보로 남을 수밖에 없다. 데이터 표준과 포터빌리티의 측면에서 딱 들어맞지만은 않는 그림이다.

세번째, 오픈아이디를 통한 로그인이라는 컨셉이 아직까지 일반 유저들에게 친숙하지 않다. 태터캠프에 오셨던 분들은 알겠지만, 오픈아이디를 유저들이 오히려 "불편 요소"로 삼고 있더라는 게 놀라운 사실이다. "네이버=인터넷"으로 통하는 우리나라 현실에서는 네이버 아이디를 그대로 써도 로그인되도록 해주는게 오픈아이디어야 하나라는 생각을 하게 되었다. 설치형 텍스트큐브는 오픈아이디 로그인을 이미 지원하고 있고, 서비스형 텍스트큐브 역시 그런 방향으로 갈 가능성이 훨씬 크지만, 행여 유저들이 오픈아이디라는 또다른 로그인 옵션을 보게 되는게 "도대체 이건 또 뭐지?"라는 distraction요소로 작용할 수 있지 않을까 걱정이다. 흥미롭게도 VOX 아이디는 그것 자체가 오픈아이디임에도 불구하고 사이트에서는 오픈아이디라는 "티"를 내지 않는다. 이것도 하나의 방법일 수 있겠다.

아무튼 이런 건 그냥 나만의 조용하고 소심한 딴지였고... 오픈 아이덴티티와 데이터 이동성 등은 큰 방향에서 보면 대세인 듯하다. 이렇게 계속 하다보면 언젠가는 URL이 http://ggg.yahoo.com 으로 바뀔 수도 있을까?^^

댓글 1개: