조선시대 역사적 인물들 간의 정치적 관계에 대한 시각적 분석: 서거정을 중심으로
연구배경 실증적인 역사 연구 방법을 위해서는 많은 양의 자료와 시간, 그리고 역사적인 배경지식이 필요하다. 시각적 분석은 사용자가 데이터 사이의 관계나 데이터가 지니는 정보를 인지적으로 쉽게 확인 할 수 있다는 장점이 있다. 본 연구는 여러 분야의 학자들과 협업을 통해 조선왕조실록과 안동권씨성화보 데이터를 활용한 인물관계 데이터 시각화를 제작하고 분석하는 방법을 소개한다.
연구방법 분석을 위해 인물들이 낸 의견 간의 유사성을 노드의 거리로 표현하고, 노드의 색상 및 크기를 통해 인물들의 관계를 보여주는 버블힙 네트워크 시각화 방법을 사용하였다. 그리고 서거정을 중심으로 혈연과 정치활동의 관계를 분석하였다. 또한, 시각화 분석 도구의 효과를 사례 연구로 제시하였다. 마지막으로 설문조사 및 실험을 통해 본 연구의 사용성을 검증하였다.
연구결과 본 연구는 버블힙 네트워크 시각화를 이용하여 중심인물인 서거정과 비교하고자 하는 인물들을 낮은 유사도부터 높은 유사도까지 순서대로 배치하고, 혈연관계를 노드의 색상으로 표현함으로써 직관적인 이해도를 높였다. 또한, 서로 비슷한 유사도를 가지는 인물들을 군집시켜 분석을 용이하게 만들었기 때문에 다른 네트워크 시각화 기술들보다 비교가 쉽다는 점에서 기여도가 있었다.
결론 본 연구에서는 서거정과 다른 인물들의 투표유사도가 차이가 있는 지, 그리고 혈연관계가 투표유사도에 영향을 미치는 지를 분석하였다. 그 결과 전근대 시기 역사적인 사건은 크게 국무, 왕실, 외교, 정치, 관습으로 분류될 수 있으며 안건의 성격에 따라서 서거정과 다른 인물들의 의견 유사도가 달라짐을 확인하였다. 또한, 혈연관계는 임관의 기준으로는 중요하나 투표 성향 유사도에 영향을 미치지 않음을 알 수 있었다.
Abstract
Background History studies involve the discovery of new facts based upon the records as well as understanding relationships between historic events and figures. However, a vast amount of resources, background knowledge and time would be required for empirical historical research. Visual analysis has the advantage of allowing users to easily identify the relationships between data. This study present a way to create and analyze human relationship visualizations using data from Genealogy of the Kwon family and the Annals of the Joseon Dynasty based on collaboration with historians, linguists and statisticians.
Methods For the analysis, we used the bubble heap network visualization method, which expresses the similarities between the opinions of figures as distances between nodes. We also showed human relationships through the nodes' color and size. By looking at the relationship between kinship and political activities centered on Geojeong Seo, we explore the factors that influenced the formation of a relationship in the historical figure. In addition, our study shows the effectiveness of using visualization analysis tools in history data.
Results Bubble heap network visualization enhanced the intuitive understanding by placing the figures needed to compare with Geojeong Seo based on similarities and expressing their kinship using the colors of nodes. This visualization also contributes to research in that it is easier to compare than other network visualizations as it facilitates the analysis by grouping figures with similarities.
Conclusions In this study, we analyzed the voting similarity of Geojeong Seo and other figures. We also analyzed whether kinship affected the cause of voting similarity.As a result, historical events of the pre-modern period can be classified into state affairs, royal family, diplomacy, politics, and customs. The similarities between the Geojeong Seo and other figures are also different depending on the nature of the agenda. In addition, kinship cannot be regarded as an essential factor that affects the level of similarity of voting patterns.
Keywords:
Visual Analysis, Historical Data Mining, Network Visualization, Joseon-Dynasty, 시각적 분석, 역사데이터마이닝, 네트워크시각화, 조선시대1. 서론
1. 1. 연구의 배경 및 필요성, 연구의 목적
역사연구는 역사적인 사실이 기록된 자료를 이해하고 해석하는 과정에서 새로운 사실을 도출하고 역사적인 사건 및 인물들의 관계를 파악하는 일이다. 라파엘(Raphael, 2006)에 의하면, 1800년대 독일의 사학가 레오폴트 폰 랑케가 역사학을 엄밀한 사료 비판에 기초를 둔 학문이라고 주장하면서 근대 역사학이 형성되었고 하나의 독립된 학문으로 정립되기 시작하였다. 이렇게 시작된 역사학은 실증적 연구 방법으로써 사료를 고찰하고 역사적인 사실과 관계를 파악했다. 특히 실증적 연구 방법이란 객관적이고 중립적인 입장에서 실존하는 사료를 분석하고 이를 통해 발견된 규칙성과 법칙성을 제시하는 연구 방법이다. 오늘날의 역사학적 연구 방법도 실증적 연구 방법을 기반으로 하고 있으며 연구를 수행하기 위해서는 연구 대상이 되는 역사적 시기에 대한 정확한 이해와 객관적인 연구 자세가 필요하다. 하지만 이를 위해서는 사료를 이해하고 습득하는 데 있어서 많은 양의 시간과 노력이 요구되며, 객관적인 연구 자세를 취해야하는 어려운 점이 있다. 또한, 역사적 사료에 기록된 다양한 인물들의 관계를 효과적으로 나타내기 위해서는, 역사학자들의 사료 해석 능력 이외에도 인물의 관계 데이터를 정리할 수 있는 통계 분석 능력, 수학적 알고리즘을 통해 사료에 대한 객관성을 높여주는 컴퓨터 공학적 능력, 그리고 데이터의 결과를 쉽게 알아볼 수 있도록 만드는 정보 디자인적 능력이 필요하다.
본 연구는 이상에 언급한 배경에 입각하여, 역사학자와 언어학자, 통계학자와의 협업 과정을 통해 역사적 사료에서 나타나는 인물들의 관계 데이터를 시각화하고 이를 분석하는 방법을 소개하는 것을 주된 목적으로 한다. 연구의 목적을 달성하기 위해서는 주어진 데이터를 보기 쉽게 정리하여 시각화하는 부분이 포함되는데, 시각화 분석은 축적된 데이터를 자동적으로 분석하고 이를 시각적으로 표현함으로써 사람들의 이해를 도울 수 있다는 점에서 중요성이 대두된다. 그리고 역사적 연구 방법 및 분석 단계를 자동화시킴으로써 사료 습득을 위한 시간을 단축시킬 수 있으며 사용자의 인지도를 높이고 결과 해석에 대한 이해성을 높일 수 있다는 장점이 있다.
1. 2. 연구의 범위 및 방법
오늘날 역사학은 과거의 연장선에서 현재를 이해하려하거나, 현재와 과거가 어떻게 맞물려 내장되어 있는가에 대한 충분한 검토가 이루어지지 못하였다. 그 결과 ‘근대’는 ‘전통’과 단절된 대립적인 것으로 이해되었고, 그 연장선에서 ‘전통’(전근대)시기를 이해하는 이항대립적인 시각이 대두하였다. 하지만 근대 사회 이항대립적인 인물관계는 전근대 시기의 현상과 일맥상통하며 같은 연장선상에서 이를 분석하여야한다. 따라서 본 연구는 전근대 시기 역사적인 사실이 기록된 <조선왕조실록>과 <안동권씨성화보>를 활용하여 조선시대 이항대립적인 인물관계 형성에 영향을 미치는 요인을 탐색하고 이를 시각적으로 분석할 수 있도록 연구 범위를 설정하였다.
또한, 본 연구는 한 인물을 중심으로 혈연과 정치활동의 관계를 보여주는 방식으로 시각화의 방법을 선정하고자 한다. 하나의 인물을 중심으로 다른 인물들의 관계를 보여주게 되면, 기준점이 없는 기존의 관계 시각화에 비해 분석의 시작점이 명확하다는 장점이 있다. 그리고 무엇보다도 사용자 시선의 중심이 자연적으로 중심인물을 기준으로 관찰을 할 수 있기 때문에 보다 직관적으로 다른 인물들 간의 관계 거리를 비교할 수 있다는 점도 장점이다.
본 연구를 진행하기 전에 먼저 주 사료인 <안동권씨성화보>와 <조선왕조실록>의 사료적 가치에 대해서 확인할 필요가 있다. <안동권씨성화보>(이하 성화보)는 1476년 간행된 안동 권씨 가문의 족보로, 한국에서 현존하는 족보 중 가장 오래된 족보이다. 서거정은 조선전기의 특수성에 주목하여 성화보를 편찬했다. 강민구(Kang, 2010)에 따르면, 조선 전기를 대표하는 문인이자 관료였던 서거정은 관직 생활 내내 문인으로서 가장 영광된 일을 도맡아 할 정도로, 왕의 무한한 신뢰와 중앙에서의 영향력이 강했다. 국가에서도 인정받았던 서거정은 권근의 외손자 자격으로 1476년 성화보를 편집했는데, 서문을 통해 중국처럼 예를 다해야 안동 권씨 가문의 명성을 계속해서 이어나갈 수 있음을 강조하면서 성화보의 편집 목적을 드러냈다.
박용운(Park, 2005)에 따르면, 성화보는 동시대 중국이나, 조선 후기와는 다른 특징을 지니고 있다. 친손뿐만 아니라 외손도 기재했다는 점, 각 인물의 혼인 정보와 해당 가문에 대해 서술했다는 점에서 다른 족보와의 차별성을 두고 있고, 이는 곧 당시 혼인 네트워크와 더불어 전반적인 사회구조를 파악할 수 있게 해준다.
두 번째 사료인 <조선왕조실록> (이하 실록)은 조선 태조부터 철종에 이르기까지 약 500년간의 역사를 편년체로 기록한 책이다. 한우근(Han, 1988), 한영우(Han, 1985) 그리고 이성무(Lee, 1994)에 따르면, 실록은 조선 시대를 이해하기 위한 필수적인 기초 자료로 본 연구에 적합한 사료라 할 수 있다. 위의 두 사료를 통해 서거정을 중심으로 한 혈연관계와 정치적 의견을 정리한다면, 혈연관계와 정치적 의사 표출이 어떠한 관계가 있는지 확인할 수 있을 것이다.
하지만 근대 사회 이항대립적인 인물관계는 전근대 시기의 현상과 일맥상통하며 같은 연장선상에서 이를 분석하여야 한다.
따라서 본 연구는 전근대 시기 역사적인 사실이 기록된 실록과 성화보를 활용하여 조선시대 이항대립적인 인물관계 형성에 영향을 미치는 요인을 탐색하고 이를 시각적으로 분석하고자한다.
본 연구의 진행을 위해 첫 번째로, 사료에 기록된 인물들이 낸 의견들의 유사성 자료를 대상 데이터로 선정하였다. 의견 데이터 수집을 위해 실록의 사료를 조사하였으며, 1450년부터 1490년까지의 문종실록, 성종실록의 기사를 발췌하고 이를 시각화에 활용하기 위한 정제과정을 거쳤다. 그리고 혈연관계에 대한 정보를 정리하기 위해 성화보의 사료를 계층 구조화하여 string 형태로 나타내었다. 두 번째로, 정제된 데이터를 사용하여 각 인물들의 유사성을 노드의 거리로 표현하고, 노드의 색상 및 크기를 통해 인물들의 관계를 보여주는 버블힙 네트워크 시각화 방법을 사용하였다. 그리고 서거정을 중심으로 혈연과 정치활동의 관계를 시각적으로 살펴봄으로써, 조선시대의 이항대립적인 인물관계 형성의 영향을 미치는 요인이 무엇인지 탐색하고자 하였다. 세 번째로, 본 연구에서 제시한 시각화 도구를 사용했을 때 얻게 되는 효과를 정리하였고, 마지막으로 사용성 평가를 통해 시스템의 효용성을 검증하였다.
2. 사전 연구
2. 1. 역사적 사료 연구
안동 권씨는 한국 전근대 내내 높은 사회적 지위를 유지한 가문이었으며, 비슷한 사회적 지위를 가진 가문과 혼인을 맺는 경향이 있었기 때문에, 성화보를 통해 당시 사회구조와 가족 관계를 분석하는 연구가 많이 진행되었다. 와그너(Wagner, 2007), 히로시(Hiroshi, 1996), 그리고 이상국과 박현준(Lee and Park, 2008)에 따르면, 가족의 사회적 지위의 변화를 살펴보거나 통계적 분석을 통해 여말선초 사회가 쌍계친적 성격을 가진다는 것을 확인하거나, 이상국(Lee, 2013)에 따르면, 한국 중세 엘리트 가문의 권력 재생산은 세습적이며 폐쇄적인 특성뿐만 아니라 개방적 성격도 동시에 지니며 이루어졌다는 사실을 역시 밝혔다. 이상국과 이원재(Lee and Lee, 2017)에 따르면, 전근대시기 엘리트가문이 혼인관계를 통해 어떻게 사회적 변화에 대응하는지 확인하기도 했다. 이상국과 박종희(Lee and Park, Forthcoming)에 따르면, 더 나아가 족보 내 인물을 통해 여말선초 시기 각 세대별(특히 부모와 자식 간의) 사회적 지위의 선택적 분배 양상을 살피기도 했다.
그러나 기존의 성화보를 활용한 연구는 주로 당시 사회나 가족에 대한 이해를 중심으로 이뤄졌다. 하지만 당대 엘리트 가문으로 안동 권씨 내 인물들이 중앙으로의 활발한 관직 진출을 했으며, 서로 다른 엘리트가문과 혼인을 맺었다는 점을 생각해 볼 때, 각 인물들의 정치적 행로와 혈연과의 관계에 대한 연구가 부족하다는 것을 알 수 있다.
그래서 성화보 내 혈연 정보와 실록 내 투표 성향을 정리하여 각 인물의 혈연-정치활동의 관계를 시각화로써 확인해 볼 필요가 있다.
2. 2. 인물관계 네트워크 시각화 연구
최근 시각화를 활용하여 인물들의 관계를 네트워크 구조로 보는 연구가 증가하고 있으며, 전반적인 인물관계 구조를 파악하는 것 이외에도, 데이터 외적인 요인에 의해서 새로운 인물관계가 형성되는 경우를 연구하는 사례들이 나타나고 있다.
우선 퍼레어 그리고 슈나이더만(Perer and Shneiderman, 2008)에 따르면, 네트워크 시각화를 활용하여 미국의 상임위원들의 투표성향을 분석하고 그 결과를 정치학 전문가들에게 검증 받은 연구를 소개한다.
이 연구에서는 투표성향의 유사도에 따른 상임위원 간의 네트워크 시각화를 보여주고 있는데, 네트워크 구조의 대부분은 상임위원들의 소속에 영향을 받았기 때문에 같은 소속끼리 군집을 이루는 것을 볼 수 있으나, 일부 구조는(Figure 1 위에서 화살표로 표시된 부분) 서로 다른 소속을 가짐에도 불구하고 네트워크 관계가 형성되는 것을 볼 수 있다. 이는 서로 다른 정당임에도 불구하고 당시 발생한 정치적 사건 및 학연 등의 이유로 투표성향이 비슷하여 새로운 관계가 형성됨을 시각적으로 관찰할 수 있는 부분이다. 이러한 점을 미루어볼 때, 인물간의 관계를 네트워크 형태로 시각화한다면 기존의 이해관계에서 해석할 수 없었던 새로운 형태의 인물관계를 파악할 수 있다는 것을 확인할 수 있다. 하지만 퍼레어의 연구는 모든 관계 구조를 있는 그대로의 형태로 보여주기 때문에 인물 간의 관계가 복잡하게 얽혀있거나 인물의 수가 많아지면 관계의 속성을 쉽게 파악하지 못한다는 어려움이 있다.
다음으로 김학용 그리고 김학봉(Kim and Kim, 2014)의 연구에서는 조선왕조실록에 기록된 인물들의 권력 구조를 K-코어와 MCODE 알고리즘을 이용한 네트워크 시각화로써 나타내었다. Figure 1의 아래쪽을 보면, 조선의 왕을 중심노드로 하고 그의 주변인물을 하위 노드로 구성하는 방식으로써 네트워크를 구성함을 관찰할 수 있다. 이러한 방식은 중심인물을 기준으로 형성된 권력 구조의 동적 변화를 쉽게 관찰할 수 있도록 도와준다. 그러나 데이터의 양적인 측면에서 봤을 때, 여전히 많은 노드로 구성된 네트워크 모델에서는 하위 노드의 속성이 무엇인지 파악하기 어려운 문제점이 있다. 또한, 제시된 권력 구조가 어떠한 사건을 토대로 이루어졌는지 직관적으로 판단할 수 없다는 단점이 있다.
이처럼 사전 연구들의 단점을 미루어볼 때, 인물관계의 시각화는 사건의 유형에 따라서 인물들의 관계를 직관적으로 보여줄 수 있어야한다는 것을 알 수 있다. 또한, 일반적인 권력지형이 아닌 그 외 요소에 따라서 새로운 관계가 형성되는 것을 볼 수 있는 통찰을 제시하는 것이 중요함을 알 수 있다. 이에 상응할 수 있도록, 본 연구는 안건의 종류에 따라 중심인물을 기준으로 여러 인물들의 유사도를 효과적으로 비교할 수 있도록 하고, 분석 과정에서 기존에는 발견할 수 없었던 새로운 인물관계 구조를 볼 수 있는 시스템을 구축하고자 한다.
3. 사용자 요구사항 및 디자인 설계
본 연구는 하나의 인물과 서거정의 유사성이 높을 경우 해당인물은 권력집단에 소속될 것이고 유사성이 낮을 경우 비권력 집단일 것이라 가정하였고 이를 근거로 데이터를 정제하였다. 데이터 정제는 실록과 성화보를 활용한 인물관계 데이터를 활용하였다.
우선 실록에서 발췌한 데이터는 서거정이라는 권력 중심인물을 중심으로 해당인물의 인관부터 하관까지 이 인물이 참여한 역사적인 안건들과 이 안건에 참여한 인물들의 투표 결과가 기록되어있다. 실록에서 발췌한 기사의 시기는 1450년부터 1490년까지이며, 문종실록 3권 문종 즉위년 9월 7일 무신 3번째 기사부터 성종실록 242권 성종 21년 7월 11일 신유 3번째 기사까지 발췌했다. 각 인물들의 정치적 의사를 확인하기 위해 실록에서 ‘서거정’을 키워드로 검색하여 서거정과 관련된 모든 의견 논의 기사를 추출했다. 그리고 각 기사에 나온 논의의 주제와 의견을 낸 인물들의 개인 정보와 의견을 정리했다. 정밀한 분석을 위해 안건의 주제를 왕실, 풍속, 정치, 국무, 외교로 총 다섯 가지 사건으로 분류했으며, 찬반을 +와 -로 나누었다. 133건의 기사 내 의견을 표출한 인물은 총 1721명이지만, 유의미한 결과를 도출하기 위해 최소 10% 이상 논의에 참여한 인물을 뽑을 필요가 있었다. 그래서 총 98명의 인물을 선정하여 각 인물에 대한 정보로 성, 본관, 관직, 의견(찬/반), 그리고 성화보 내 고유 ID를 기재했다. 이후 집단을 개수를 설정하고 임의로 나눈 후 집단 내에서 유사도 계산을 통해 중심을 구하고, 집단을 재조정하는 과정을 반복하여 가장 적절한 군집을 형성하였다.
다음으로 혈연관계 데이터를 만들기 위해 성화보의 사료를 활용하여 계층 구조를 string 형태로 정제하였다. 성화보 내 string 정보는 가문과 세대, 아버지 정보, 자신의 정보를 포함하고 있다. 앞의 기호는 가문을 뜻하며, 뒤의 숫자는 본인의 세대와 본인 직계 조상의 정보, 그리고 자식의 수를 포함하고 있다. 예를 들어 a121은 a가문의 시조의 두 번째 자식(혹은 사위)의 첫 번째 자식(혹은 사위)가 된다. 이는 가문 내 가계 구조를 형성할 수 있기 때문에 추후 데이터 분석 시 개인을 연결하여 혈연관계를 파악하는 데 용이하다.
이상의 정제된 데이터들을 기반으로 본 연구는 서거정을 중심으로 한 인물관계 시각화를 만들었으며 시각화 작업에 요구되는 사항 및 시각화 디자인 방안을 정리하면 다음과 같다.
Task 1: 서거정을 기반으로 안건에 따른 인물들의 유사성을 구해야한다.앞서 언급했듯이 하나의 인물과 서거정의 유사성이 높을 경우 해당인물은 권력집단이고 유사성이 낮을 경우 비권력집단일 것이라 가정하였다. 따라서 서거정의 임관시절 안건데이터를 활용하여 안건에 따른 인물들의 투표성향 유사도를 Phi coefficient 공식을 이용하여 계산하고 이를 시각적으로 표현하고자 하였다.Design Objective: 서거정과의 유사도 값을 나타낼 수 있는 축을 생성하고 그 위에 인물들의 관계를 표현한다.
Task 2: 안건 데이터를 분류하고 전체 안건과 분류된 안건에 따라 인물들의 관계를 표현해야한다.본 연구에서 활용된 안건데이터는 93개이며 해당 안건은 각각 서로 다른 당시의 사건을 다루고 있다. 역사적인 해석에 의거 해당 안건들은 크게 다섯 가지로 분류될 수 있다. 여기에서 안건의 성격이 인물들의 관계 형성에 영향을 미칠 것이라는 가설을 설정하였으며 이를 기반으로 전체안건과 분류된 안건에 따른 인물관계를 시각적으로 표현하고자한다.Design Objective: 분류 기준에 대한 선택이 가능하여야하며 선택된 기준에 따라 인물들의 관계가 변화되도록 표현한다.
Task 3 : 혈연관계(촌수)에 따라 인물들을 표현해야한다.혈연은 인물들의 관계 형성에 큰 영향을 미치는 요인이다. 본 연구는 인물들의 관계에서 혈연에 의한 관계가 존재할 경우 투표성향에 큰 영향을 미칠 것이라는 가설을 설정하였으며 이를 기반으로 혈연과 비혈연에 따른 인물관계를 시각적으로 표현하고자한다.Design Objective: 인물관계를 표현할 때 혈연과 비혈연관계를 시각적으로 다르게 표현한다.
4. 데이터 시각화
4. 1. 버블힙 네트워크 시각화
본 연구는 이상에서 설명한 세 가지의 디자인 방안을 만족시키는 시각적 분석을 제공하기 위해 버블힙 네트워크 시각화(Bubble heap network visualization)를 사용하였다.
이만재 그리고 온병원(Lee and On, 2014), 김기남, 하효지, 온병원, 이만재 그리고 이경원(Kim, Ha, On, Lee and Lee, 2013)에 따르면, 버블힙 네트워크 시각화는 소셜 네트워크 시각화 기법을 기반으로 하며 기준이 되는 하나의 데이터 세트를 피벗 노드(Pivot node)라고 했을 때, 피벗 노드와 다른 모든 노드들의 관계를 시간에 따라 비교할 수 있다. 이 시각화는 유사도에 따라 여러 노드들 간의 관계를 한꺼번에 제시하는 소셜 네트워크와는 달리 사용자가 보고자 하는 하나의 데이터 세트를 기준으로 다른 데이터 세트 간의 관계를 비교할 수 있다는 점이 특징이다. 이는 곧 본 연구에서 다루는 서거정을 중심으로 한 인물들의 관계를 관찰하기에 적합하다.
버블힙 네트워크 시각화는 X축을 가지며, 노드로 표현된 인물들은 피벗 노드와의 유사도에 따라서 0%부터 100% 사이의 X축 상 위치에 표현된다. 예를 들어 서거정과 비슷한 유사도를 보이는 노드들은 100% 축에 가까운 방향으로 위치하고, 그 반대의 유사도를 보이는 노드들은 0% 축에 가까운 방향으로 위치하게 된다.
그런데 만약 중심인물을 기반으로 인물 간의 관계를 나타내는 도면이 X축에서만 그려졌다면 Figure 2의 왼쪽과 같이 서로 비슷한 유사도를 가지는 노드들은 중첩이 되는 문제점이 있다. 따라서 노드의 중첩 현상을 없애기 위해 본 연구에서는 Force-directed 알고리즘을 사용하여 노드들이 중첩되지 않고 Y축의 방향으로 퍼지도록 만들었다. 그 결과 Figure 2의 오른쪽처럼 서로 비슷한 유사도를 가지는 노드들이 중첩 없이 잘 위치되고 가지고 있는 값이 유사함에 따라서 군집이 되는 효과를 볼 수 있다.
4. 2. 시각화 시스템 인터페이스
Figure 3 (Up)은 본 연구 시스템의 인터페이스 및 노드의 색상 범례, 유사도 범례를 보여준다. 그림에 표시된 (a)부터 살펴보면, 피벗 노드에 해당하는 서거정 노드는 화면의 오른편 하단에 텍스트(중심인물: 서거정)와 X축 맨 오른편의 노드(가장 붉은색으로 표현된 ‘서거정’ 노드)로 표현이 된다. 그리고 오른편 상단에는 데이터가 수집된 기간 및 안건 정보를 표시하는 텍스트가 제공된다. 시각화를 보여주는 영역에서는 그림에서 표시된 (b)와 같이 맨 오른편의 위치한 서거정 노드를 중심으로 유사도가 높을수록 높은 %에 해당하는 축에 다른 노드들이 군집되도록 하고, 유사도가 낮을수록 낮은 %에 해당하는 축에 군집되도록 하였다. 유사도에 대한 정보는 (c)와 같이 시스템의 왼편 하단에 유사도 범례를 보여줌으로써 이해도를 높였다. 색상 범례는 그림의 (d)에서처럼 노드가 가지고 있는 혈연관계정보에 의하여 제작되었다. 이밖에도 (e)와 같이 안건을 선택하는 체크박스 부분, 총 인물 수, 혈연관계 노드 수, 비혈연관계 노드 수를 보여주는 부분이 있다. 시각화는 D3.js를 기반으로 개발되었으며 https://stat34.github.io/Relationship_in_Joseon/ 에서 확인 할 수 있다.
4. 3. Phi coefficient
활용된 안건 데이터는 인물들이 각각에 사건에 대해 표명한 의견이 기록되어 있으며 찬성(1), 반대(-1), 중립(0)으로 표현되어 있다. Phi coefficient는 두 변인 모두가 질적인 두 개의 유목으로 나누어진 경우에 적용되는 상관계수 공식으로써 본 연구의 데이터 성격에 맞는 유사도 공식이다. 인물 A와 B가 있다고 가정할 때 Phi coefficient 계산을 통한 유사도 공식은 다음과 같다.
본 연구에서는 찬성과 반대 의견을 기반으로 유사도를 계산하였다. 그리고 중립의견은 의사를 파악하기 어려우므로 포함시키지 않았다.
4. 4. 안건 데이터의 분류
본 연구에서 활용된 안건 데이터는 크게 국무, 왕실, 외교, 정치, 관습으로 분류되어 있으며 여기에 5가지 안건을 종합한 전체를 포함하여 6개의 분류 기준에 따라 인물들의 관계를 표현하고자하였다.
각 안건에 대한 버블힙 네트워크 시각화 결과물은 Figure 4에서 볼 수 있다.
4. 5. 혈연관계
본 연구에서는 인물들 사이에 혈연관계가 존재 할 경우 이는 투표에 큰 영향을 미치는 요인이 될 것이라는 가설을 설정하였다. 이를 위해 혈연관계가 존재하는 인물들과 비혈연관계의 인물들을 노드의 색상으로써 표현하였다. Figure 3 (Middle)의 색상 범례에서 보여주듯이 서거정과 혈연관계에 있는 인물들은 붉은 색으로 표현되며 촌수가 낮을수록 채도가 높은 붉은 색으로 표현되고 있다. 이와 반대로 서거정과 비혈연관계(촌수없음)일 경우, 회색의 색상으로 표현하였다.
5. 시각적 분석을 위한 케이스 스터디
여기에서는 본 연구에서 사용한 버블힙 네트워크 시각화의 분석 방법을 보여주고자 한다. 케이스 스터디는 총 네 가지의 질의로 구성되었으며, 시각화를 활용하여 질의에 대한 해답을 도출함으로써 본 연구 결과물에 대한 유용성을 설명하였다.
5. 1. 케이스 스터디 1: 안건의 분류 기준에 따라 인물들의 의견도 달라지는가?
Figure 4는 각 분류기준에 따른 인물관계를 나타내고 있으며 왼쪽 위부터 국무, 왕실, 외교, 정치, 관습, 전체에서의 인물관계를 나타내고 있다. Figure 4를 보면 정치와 관습에 대한 안건을 표현한 버블힙 네트워크 시각화의 노드 분포가 오른쪽으로 편중된 모습(둥근 사각형으로 표시해 놓은 부분)을 확인 할 수 있으며 두 안건을 제외한 다른 안건에 대해서는 인물들의 배치가 0%부터 100%까지 고루 분포하는 것을 볼 수 있다. 이는 곧 중심인물인 서거정과 유사한 의견을 표명한 사례들이 정치와 관습 분야에서는 많았다는 것을 의미한다. 해당 케이스 스터디에서는 분류된 안건에 따라 인물들의 의견도 변화하며, 정치와 관습의 경우 인물들이 표명한 의견들이 서거정과 유사하게 편중되는 것을 확인할 수 있었다.
5. 2. 케이스 스터디2: 한 인물의 투표성향이 분류된 안건 기준에 따라 달라지는가?
사학자들은 서거정의 임관 당시 서거정만큼 중요한 인물로 한명회라는 인물을 지목하였다. 이에 따라 본 연구에서는 한명회와 서거정의 관계를 개발된 시각화를 통해 확인하였으며 분류된 안건 기준에 따라 한명회의 투표성향도 변화하고 있는 것을 확인하였다. Figure 5는 각 분류된 안건마다 변화하는 한명회의 위치를 표시하고 있다.
Figure 5을 살펴보면 한명회는 국무, 정치에 대한 안건은 서거정과 70%이상의 높은 투표 유사성을 보이는 반면 왕실, 외교, 관습에서는 50%이하의 낮은 투표 유사성을 보인다는 것을 확인 할 수 있었다. 또한, 전체 안건의 경우 60%부터 70%까지의 투표성향 유사도를 보인다는 것을 확인 할 수 있었다. 이를 통해 한 인물의 투표성향은 분류된 안건에 따라 달라진다는 것을 확인 할 수 있으며 한명회의 경우, 왕실, 외교, 관습에 대해 서거정과 상이한 의견을 가졌고 국무, 정치의 경우 매우 유사한 의견을 가졌다는 것을 확인하였다.
5. 3. 케이스 스터디 3: 혈연관계가 투표성향 유사도에 영향을 미치는가?
인물관계를 연구하는 선행 연구들을 통해 두 인물사이에 혈연관계가 있을 경우 이는 투표성향에 큰 영향을 미친다는 것은 보편화된 사실이 되었다. 본 연구도 인물관계에서 혈연이 큰 영향을 미칠 것이라는 가설을 설정하였으며 시각화 분석을 통해 혈연에 따른 차이를 보고자 했다. 그 결과 Figure 3 (Down)의 시각화 결과물처럼 98명의 인물 중 81명은 서거정과 혈연관계가 있었으며 나머지 비혈연관계인 17명의 인물들도 0%부터 100%까지 고루 분포하고 있는 것을 확인하였다. 이를 통해 혈연관계가 투표성향 유사도에 영향을 절대적으로 미친다고 해석 할 수 없으며 서거정의 임관 당시 임관하고 있던 다른 인물들은 대부분 서거정과 혈연관계가 존재한다는 것을 확인 할 수 있었다. 그러나 서거정과 100% 유사한 인물 6명 중 1명을 제외한 인물들이 모두 서거정과 혈연관계가 존재한다는 것을 본다면, 혈연이 절대적이지는 않지만 어느 정도 영향이 있다는 것을 알 수 있다.
5. 4. 케이스 스터디 4: 1450년~1488년 사이 중앙에 진출한 인물들의 전반적인 관계는 어떠한가?
Figure 3 (Down)에서 혈연관계가 높은 붉은색의 노드들의 인물을 역사학적 사실에 입각하여 분석한 결과 서거정과 같은 시기에 중앙에서 높은 관직을 지낸 인물들이 대체로 혈연관계로 얽혀있다는 것을 알 수 있었다. 또한, 전체 98명의 인물 중 17명을 제외한 나머지 인물들이 모두 서거정과 크고 작은 혈연관계를 지니는 것을 확인할 수 있는데, 이는 조선 전기 양반가문 내에서 폐쇄적인 혼인 양상이 이뤄지고 있었음을 사학적인 측면에서 해석할 수 있었다.
6. 사용성 평가
6. 1. 자료수집 및 표본설정
본 장에서는 실험 집단을 공학 계열의 집단과 인문학 계열의 집단으로 나누어 시각화의 사용성을 비교분석하고 버블힙 네트워크 시각화의 장점과 단점 그리고 상호 보완할 점을 찾고자 하였다. 실험은 각각의 시각화 기능에 대한 문항으로 구성된 설문지 실험으로 척도는 리커트 5점 척도를 사용하였다. 자료의 수집기간은 2018년 6월 20일부터 6월 26일까지 7일간이었다. 실험 집단은 시각화 분야에 대한 지식을 지니고 현재 데이터 시각화 분야를 공부중인 공학 계열 집단(Computer Science)과 시각화에 대한 전문 지식은 없지만 역사에 대한 배경 지식을 지니고 역사학 분야를 공부중인 인문학 계열 집단(History)을 표본으로 설정하였으며 집단 별로 각 30명, 총 60명을 대상으로 실험을 하였다. 이 중에서도 데이터가 누락되거나 설문 문항에 성실히 응답하지 않은 설문자료를 제외하고 집단 별로 각 22부, 총 44부의 설문 데이터를 최종 자료로 사용하였다.
6. 2. 신뢰도 분석
측정도구를 통해 얻은 데이터를 분석하기에 앞서 측정도구의 신뢰성(Reliability)을 검증하기 위해 신뢰도 분석(Reliability Analysis)을 실시하였다. 신뢰도 분석은 문항 간 내적 일관성(Internal Consistency)을 측정하는 방법으로 크론바하 알파(Cronbach's α)계수를 사용하여 이를 파악한다. 최종 측정 데이터를 활용하여 신뢰도 분석을 실시한 결과는 Table 1과 같다. 크론바하 알파 계수는 0에서 1의 값을 가지며 1에 가까울수록 문항의 신뢰도가 높다고 할 수 있다. 일반적으로 0.6이상의 값을 가지면 신뢰성이 있다고 하며 개별항목들을 하나의 척도로 종합하여 분석하는 것이 특징이라고 할 수 있다. Table 1과 같이 신뢰도 분석결과 각 항목들의 크론바하 알파 계수 값은 최솟값 0.796(인문학계열 13번), 최댓값 0.856(공학계열 7번)이었다. 또한, 모든 항목에 대한 크론바하 알파 값이 0.6이상이므로 전체 문항 중, 음의 영향을 미치는 항목은 없고 모든 항목에 대한 내적 일관성이 높아 신뢰도가 높다고 할 수 있다.
6. 3. 자료수집 및 표본설정
두 집단 사이의 유의한 차이를 보기 위한 평균 비교로는 독립표본 T검정(Independence T-test)을 실시하였는데 독립표본 T검정이란 두 집단이 각각 N(μ1,σ21)과 N(μ2, σ21)인 정규분포를 따르고 서로 독립이라는 가정 하에 두 집단 간 모평균에 차이가 있는지를 검정한다. 본 연구에서는 데이터의 정제 과정을 통해 최종적으로 각 22부, 총 44부의 설문 데이터를 사용하였으며 실험에 참여한 두 집단이 독립임을 가정하고 평균 비교를 시행하였다. 두 그래프에 대해 집단을 나누고 실험을 한 결과를 평균비교로 분석한 결과는 Table 2와 같다.
공학계열(C) 사용자 집단과 인문학계열(H) 사용자 집단에 대해 평균비교 분석(Independence T-test)을 실시한 결과, 문항3(중심인물과 주변 인물간의 촌수에 따른 관계가 시각화를 통해 명확히 드러난다.)과 문항10(선택에 따라 변화된 분석 결과에 만족한다.), 문항12(중심인물과 다른 인물들의 투표성향과 혈연관계를 파악하기에 본 시각화가 용이하다.), 문항13(데이터 분석 결과를 탐험하기에 본 시각화가 용이하다.)에서 유의한 차이가 있다는 결과가 나왔다. Table 3은 대립가설을 채택한 문항에 대한 세부 사항이다.
6. 4. 통계분석 결과 해석
본 장에서는 시각화에 대한 비전문가 집단으로 인문학계열의 집단과 시각화 전문가 집단으로 공학계열의 집단에 따라 버블힙 네트워크 시각화에 대한 평가를 비교 분석하였다. 기술 통계 값을 통해 다른 두 집단 모두 시각화에 대한 평가 값이 3이상으로 높은 것을 확인하였으며 공학계열의 집단보다 인문학계열의 집단이 해당 시각화의 사용성을 높게 평가하는 것을 확인하였다. 또한, 통계적으로 유의한 차이가 발생하는 문항을 찾기 위해 독립표본 T검정을 실시한 결과 문항3(중심인물과 주변 인물간의 촌수에 따른 관계가 시각화를 통해 명확히 드러난다.)와 문항10(선택에 따라 변화된 분석 결과에 만족한다.), 문항12(중심인물과 다른 인물들의 투표성향과 혈연관계를 파악하기에 본 시각화가 용이하다.), 문항13(데이터 분석 결과를 탐험하기에 본 시각화가 용이하다.)에서 유의한 차이가 있다는 결과를 도출하였다.
이를 통해, 버블업 시각화는 공학계열의 집단보다 인문학 계열의 집단에서 시각화에 대한 사용성이 높은 것을 확인 할 수 있으며, 특히 인문학 계열의 집단은 시각화의 항목 중 촌수 관계에 따라 인물들의 유사도 성향(문항3), 필터 기능을 통한 데이터 선택 결과의 사용자 만족(문항10), 투표 성향과 혈연관계를 분석하기 위한 시각화의 용이성(문항12), 데이터 분석에 있어 전반적인 시각화의 용이성(문항13)을 공학계열의 집단보다 높게 평가한다는 것을 확인 할 수 있었다. 따라서 해당 시각화는 전반적으로 사용성이 높고, 특히 시각화를 전공하지 않은 비전문가 집단이 사용하기에도 사용성이 높다고 할 수 있다.
7. 결론
본 연구는 여러 분야의 학자들과 협업을 통해, <조선왕조실록> 및 <안동권씨성화보>에서 추출된 역사적인 사실을 바탕으로 인물들의 관계를 시각화로 나타내었다. 제작을 위해 서거정의 관직생활 시기인 1450년부터 1490년까지, 서거정과 관련된 찬성, 반대 의견을 실록의 기사로부터 추출하여 정제하였다. 그리고 정제된 데이터를 사용하여 인물들의 관계를 버블힙 네트워크로 표현하였다.
버블힙 네트워크는 중심이 되는 인물을 기준으로 다른 인물들의 유사도 관계를 비교할 수 있는 시각화이다. 때문에 기존에 알려진 소셜 네트워크 시각화가 여러 인물들 간의 관계를 한꺼번에 제시하는 것과는 달리 사용자가 보고자 하는 인물을 기준으로 다른 인물들의 유사도 거리를 쉽게 비교할 수 있는 장점이 있다.
본 연구에서는 버블힙 네트워크 시각화를 표현할 때 유사도의 값을 X축 상에 반영하여 인물들을 위치시키는데, X축만을 사용하여 시각화를 했을 때는 서로 비슷하거나 동일한 유사도 값을 가지는 인물들이 중첩이 된다는 문제점이 있었다.
그러나 Y축 상의 위아래 방향으로 유사도 퍼센트의 범례를 보여주는 백그라운드를 디자인하고, Force-directed 알고리즘을 적용하여 서로 비슷한 유사도 값을 가지는 인물들이 중첩되지 않도록 배치시킴으로써 문제점을 해결하였다. 그 결과 서로 비슷한 유사도를 가지는 인물들이 조밀하게 군집이 되는 효과를 얻게 되어 중심인물과 다른 인물 간의 유사도를 보다 직관적으로 관찰할 수 있는 장점을 얻게 되었다.
또한, 서거정과 가까운 촌수이거나 혈연관계가 깊은 인물일수록 채도가 높은 붉은색으로 노드를 컬러링하여 혈연관계라는 외적요인이 투표성향에 어떤 영향을 미치는지를 해석할 수 있도록 하였다.
본 연구의 시각화 결과를 통해 도출된 분석적 의미를 정리하면 다음과 같다. 첫 번째로, 전근대 시기 역사적인 사건은 크게 국무, 왕실, 외교, 정치, 관습으로 분류될 수 있으며 안건의 성격에 따라서 서거정과 다른 인물들의 의견 유사도가 달라짐을 확인하였다. 정치와 관습의 경우 안건에 대한 의견이 60% 이상으로 서거정과 유사하게 편중되고 다른 분류에서는 인물들의 의견이 0%부터 100%까지 고루 분포하는 것을 확인하였다. 이를 통해 안건의 성격은 인물들의 투표 성향에 영향을 미치는 요인이라고 해석 될 수 있다. 또한, 각각의 인물들은 안건에 성격에 따라 투표 성향이 달라지며 이는 각 인물들이 다른 인물들과 다르게 생각하는 안건을 도출하는데 사용될 수 있다. 두 번째로, 혈연관계는 임관의 기준으로 중요한 요인이나 투표 성향 유사도에 영향을 미치는 요인으로 해석 될 수는 없다는 것을 알 수 있었다. 그 이유는 혈연관계가 존재하는 인물과 비 혈연관계의 인물들 모두가 전체 유사도 %에 걸쳐서 고루 분포하는 것을 볼 수 있었기 때문이다.
본 연구에서는 안건에 따라 서거정과 다른 인물들이 어떠한 투표 유사도를 보이는지, 그리고 혈연관계가 투표유사도에 영향을 미치는 지를 분석하였다. 그러나 추후 다음과 같은 연구를 확장해야할 필요가 있다. 우선, 조선 전기 대표적인 인물은 본 연구의 중심이 된 서거정 외에, 한명회, 신숙주 등 다양한 인물들이 존재한다. 이들을 중심으로 혈연과 투표성향을 확인해 그 결과를 비교한다면, 혈연과 투표성향과의 관계에 대해 다각적으로 접근할 수 있을 것이다. 또한, 코호트적인 연구방법으로 서거정의 임관 당시만을 연구하였다는 점을 감안하였을 때 본 연구의 결과는 일반화 될 수 없다. 따라서 본 연구는 향후 분석의 시기를 넓혀 나가는 연구를 진행 할 예정이다.
Acknowledgments
This work was supported by the Ministry of Education of the Republic of Korea and the National Research Foundation of Korea (NRF-2015S1A5B6037107).
Notes
Copyright : This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/), which permits unrestricted educational and non-commercial use, provided the original work is properly cited.
References
- Han, W. G. (1988). 조선전기 사관과 실록편찬에 관한 연구 [A study of the present situation and problems about Sakwan and Sillok Compilation in the early Choson-Dynasty]. Jindanhakbo, 66.
- Han, W. Y. (1985). 조선 초기 사회계층 연구에 대한 재론 [Reconsidering the Study of Social Class in early Joseon dynasty]. The Study of Korean History, 12.
- Hiroshi, M. (1996).『안동권씨성화보』를 통해서 본 한국 족보의 구조적 특성 [The structural characters of Korean genealogy: A case study on Andong Kwon-ssi Sunghwabo]. Journal of Eastern studies, 62.
- Kang, M. G. (2010). 조선 관료문인의 직무 스트레스와 반응의 문학적 표출양상 [A study on the literary expression of response and work-related stress of a government official in the Joseon Dynasty -In case of Seo geojeong(徐居正)-]. Study for Korean Classical Chinese Education, 34, 245-293.
- Kim, G. N., Ha, H. J., On, B. W., Lee, K., & Lee, M. (2013). Bubble heap graphs. In Proceedings of IEEE Information Visualization Conference (InfoVis' 13). Atlanta, USA.
- Kim, H. Y., & Kim, H. B. (2014). 조선왕조실록 네트워크의 동적 변화 분석 [Analysis of Network Dynamics from Annals of the Chosun Dynasty]. Journal of the korea contents association, 14(9), 529-537. [https://doi.org/10.5392/JKCA.2014.14.09.529]
- Lee, M. J., & On, B. W. (2014). 버블 힙: 2 개의 시계열데이터 세트를 사용하는 다차원 시각화 기법 [Bubble Heap: Visualization technique using two different time series data set]. In Proceedings of HCI Korea 2014, 1111-1114.
- Lee, S. K., & Park, H. J. (2008). Marrige, Social Status, and Family Succession on Medieval Korea(Thirteenth-Fifteenth Centuries). Journal of Family History, 33(2). [https://doi.org/10.1177/0363199007313617]
- Lee, S. K. (2013). The Impact of Family Background on Bureaucratic Reproduction in the thirteenth -to- fifteenth century Korea: A case study on the Kwon-ssi Sunghwabo. Journal of Eastern studies 81.
- Lee, S. K., & Lee, W. J. (2017). Strategizing Marriage: A Network Analysis of Marriage Networks in the Genalogy of Andong Gwon-ssi. Social Science History, 2017.
- Lee, S. K., & Park, J. H. (2019). Qunality Over Quantity: A Lineage-Survival Strategy of Elite Families in Pre-Modern Korea. Social Science History, 2019.
- Lee, S. M. (1994). 조선왕조실록과 한국사 연구 [Annals of the Joseon Dynasty and the study of Korean History]. Minjokmunhwa 17.
- Park, Y. W. (2005). 安東權氏의 사례를 통해 본 高麗社會의 一斷面 : '成化譜'를 참고로 하여 [A Phase of Koryo Society as Reflected in Andong Kwon Clan;with reference to Chenghua Era Genealogy 成化譜”]. The Korean History Education Review, 94, 35-86.
- Perer, A., & Shneiderman, B. (2008). Integrating statistics and visualization: case studies of gaining clarity during exploratory data analysis. In Proceedings of the SIGCHI conference on Human Factors in computing systems, 265-274. [https://doi.org/10.1145/1357054.1357101]
- Raphael, R. (2006). Geschichtswissenschaft im Zeitalter der Extreme. German: beck reighe.
- Wagner, E. (2007). 조선왕조사회의 성취와 귀속 [Achievement and ascription in Joseon Dynasty]. Seoul: Illjogak.