10

효과적인 질적자료의 시각화

질적자료의 정의 및 시각화

자료는 그 표현되는 형태에 따라서 크게 질적자료와 양적 자료로 나뉩니다. 질적자료(qualitative data, 범주형자료, categorical data)는 자료의 한 형태로써 사람, 장소, 물건, 사건, 활동 또는 개념에 대하여 비 수치형으로 기술한 자료 값을 지칭합니다. 그에 대비하는 양적 자료(quantitative data)는 자료의 크기나 양을 숫자로 표현할 수 있으며, 이는 다시 정수값으로 표현되는 이산형 자료(discrete data)와 연속적인 양으로 표현되는 연속형 자료(continuous data)로 나눠집니다. 예를 들어서 1명 또는 5명 등과 같이 정수로 표현되는 가족 수는 이산형 자료가 될 수 있으며, 175cm 또는 175.55cm 등과 같이 연속적인 값으로 표현될 수는 있는 학생들의 키 측정치는 연속형 자료가 될 수 있습니다.

양적 자료를 그래프로 표현하는 것은 많은 곳에서 볼 수 있습니다. 그러나 질적자료를 양적 자료와 같이 그래프로 표현한 것에는 많은 어려움이 있습니다. 숫자로 그 값을 표현하는 양적 자료와 달리 질적자료는 그에 해당하는 질문과 답을 통일된 형태로 양적 개념 없이 직관적으로 표현하기란 현실적으로 많은 제약을 마주하게 됩니다. 그런데도 우리들은 질적자료의 시각화를 원합니다. 왜냐하면 우리는 보는 것을 참으로 좋아하고 시각이라는 감각을 이용해서 많은 정보를 수용하고 이를 우리 삶에 적용하는 것을 중요시하기 때문입니다.

질적자료의 시각화 방법

우선 간단하게 질적자료를 시각화하는 방법을 얘기해보면 다음과 같습니다.

첫째, 사진이나 그래프 등을 이용해서 질적자료의 탐구 결과를 보여주는 것입니다.

둘째, 질적자료에서 찾은 중요한 주제나 결과에 초점이 맞춰진 시각 자료를 만드는 것입니다.

셋째, 이야기하듯이 질적자료를 시각적으로 보여줄 수 있습니다.

넷째, 양적 자료에서 사용되는 파이 차트나 막대그래프 등을 이용해서 질적자료를 표현해 보는 것입니다. 물론 이것은 매우 까다롭거나 부적절한 방법이 될 수도 있기에 주의를 필요로 하게 됩니다.

좀 더 구체적인 질적자료의 시각화 방법을 알아보기 위해서 Depict data studio의 Ann K. Emery가 작성한 ‘How to Visualize Qualitative Data’와 Auraria Library의 ‘Data Visualization’을 참고해서 살펴보면 다음과 같습니다.

첫째, ‘Word Clouds’는 어떤 한 주제나 질문에 관련된 단어들로 구성된 이미지를 생성해서 사용하는 방법입니다. 각각의 단어들은 주제나 답변에 관련된 정도나 중요성에 따라서 그 글자의 굵기나 크기나 색깔을 달리해서 표시합니다. 예를 들어서 자원봉사와 관련된 단어들의 질적자료를 Word Clouds 방식으로 표현할 때 ‘사회’나 ‘보람’이라는 단어가 중요하게 관련된다고 하고 ‘돈’이라는 단어는 덜 중요하게 관련된다고 합시다. 이 방법으로 ‘사회’, ‘보람’, ‘돈’을 표시할 때 한 이미지 안에서 ‘사회’와 ‘보람’은 매우 굵은 글씨체로 글자 크기 50으로 표현되는 반면 ‘돈’은 가는 글씨체로 글자 크기 10 정도로 표현되는 것입니다. 독자나 청중들은 이렇게 중요성 정도에 따라서 시각화된 이미지를 보고 자원봉사라는 주제와 ‘사회’나 ‘보람’의 관련성을 ‘돈’과의 관련성보다 더욱더 중요하게 인지하게 될 것입니다. 또한 Word Clouds 방법은 어떤 사건이나 과정의 전후를 비교할 때 유용할 뿐만 아니라 개방형 질문에 대한 답변을 시각화할 때도 유용합니다. 개방형 질문들은 폐쇄형 질문들에 비해서 답변의 길이나 다양성에 있어서 더 많은 정보가 있기에 이를 한눈에 보기에 어렵기 때문에 Word Clouds는 이를 해결하기 위해서 눈여겨볼 방법입니다. 더 나아가 전후 시간 비교 외에도 일정 시간 간격으로 조사된 시계열(time series) 자료를 해석하고 이해하는 데도 Word Clouds 방법은 사용될 수 있습니다.

둘째로, 그래픽 타임라인(그래픽 시간표)도 질적자료를 표현하기 좋은 또 다른 방법입니다. 그래픽 타임라인은 연대기적 순서로 시간의 일차원적인 진행을 따라서 연속적으로 일어난 사건들이나 결과들을 표시하기에 좋습니다. 이 방법을 통해서 독자나 청자들은 시간의 순서에 따라 있었던 중요한 일들을 손쉽게 확인할 수 있습니다. 이러한 방법은 역사를 기록하고 보여주거나 프로젝트의 일정에 따라서 진행되었거나 진행하고 있거나 진행될 단계들을 보여줄 때 매우 유용합니다. 갠트 차트(Gantt chart)도 이와 같은 방식으로 이해할 수 있습니다.

 

자료를 시각화하면서 해야할 것과 하지 말아야할 것

자료를 시각화 하는 데 있어서 일반적인 조언으로서 해야 할 것과 하지 말아야할 것에 관해서 알아보겠습니다.

우선 꼭 해야 할 것을 살펴보겠습니다.

첫째, 그래프 축과 그 항목의 생략이 있어서는 안됩니다. 그리고 이에 대한 일관성이 있어야 합니다. 예를 들어서 A의 값이 55 %이고 B의 값이 60 %라고 한다면, 그 차이는 5%  입니다. 흔한 실수 또는 잘못된 의도를 갖고 왜곡된 결과를 보여주는 것으로 그래프 축으로 0-100%의 전체 축을 사용하기보다는 40-70%의 축 일부 구간에 표시된 A의 값과 B의 값을 사용함으로써 청자나 독자들이 그 차이를 시각적으로 더 크게 느끼하는 경우가 있습니다. 광고업에 종사하는 경우에는 강조를 하고 싶은 의도로 일부러 그래프 축의 일부 구간만 확대해서 사용하기도 하지만, 뉴스라든지 과학적 사실을 전달할 때는 이러한 일부만 확대해석하게 하는 방법을 회피해서 왜곡된 결과와 그 해석이 청자나 독자들에게 전달되지 않도록 주의를 기울여야 합니다.

둘째, 파이 차트를 사용할 때 각 파트들의 총합이100 %가 되어야 합니다. 일부만 사용해서 진실을 왜곡해서 표현해서는 안됩니다.

셋째, 시각화 결과물은 가능한한 단순하게 표현되어야 하며 중요한 포인트들이 잘 드러나게 해야 합니다.

넷째, 다루고 있는 분야의 전문가들 뿐만 아니라 주변의 동료나 가족들 등에게 자신이 시각화하고 있는 결과물들을 보여주면서 여러 의견들을 듣고 진행 방향을 수정하거나 그 결과물을 보완하거나 강화해야 합니다.

다섯째, 색맹이 있는 독자나 청자들도 무리 없이 보고 이해할 수 있게 만들어야 합니다. 전세계적으로 남성12 명 중 한 명, 여성 200명 중 한 명에게 색맹증상이 있다고 합니다. 그러므로 색맹 있는 사람들을 고려해서 시각화 하는 것은 중요합니다.  참고로 colorbrewer2.org 웹사이트는 옵션 선택을 통해서 색맹과 종이로 출력하기에 좋은 색조합을 추천해주기에 시각화 자료를 만들 때 알맞은 색상을 고르기에 좋습니다. 추가적으로 청각적 표현이나 촉각적 표현을 통해서 시각장애인들의 정보접근의 장벽을 최대한 제거하기 위한 방법들을 고려해야 합니다. 이를 위해서 신희숙, 임정묵, 박준석의 ‘정보 시각화 기술과 시가장애인을 위한 정보 표현 기술’과 Webactually에서 제공하는 A List Apart의 ‘색각 결핍 디자이너의 삶’을 참고해 보는 것도 좋을 것 같습니다.

다음으로 자료의 효과적인 시각화를 할 때 해서는 안되는 것을 살펴 보겠습니다.

첫째, 3D나 애니메이션 기능을 꼭 필요한 때를 제외하고는 사용하지 않는 것입니다. 입체적인 그래프는 원근감에 따라서 왜곡된 사실 전달이 되게 하는 실수를 저지르게 하거나 많은 동적 효과는 오히려 청자나 독자의 집중력을 떨어뜨리는 결과를 낳게 됩니다.

둘째, 일반적으로 한 이미지에서 6개보다 많은 색상을 사용하지 않도록 합니다. 너무 많은 색상 정보는 중요한 핵심 정보를 파악하는 데 방해요소가 될 수 있습니다.

셋째, 하나의 프로젝트에서 자료들을 여러 그래프로 바꿀 때, 테마나 그 양식이 일관되지 않고 어지럽게 해서는 안됩니다. 디자인의 통일성이 있어야 한다는 것입니다.

넷째, 한 이미지 안에 너무 많은 정보를 담아서 보여 줄려고 하다 보면 반드시 전해야 할 메시지는 전달 안되고 청자나 독자의 이해력과 집중력을 활성화하는 데 방해만 되게 됩니다. 다시 한 번 앞에서 언급했던 단순화 과정의 중요성을 강조합니다.

맺음말

지금까지 질적자료가 무엇이고 어떻게 질적자료를 시각화해야 하는 지에 관해서 알아보았습니다. 자료의 시각화를 위해서 사용해 볼 만한 그래픽 디자인 프로그램으로 캔바 (Canva)가 있습니다. Enago에서 소개한 ‘시선을 끄는 연구발표를 만들 수 있는 디자인 프로그램, 캔바 (Canva)’를 참고로 읽어 보면 좋을 것 같습니다.

질적자료를 시각화해서 한눈에 알아보기 쉽게 만든다는 것은 쉽지 않습니다. 그러나 잘 시각화 된 질적자료는 마치 서울 지하철을 처음 타본 사람도 서울 지하철 노선도를 보자 어느 역에서 환승을 하고 몇 정거장을 가면 목적지에 도달할 수 있을 지를 알게 되는 것처럼 매우 유용하게 사용될 수 있습니다. 그러므로 본인의 발표나 논문 등에서 일목요연하게 핵심을 독자나 청자에게 잘 전달할 수 있기 위해서 연구자들은 자료의 시각화에 심혈을 기울일 필요가 있음을 알고 평소에 준비를 많이 하기를 바랍니다.

X

회원가입 후 더보기

무료로 보실 수 있는 기사 횟수에 제한이 있습니다. 구독하시면 논문작성
및 저널 출판에 관한 다양한 자료를 횟수제한 없이 이용하실수 있습니다.

  • 500개 이상의 출판뉴스
  • 50개 이상 웹세미나
  • 10개 이상 전문가 진행 팟캐스트
  • 10개 이상 이북
  • 10개 이상 체크리스트
  • 50개 이상 인포그래픽
여러분의 의견을 나눠주세요

AI가 연구 출판을 어떻게 가속화할 수 있다고 생각하십니까?