Archives of Design Research
[ Article ]
Archives of Design Research - Vol. 37, No. 4, pp.181-197
ISSN: 1226-8046 (Print) 2288-2987 (Online)
Print publication date 31 Aug 2024
Received 15 May 2024 Revised 02 Jul 2024 Accepted 25 Jul 2024
DOI: https://doi.org/10.15187/adr.2024.08.37.4.181

생성형 인공지능 챗봇(Generative AI Chatbot)의 텍스트 움직임이 안구운동에 미치는 영향 연구

Hwidong Park박휘동Younjoon Lee이연준
Visual Communication Design, Student, Hongik University, Seoul, Korea 홍익대학교 디자인학부 시각디자인, 학생, 서울, 대한민국 Visual Communication Design, Professor, Hongik University, Seoul, Korea 홍익대학교 디자인학부 시각디자인, 교수, 서울, 대한민국
The Effect of Text Movement on Eye Movements in Generative AI Chatbots

Correspondence to: Younjoon Lee younjoonlee@hongik.ac.kr

초록

연구배경 텍스트 생성 인공지능 챗봇은 새로운 정보탐색 서비스로 주목받고 있으며, 텍스트 생성 인공지능 챗봇과 의사소통을 통한 상호작용에 따라 대화 참여자의 정보 수용 방식이 확대되었다. 이에 본 연구는 텍스트 생성 인공지능 챗봇과 대화 참여자의 정보성 대화에서 비언어적 요소인 텍스트 움직임이 미치는 영향을 아이트래킹을 통해 살펴보고자 한다.

연구방법 움직임의 이론적 고찰을 통해 주요 속성을 도출했으며, 이를 텍스트 생성 인공지능 챗봇의 대화형 인터페이스에 적용해 4가지 유형을 분류했다. 챗봇이 생성한 대화 텍스트를 36명의 실험 참가자가 읽는 동안 아이트래킹을 통해 안구운동 데이터를 수집했다. 분석에서 반복측정 분산분석(Repeated measures ANOVA)과 Bonferroni 사후분석, 독립표본 t-test를 통해 차이점을 확인했다.

연구결과 하단에서 발생하는 텍스트 움직임 요소의 방향과 초점은 첫 고정 시간, 전체 고정 횟수, 도약진폭 등에서 상대적으로 높았다. 이는 ChatGPT와 Bing AI의 연속된 대화에서 나타나며 높은 인지 활동에 영향을 미쳤다. 또한 대화 텍스트의 생성 속도 증가는 텍스트 움직임 유형 간의 차이에 영향을 주었다. 따라서 과도한 인지 활동을 낮추기 위해서는 움직임 요소가 화면 상단에서 조합되는 것이 필요하다.

결론 텍스트 생성 인공지능 챗봇과 효과적인 시각적 의사소통을 위해서는 참여자의 안구운동과 인지 활동에 영향을 미치는 텍스트 움직임을 고려하여, 정보 수용의 효율성을 높이고 인지 부담을 최소화하는 방향으로 설계할 필요가 있다.

Abstract

Background Text generating artificial intelligence(AI) chatbots are gaining attention as a new information exploration service. The way participants receive information has expanded through interaction and communication with these chatbots. This study aims to investigate the influence of the nonverbal element of text movement on informative conversations between text generating AI chatbots and conversation participants through eye-tracking.

Methods The key attributes were derived through a theoretical review of movement, and these were applied to the conversational interface of the text-generating AI chatbot, classifying them into four types. Eye movement data was collected through eye-tracking while 36 experimental participants read the conversational text generated by the chatbot. In the analysis, differences were identified through repeated measures analysis of variance (ANOVA), Bonferroni post-hoc analysis, and independent samples t-test.

Results The direction and focus, the elements of text movement occurring from the bottom, were relatively high in terms first fixation duration, number of whole fixations, and saccade amplitude. This appeared in consecutive conversations with ChatGPT and Bing AI, affecting higher cognitive activities. Additionally, an increase in generating speed of conversational text influenced the differences between text movement types. Therefore, the movement elements must be combined on the top of the screen to reduce excessive cognitive activities.

Conclusions In order to achieve effective visual communication with the use of text-generating AI chatbots, design should consider how the text movement impacts the user’s eye movement and cognition, which aims to enhance the comprehension of information while also limiting cognitive overload.

Keywords:

Text Generation AI Chatbot, Conversational User Interface, Text Movement, Eye Tracking

키워드:

텍스트 생성 인공지능 챗봇, 대화형 인터페이스, 텍스트 움직임, 아이트래킹

1. 서론

1.1. 연구 배경 및 목적

챗봇(Chatbot)은 고도화된 기술을 통해 생성형 인공지능(Generative Artificial Intelligence) 챗봇으로 진화하며 대중에게 주목받고 있다. 양지훈과 윤상혁(2023)에 따르면 생성형 인공지능 챗봇 서비스의 핵심은 대화 참여자의 질문을 이해ㆍ분석하며, 방대한 데이터에서 필요한 정보를 찾아 답변하는 것이라고 했다. 또한 생성형 인공지능 챗봇은 고도화된 알고리즘을 통해 정보를 전달하는 핵심 기제로 상호작용 미디어로 분류된다(Lee, 2020). 그중 문자 기반의 생성형 인공지능 챗봇은 ‘텍스트 생성 인공지능 챗봇(Text Generation AI Chatbot)’으로 구분되며 서비스 참여자에게 문자를 통해 지식과 정보를 제공한다(Jho, 2023). 대표적인 서비스로 Open AI의 챗GPT(ChatGPT), 마이크로소프트(Microsoft)의 빙(Bing AI), 뤼튼테크놀로지스의 뤼튼(Wrtn) 등이 있다.

편지윤 등(2019)은 매체 기술이 발전됨에 따라서 의사소통이 역동적으로 변화되는 것은 수용자 역할의 변화라고 했다. 이는 텍스트 생성 인공지능 챗봇이 상호작용 미디어로서 텍스트를 구성하는 디자인 및 기술적 양식의 복합성으로 인한 의사소통의 중요성을 의미한다. 새로운 기술에 기반한 의사소통 환경에서 텍스트는 생산과 수용을 통해 결과적으로 여러 가지 양식을 형성하는 복합양식 텍스트이며, 텍스트를 생산하는 모든 의사소통은 미디어와 인간의 상호작용 결과이다(Kong, 2013). 즉, 복합양식 텍스트는 진보된 기술에 따라 시각적 영역이 확대되는 것을 시사하며 새로운 미디어에 의해 보고 읽는 방법의 확장을 의미한다(Pyun et al., 2018).

따라서 복합양식 텍스트의 주요 속성인 움직임(Movement)을 바탕으로 사용자가 텍스트 생성 인공지능 챗봇의 대화 텍스트를 수용하는 방식을 파악하는 것이 필요하다. 이에 본 연구는 텍스트 생성 인공지능 챗봇이 생산하는 움직임의 이론적 고찰을 통해 챗봇의 대화형 인터페이스(CUI)를 분석하고, 안구운동에 미치는 영향을 파악하고자 한다. 이를 통해 효과적인 텍스트 생성 인공지능 챗봇의 시각적 의사소통을 제언하고자 한다.

1.2. 연구 범위 및 방법

텍스트 생성 인공지능 챗봇과 대화 목적 중 지식 또는 정보를 얻고자 하는 대화 텍스트 성격을 ‘설명적 텍스트’로 제한하고자 한다. 설명적 텍스트란, 논리성을 바탕으로 텍스트 생산자가 수용자에게 어떤 정보를 전달하여 이해시키고자 하거나, 수용자의 의견이나 태도를 텍스트 생산자의 의도대로 설득하는 목적을 지닌다(Park, 2008).

본 연구는 문헌 고찰을 통해 챗봇의 CUI 특성과 움직임 요소를 분석했다. 이후 사례분석에서 도출된 움직임 요소를 통해 텍스트 생성 인공지능 챗봇의 텍스트 움직임 유형을 구분하여 총 7가지의 실험물을 제작했다. 실험은 20세 이상부터 39세 이하의 실험 참가자 36명을 두 그룹으로 나누어 아이트래킹을 실시했다. 결과는 반복측정 분산분석(Repeated measures ANOVA), Bonferroni 사후검정, 독립표본 t검정을 사용해 분석했다.


2. 이론적 배경

2.1. 텍스트 생성 인공지능 챗봇의 텍스트 움직임

챗봇 시스템은 다른 인터페이스들과 달리 ‘대화의 디자인’이라는 핵심 서비스 가치로 사람들에게 전달될 필요가 있다(Cho & Yun, 2019). 이에 챗봇은 알고리즘과의 결합을 통해 기술적으로 고도화를 이루었으며, 자연어 처리 기술 기반의 기계학습과 딥러닝 기술이 적용되면서 챗봇이 생성하는 결과는 정교화되고 있다(Cho & Yun, 2019; Min, 2020). 따라서 텍스트 생성 인공지능 챗봇은 문자를 기반으로 사용자의 요구에 따라 능동적인 답변을 생성하는 인공지능 기술을 의미한다(Yang & Yun, 2023).

복합양식 텍스트의 주요 속성인 움직임은 키네틱 타이포그래피와 모션그래픽의 연구에서 구체적으로 분석되어왔다. 키네틱 타이포그래피는 움직임을 뜻하는 키네틱(Kinetic)과 타이포그래피를 합친 개념으로 객관적인 정보전달뿐만 아니라 움직임을 통해 감정적 전달이 가능한 복합적인 의사소통 방식을 의미한다(Kim, 2009). 또한 모션그래픽은 움직임 자체의 표현 양식으로 비언어적인 커뮤니케이션 방법이다(Oh, 2012). 정보에 움직임이 더해지면 주목성을 높이거나 흥미가 유발되는 특성이 있어 텍스트를 인식하는 시각성 연구가 중요하다. 따라서 정보교류와 표현 양식의 관점으로 분석한 공통적인 움직임의 ‘시간과 공간’ 속성으로 텍스트 생성 인공지능 챗봇의 CUI에 나타나는 텍스트 움직임 분석이 필요하다. 이에 본 연구는 대화 참여자가 텍스트 생성 인공지능 챗봇과 상호작용하는 데 있어 실시간으로 변화되는 챗봇의 CUI 특징과 함께 움직이는 정보들의 역할을 파악하고자 했다.

위의 Table 1은 키네틱 타이포그래피와 모션그래픽 연구에서 시간과 공간 속성을 재구성한 표이다. 엘 리지츠키(El Lissitzky)의 “움직임(movement)=공간(space)×시간(time)” 개념(Hwang, 2003, p14)과 울먼과 벨란토니(Uhlman & Bellantoni, 2001)의 문헌에서 파생된 선행연구의 움직임 특성을 종합한 후 공간과 시간의 하위 요소를 도출했다(Yu, 2012; Shin & Song, 2020; Chung, 2020; Hwang, 2003; Oh, 2012). 움직임은 표현 양식에 따른 정보교류의 개념으로서 시간 변화가 필요하고 변화의 대상은 시간에 종속하게 되며, 이러한 움직임의 특성은 위치이동 같은 운동성으로 공간의 변화와 공유하거나 연계된다(Lee, 2009). 공간은 시퀀스(sequence)에 정보를 배치하는 레이아웃(layout)과 시점(view point) 표현을 포함한다. 전자는 기본 조형 요소이며 후자는 물리적(영상 프레임), 감각적(주체적, 객관적)과 같은 구분이 있다. 시간은 대상의 변화인 실행, 정렬, 속도, 시각효과 등을 통한 흐름이다. 움직임에서 공간과 시간의 개념은 앞서 언급한 요소에 시각효과(VFX)를 적용하여 높은 주목성과 공감각적인 정보를 전달할 수 있다(Oh, 2012). 또한 움직임을 동반한 정보전달은 시각언어를 통해 수용자의 심리적 활동을 촉진시켜 쌍방향 소통 가능성이 높아진다(Yu, 2012). 따라서 움직임 요소에 따른 텍스트 생성 인공지능 챗봇의 텍스트 움직임은 아래 Table 2와 같이 리스터 등(Lister et al., 2020)이 분석한 CUI의 특성과 함께 구분될 수 있다.

Elements of Motion Graphics and Kinetic Typography

CUI of Text Generation AI Chatbots Based on Movement

먼저 공간 요소는 챗봇 인터페이스의 레이아웃으로 구분된다. 이 레이아웃은 대화 기록에 따른 사용자의 시점, GUI 오브젝트 요소 및 인터페이스를 구성하는 시각 이미지 정보로 구성된다. 이러한 공간적 속성은 텍스트 생성 인공지능 챗봇의 CUI에서 ‘다중 통신 모달리티 가능성’을 기반으로 한다. 이는 (비)언어적 신호체계와 미디어의 결합으로 챗봇 대화에서 의사소통을 풍부하게 만들어 상호작용을 효과적으로 높이는 것을 의미한다. 또한, ‘다중 채널 사용 가능성’을 통해 대화 참여자는 챗봇이 종속되는 모바일 또는 웹의 디지털 서비스에 따라서 접근성과 인터페이스 시각요소에 영향을 받는다. 다음으로 시간 요소는 대화 텍스트 생성으로 구분된다. 텍스트가 생성될 때 속도, 방향 등과 같은 시각효과가 변화되며, 이는 텍스트 생성 인공지능 챗봇과의 발화 교환인 ‘대화 기반 상호작용’을 통해 사용자들에게 정보를 제공한다. 이러한 시스템은 ‘논리와 기계학습의 결합’을 통해 인공지능과 같은 자연어 생성, 기계학습, 대규모 언어 모델과 같은 첨단 기술로 구현된다.

따라서 본 연구의 ‘텍스트 움직임’이란 텍스트 생성 인공지능 챗봇이 대화 참여자의 입력을 처리해 자연어로 출력하는 과정을 의미한다. 즉, 텍스트를 생성하는 일련의 운동이다. 이는 챗봇의 CUI에서 공간과 시간 속성의 요소들이 작용해 텍스트 생성 인공지능 챗봇이 발화하는 시각효과를 발생시킨다. 또한 김현정과 오미아(2014)가 주장한 디지털 미디어의 인쇄 텍스트 디자인 요소(폰트, 서체, 자간, 행간, 색채 등)에 하이테크 기술 요소(운동 속도, 운동 방향 등)가 더해져 있는 상태의 텍스트 정보 디자인과 같다. 즉, 텍스트 생성 인공지능 챗봇과의 대화 텍스트를 통한 상호작용은 정보 수용과 생산에 있어 움직임을 주기제로 CUI상의 복합적인 정보 양식이 존재하는 텍스트로 구성된다.

2.2. 텍스트 움직임과 아이트래킹

아이트래킹(Eye-tracking)은 사람의 눈동자 움직임을 기계장치로 기록해 시선을 정량적으로 분석하는 기술이다(Lee, 2018; Moon & Joo, 2019; Kim, 2023). 안구운동에는 기본적으로 새로운 정보를 획득하기 위해 응시되는 고정(Fixation)과 응시를 진행하는 움직임 자체인 도약운동(Saccade)이 있으며, 이 두 가지를 통해 다른 안구운동 측정치를 도출한다(Sharmin, Špakov & Räihä, 2012; Lee, 2019).

디지털상에서 시선의 방해가 되는 요소는 안구운동 패턴에 영향을 줄 수 있기 때문에(Haverkamp et al., 2023), 텍스트 움직임을 통한 읽기에서 수행되는 안구운동 분석으로 부정적 요인을 식별할 수 있다. 레이하와 샤르민(Räihä & Sharmin, 2014)은 스크린(screen)의 문자 크기에 따른 스크롤(scroll) 패턴 분석을 통해 문자 크기와 스크롤 패턴이 시선고정 영역에 관계가 있음을 제안했다. 또한 실험 참가자들은 수동적인 스크롤 사용에서 선호하는 시선 영역으로 텍스트 위치를 조율했으며, 직전에 읽었던 문자를 찾기 위한 불안정한 시선과 스크롤 행동을 조명했다. 터너(Turner et al., 2015) 등 또한 온라인의 디지털화된 텍스트의 구조적 특징 즉, 텍스트 레이아웃에 따라 스크롤 패턴이 일정하게 발생한다고 했다.

종합하면 연구자들은 텍스트의 단락 간격이 스크롤의 변화에 직접적인 영향을 주는 것을 식별함과 동시에 스크린의 위치에 따라 읽기 중 고정 시간이 변화되는 것을 파악했다. 또한 선행연구들은 디지털상의 텍스트에 가변적인 양식이 더해져 사용자의 행동과 시선 패턴에 영향을 주는 것을 주목하고 있다. 즉, 텍스트의 복합적인 디자인 양식은 사람들의 정보 수용 관계에 직접적인 영향을 행사하며 아이트래킹을 통해 그 영향을 밝히고 있다. 따라서 본 연구는 텍스트 생성 인공지능 챗봇의 시각적 주의를 창출하는 텍스트 움직임에 대해 아이트래킹으로 대화 참여자의 실시간 인지 행위와 상호작용을 파악하고자 한다.


3. 사례분석

3.1. 사례 선정 기준 및 분석 방법

2023년 9월 기준으로 무료 서비스에 따른 사용자의 접근성, 한국어 기반 사용 가능 여부, 웹 기반으로 하는 베타 서비스를 제외했다. 따라서 총 5개 국내외 서비스, ‘오픈 AI-ChatGPT, 마이크로소프트-Bing AI, 구글- Bard, 뤼튼테크놀로지스-뤼튼(Wrtn), 유닷컴(You.com)-Youchat’을 분석 대상으로 선정했다. 수집된 텍스트 생성 인공지능 챗봇 서비스의 대화형 인터페이스에서 기능 분석은 다음 Table 3과 같다. 분석은 텍스트 생성 인공지능 챗봇 CUI의 기능을 중심으로 입력, 출력과 부가적인 기능으로 구분했으며, 텍스트 움직임은 출력에 해당하는 대화 생성이다. 또한 챗봇의 대화 텍스트 및 CUI는 양식의 복합성으로 인한 언어적 문자 정보와 함께 비언어적 신호가 동시다발적으로 대화 참여자에게 자극되기 때문에 출력에서 언어적 신호와 비언어적 신호를 구분했다.

Text Movement Types Derived from Case Analysis

3.2. 사례분석 결과

5개의 서비스에서 식별된 텍스트 움직임 요소는 생성 단위(속도), 생성 방향, 초점(스크롤), 대화 위치이다. Table 4는 사례분석에서 도출된 총 4개의 텍스트 움직임 요소를 구분한 표이며 다음 설명과 같다.

Text Moment Elements in Text Generation AI Chatbots

첫째, 공간적 요소는 대화 위치와 초점이다. 대화 위치는 최초대화와 이어지는 연속대화의 공간상 위계이며, 초점은 대화 참여자의 화면 시점으로 스크롤 기능을 통해 화면상의 위치가 변화되었다. 그러므로 두 가지 요소를 통해 CUI의 레이아웃이 결정되었다. 둘째, 시간적 요소는 생성 단위와 생성 방향이다. 생성 단위는 텍스트 생성 인공지능 챗봇의 기본 발화 단위가 낱자부터 텍스트까지의 언어 문법 단위로 구분되며 선택되는 단위에 따라 속도와 같이 시간당 문자 생성의 위치변화이다. 생성 방향은 발화 문자가 시작되는 기준으로부터 멀어지면서 나타나는 움직임 요소이다. 요약하면, 텍스트 생성 인공지능 챗봇의 텍스트 움직임은 위치, 초점, 생성 단위, 방향이 상호작용하며 움직임을 형성했다.

사례분석에서 생성 단위, 위치, 방향, 초점이 조합되지 않은 유형을 제외한 4가지 유형을 도출했다[Table 5].

Comprehensive Types of Text Movement in Text Generation AI Chatbots

유형의 예시는 다음 Figure 1과 같다. 유형1, 유형2, 유형3은 첫째, 생성 단위는 ‘낱자’와 ‘문장 이하’ 2개의 단위로 구분되었다. 둘째, 위치는 최초대화와 연속되는 대화를 기준으로 상단, 하단으로 구분된다. 셋째, 방향은 문자가 생성되는 방향에 따라 상승과 하강 방향으로 구분되었다. 넷째, 초점은 위치와 방향에 따라서 화면상의 여백이 영향을 받고 자동 스크롤 실행 여부가 결정되었다.

Figure 1

Text Movement Types Derived from Case Analysis

유형4는 ‘텍스트’ 생성 단위로 독립적인 유형이며, 방향이 없고 상단에 고정으로 생성되는 텍스트 움직임 유형이다. 마지막으로, 분석 사례에 미포함된 ‘Youchat의 연속대화’의 경우 하단에서 하강 방향으로 대화 텍스트가 생성되기 때문에 텍스트 일부가 화면 밖으로 나아가 스크롤 실행이 불가피하다. 그러므로 유형 선정에서 제외시켜 스크롤 실행의 기준을 통일했다.

따라서 본 연구는 사례분석에서 도출된 텍스트 생성 인공지능 챗봇의 4가지 텍스트 움직임 유형에 대해 참여자의 보기와 읽기 변화 중점으로 분석하고자 했다.


4. 연구방법

4.1. 연구가설 및 실험 방법

본 연구는 참여자의 실시간 안구운동 측정을 통해 텍스트 움직임의 영향을 분석한다. 독립변수는 생성 단위(속도)에 따른 위치, 방향, 초점(스크롤)의 텍스트 움직임 유형이다. 이 중 생성 단위는 낱자, 문장 이하, 텍스트 단위이며 생성 완료 시간에 차이가 있다. 이는 텍스트 생성 속도에 영향을 주고 초점의 경우도 속도에 비례하여 텍스트 움직임에 영향을 준다.

종속변수는 이윤형(2009) 연구의 안구운동 측정 지표에서 총 4개 지표를 선정했다[Table 6].

Definitions of Eye Movement Measurements in Digital Reading

1) 첫 고정 시간(Duration of first fixation)과 2) 고정 시작 횟수(Number of fixation starts)를 통해 단어재인에 미치는 영향과 자극 수용 정도를 파악한다. 특히, 시선 분포 파악만 할 수 있었던 히트맵(Heat map)에서 고정 시작 횟수를 통해 시선 빈도를 수치화하여 구체적으로 분석한다. 3) 전체 고정의 총 지속 시간(Total duration of whole fixations)과 전체 고정 횟수(Number of whole fixations)를 통해 텍스트를 인지하기 위한 시간과 노력의 총량을 비교한다. 4) 도약진폭(Saccades amplitude)을 통해 정보탐색 정도를 비교한다. 도약진폭은 도약운동의 길이로 진폭이 높을수록 고정 지점의 폭이 증가하는 것을 의미하고 일반적으로 단위 시간당의 각도로 계산된다(Somani & Othman, 2023). 도약진폭은 사용자가 텍스트 생성 인공지능 챗봇에서 텍스트 움직임과 함께 읽기를 수행할 때 정보 탐색 경로의 정도를 파악할 수 있다.

연구가설은 4가지 유형에 대한 위치와 방향, 초점(스크롤)에 따른 안구운동 차이를 검증하고, 유형1~4의 생성 단위 변화에 따른 안구운동 차이를 검증하고자 했다.

[연구가설 1] 텍스트 생성 인공지능 챗봇의 생성 단위 그룹별 움직임 유형(1/2/3/4)에 따른 안구운동의 차이가 있을 것이다.

[연구가설 2] 텍스트 생성 인공지능 챗봇의 움직임 유형별 생성 단위(낱자/문장 이하)에 따른 안구운동의 차이가 있을 것이다.

4.2. 실험물 개발

실험에 사용된 텍스트 움직임 유형은 총 4가지 ‘유형1. 상단에서 하강하는 텍스트 움직임’, ‘유형2. 하단에서 하강하며 자동 스크롤링하는 텍스트 움직임’, ‘유형3. 하단에서 상승하는 텍스트 움직임’, ‘유형4. 상단에서 방향 없이 나타나는 텍스트 움직임’으로 구분했다. 유형1, 유형2, 유형3은 사례분석에서 2개의 생성 단위인 ‘낱자’와 ‘문장 이하’로 구분되었으며 생성 단위에 따라 생성 속도에 차이가 있다. 따라서 실험에서 생성 속도가 느린 그룹A, 생성 속도가 빠른 그룹B로 두 집단을 나누어 유형1(a1, b1), 유형2(a2, b2), 유형3(a3, b3)으로 실험물을 제작했다. 유형4는 ‘텍스트’ 생성 단위로 사례에서 독립적인 유형으로 추가 조작이 없으며 움직임 요소 조합 수가 적으므로 움직임 정도가 낮고 정적인 디지털 텍스트와 유사하다. 이 실험물은 일반적인 디지털 텍스트를 읽는 패턴으로 파악하기 위한 비교군으로 활용되었다.

실험에 사용된 텍스트 구조는 ChatGPT 활용으로 동일하게 추출 후 수정해 사용되었다. 각 실험물의 텍스트 너비, 서체 및 크기, 자간, 행간은 사례에서 분석된 평균값을 적용했다[Table 7]. 4개의 서비스 Bard, Bing AI, ChatGPT, Youchat의 문자 크기는 17.3pt로 같으며 뤼튼은 15.3pt로 다른 서비스보다 작다. 텍스트 넓이는 ChatGPT가 650px로 가장 낮았고 Bard가 1100px로 가장 높았다. 따라서 문자 크기 16.9pt를 기준으로 자간은 모두 0으로 조절되었고 행간은 140~160%, 텍스트 너비는 반올림한 800px로 조정되었다.

Average Text Format of 5 Service Case Examples

실험물을 도식화한 Figure 2는 실험물의 문자가 움직이는 방향에 따라 붉은색 점선 및 실선으로 표기했다. 텍스트 움직임 실험물 구성의 설명은 다음과 같다. 첫째, 실험물 유형1, 유형2, 유형3은 ‘낱자’와 ‘문장 이하’ 생성 단위로 구성했으며 유형4는 ‘텍스트’ 생성 단위로 구성되었다. 둘째, 유형1(a1, b1)은 대화 텍스트가 상단에서 하강하는 움직임으로 ChatGPT, Youchat, Wrtn 서비스에서 최초대화의 텍스트 움직임과 유사하다. 셋째, 유형2(a2, b2)는 대화 텍스트가 하단에서 하강하며 하단에 부족한 여백으로 인해 자동 스크롤로 생성되는 글줄에 초점이 맞춰진다. ChatGPT 서비스에서 연속되는 대화의 텍스트 움직임과 유사하다. 넷째, 유형3(a3, b3)은 대화 텍스트가 하단에서 상승하는 움직임 유형으로 문자 생성 기준이 화면 하단에 고정되어 있다. 그리고 상단의 여백으로 인해 초점의 변화는 존재하지 않는다. Bing AI 서비스의 텍스트 움직임과 유사하다. 다섯째, 실험물 유형4(c4)는 텍스트 움직임 유형 중 움직임 요소가 가장 적고 Bard 서비스의 텍스트 움직임과 같다.

Figure 2

Text Movement Stimulus Types

4.3. 실험 방법

각 실험물은 기후변화로 인한 거북이(a1, b1), 나비(a2, b2), 산호(a3, b3), 판다(c4)의 생태에 대한 영향을 설명하는 1,300~1,500자의 텍스트 주제로 구성했다. 본 실험은 시선 데이터 정밀도를 확보하기 위해 머리 움직임을 통제하여 신뢰성을 확보하고자 했다(Holmqvist et al., 2023). 또한 참가자의 피로도를 고려해 실험물 제시 사이의 약 10초가량 쉬는 시간을 부여했다. 총 4개의 텍스트 움직임은 설명적 텍스트 주제와 함께 무작위로 제시되었으며, 아이트래커 토비3(Tobii3)를 통한 시선추적이 이루어졌다.


5. 연구 결과 분석 및 논의

본 연구에서 총 36명의 실험 참가자를 그룹A(생성 단위=낱자)와 그룹B(생성 단위=문장 이하) 각 18명씩 나누어 실험을 진행했다. 수집된 자료의 분석 방법은 다음과 같다. 첫째, 히트맵(Heat map) 분석을 위해 관심영역(AOI)의 고정 시작 횟수를 파악했다. 둘째, 텍스트 움직임 유형에 따른 안구운동의 유의한 차이를 검증하기 위해 반복측정 분산분석(Repeated measures ANOVA)을 실시했다(α=.05). 셋째, 반복측정 분산분석에서 유의한 차이가 식별된 경우 Bonferroni 사후분석을 추가 시행했다. 넷째, 생성 단위 간의 차이를 분석하기 위해 두 그룹을 대상으로 독립표본 t검정을 실시했다(α=.05).

5.1. Heat map 및 AOI 분석

본 실험의 히트맵(Heat map)은 텍스트 생성 완료 시간인 50초를 기준으로 도출했다[Table 8]. 관심영역(Attention of interest, AOI)은 시선추적에서 화면의 특정 영역을 정의해 분석하는 방법이다.

Heat Map and AOI During Text Movement(50 Seconds)

히트맵 분석에서 관심영역의 고정 시작 횟수(Number of fixation starts) 분석은 시선 분포를 구체적으로 파악하기 위함이다. 고정 시작 횟수는 텍스트 움직임에 따라 5초 간격으로 실험 참가자가 대화 텍스트를 읽기 위해 관심영역(AOI)에서 고정 이동을 시작한 횟수를 의미한다. 시선 분포를 살펴보면 ‘문장 이하’ 생성 단위의 그룹B는 ‘낱자’ 생성 단위의 그룹A보다 더 좁은 영역에 집중되어 있다. 이러한 양상은 라이하와 샤민(Rih & Sharmin, 2014)의 연구와 같이, 텍스트 생성 속도가 증가하는 것에 비례해 화면의 스크롤 속도가 증가되어 시선이 특정 영역에 집중된 결과이다.

구체적인 시선 분포 파악을 위한 관심영역(AOI)의 고정 시작 횟수는 Table 9Figure 3과 같다. 관심영역은 상단의 area1부터 하단의 area8까지 구분되어 있으며, 그룹A, B 모두 area6(a3=108, b3=129), area7(a2=118, b2=122)에서 높은 고정 시작 횟수가 발생했다. 즉, 하단에서 ‘스크롤링하며 하강’하거나 ‘상승’하는 텍스트 움직임의 유형2(a2, b2)와 유형3(a3, b3)은 새 정보가 나타나는 텍스트의 하단에서 실험 참가자들의 높은 응시가 일어났다. 반면 ‘유형1(a1, b1)과 유형4(c4)’는 전자와 상대적으로 낮은 고정 시작 횟수를 보였다. 이러한 차이는 화면의 하단에서 움직임 요소가 조합됨에 따라 소모적인 응시가 상대적으로 증가하는 것을 뜻한다. 종합하면 움직이는 대화 텍스트의 새 정보 응시는 유형2(a2, b2), 유형3(a3, b3)이 상대적으로 높다. 특히 하단 영역에서 높은 탐색 빈도가 일어났으며, 생성 속도가 높은 그룹B에서 유형 간의 차이가 더 높다.

Analysis of Number of Fixation Starts by AOI(Paragraph)

Figure 3

Differences in Number of Fixation Starts by AOI(Paragraph)

5.2. 안구운동 검증 결과

Table 10은 반복측정 분산분석을 위한 구형성 검정 결과이다. 안구운동의 첫 고정 시간, 고정 시작 횟수, 전체 고정 횟수, 전체 고정의 총 지속 시간, 도약진폭에서 모두 구형성 가정을 만족했다(p>.05). 그리고 데이터의 신뢰도를 확보하고자 정규성 검사를 실시했다. 시행 결과 왜도의 절댓값이 2이하, 첨도에서 절댓값이 7이하로 고르게 분포되어 정규성 가정을 만족했다.

Mauchly's Sphericity Test Results

(1) 반복측정 분산분석 결과(Repeated measures ANOVA)

‘낱자’와 ‘문장 이하’ 생성 단위의 텍스트 움직임 유형에 따른 반복측정 분산분석 결과는 그룹B의 첫 고정 시간을 제외한 모든 유형에서 차이가 나타났다[Table 11]. 첫째, 첫 고정 시간에서 그룹A(F=2.624, p=.052)는 유의확률 0.052로 유의확률 0.05와 근사치이다. 둘째, 고정 시작 횟수에서 그룹A(F=6.474, p=.001)와 그룹B(F=4.724, p=.006)는 유의미한 차이가 있었다. 셋째, 전체 고정의 총 지속 시간에서 그룹A(F=5.805, p=.002)와 그룹B(F=3.675, p=.018)는 유의미한 차이가 있었다. 넷째, 전체 고정 횟수에서 그룹A(F=11.637, p=<.001)와 그룹B(F=6.769, p=.002)는 유의미한 차이가 있었다. 다섯째, 도약진폭에서 그룹A(F=8.563, p=<.001)와 그룹B(F=4.346, p=.008)는 유의미한 차이가 있었다. 따라서 안구운동 지표에서 차이가 식별됨으로 [연구가설 1]은 채택되었다.

Results of Repeated Measures ANOVA on Eye Movements

(2) 사후분석 결과(Post-hoc Analysis)

Bonferroni 사후분석 결과는 다음과 같다[Table 12]. ‘그룹A(낱자)’는 첫째, 첫 고정 시간에서 a2(M=1,538.89, SD=419.61)가 상대적으로 c4(M=1,183.00, SD=449.39)보다 높게 측정되었다(a2>c4, p<.052). 둘째, 고정 시작 횟수에서 a2(M=191.00, SD=93.36)가 상대적으로 c4(M=139.33, SD=73.22)보다 높게 나타났다(a2>c4, p<.001). 셋째, 전체 고정 횟수에서 a2(M=345.89, SD=149.03)가 상대적으로 c4(M=264.33, SD=123.84)보다 높게 나타났다(a2>c4, p<.002). 넷째, 전체 고정의 총 지속 시간에서 a2(M=72,393.22, SD=37,208.18)와 a3(M=68,676.44, SD=26,226.11)는 상대적으로 c4(M=52,495.00, SD=26,550.68)보다 높게 나타났다(a2/a3>c4 , p<.001). 다섯째, 도약진폭에서 a2(M=1,075.46, SD=432.48)와 a3(M=1,053.41, SD=302.81)는 상대적으로 c4(M=808.00, SD=365.09)보다 높게 나타났다(a2/a3>c4, p<.001).

Eye Movement Post-hoc Analysis Results

‘그룹B(문장 이하)’의 결과 첫째, 고정 시작 횟수에서 b3(M=195.94, SD=87.21)가 상대적으로 c4(M=158.11, SD=71.49)보다 높게 나타났다(b3>c4, p<.006). 둘째, 전체 고정 횟수에서 b2(M=343.89, SD=123.89)와 b3(M=358.94, SD=137.68)는 상대적으로 c4(M=310.11, SD=114.32)보다 높게 나타났다(b2/b3>c4, p<.018).

셋째, 전체 고정의 총 지속 시간에서 b3(M=79,737.50, SD=37,212.70)가 상대적으로 b1(M=64,174.06, SD=22,867.76)과 c4(M=62,562.06, SD=25,380.52)보다 높게 나타났다(b3>b1/c4, p<.002). 넷째, 도약진폭에서 b2(M=1,036.27, SD=415.57)가 상대적으로 c4(M=876.16, SD=373.79)보다 높게 나타났다(b2>c4, p<.008).

(3) 독립표본 t검정 결과(Independent t-test Analysis)

Table 13은 움직임 유형별 생성 단위의 차이를 비교하기 위한 독립표본 t-test 결과이다. 총 5개의 측정 지표 중 4개의 시작 횟수, 전체 고정의 총 지속 시간, 전체 고정 횟수, 도약진폭에서 유의한 차이가 나타나지 않았다. 하지만 유형2의 첫 고정 시간에서 유의미한 차이가 나타났다(t=2.206, p=.017). 구체적으로 ‘유형2. 상단에서 하강하며 스크롤링하는 움직임’ 비교에서 ‘낱자’ 생성 단위 그룹A(M=1,538.89, SD=419.61)는 상대적으로 ‘문장 이하’ 생성 단위 그룹B(M=1,255.44, SD=348.10)보다 높다. 따라서 5개의 안구운동 지표 중 1개의 측정 지표에서 차이가 식별됨에 따라 [연구가설 2]는 부분 채택되었다.

t-test Results for Generation Units(Duration of First Fixation)

안구운동 검증 결과를 종합하면 그룹A 유형별 비교는 5개의 모든 안구운동 지표에서 a2, a3, c4 간의 차이가 식별되었으며, 그룹B 유형별 비교는 첫 고정 시간을 제외한 4개의 안구운동 지표에서 b1, b2, b3 c4 간의 차이가 식별되어 [연구가설 1]은 채택했다. 그리고 생성 단위 간의 차이는 그룹A의 a2와 그룹B의 b2에서 단어재인의 영향이 있는 첫 고정 시간의 차이가 식별되어 [연구가설 2]는 부분 채택했다.


6. 결론 및 제언

본 연구의 결과는 다음과 같다. 첫째, 히트맵(Heat map) 분석에서 50초의 생성시간 동안 시선 분포는 생성 속도가 빠른 그룹B(문장 이하 단위)의 대화 텍스트 하단 영역에 집중되었다. 이러한 결과는 움직임 요소 ‘생성 단위’가 생성시간 동안의 안구운동 패턴에 영향을 미친 것을 의미한다. 구체적으로 고정 시작 횟수를 비교한 결과 텍스트 움직임 유형2, 유형3은 그룹A/B 모두 대화 텍스트의 ‘하단 영역’(area)에서 주목도가 증가했지만, ‘문장 이하’ 생성 단위에서 텍스트의 생성 속도가 높아지기 때문에 그룹A보다 화면 하단의 시선 밀도를 높게 만든다. 즉, 하단 영역에서의 읽기 속도보다 높은 텍스트 생성 속도는 대화 참여자의 주의력을 분산시켜 정보탐색 횟수가 증가하게 된 것으로 고려된다.

둘째, 그룹A에서 ‘a2. 하단에서 하강하며 자동 스크롤링하는 움직임’은 전체의 안구운동 지표 평균이 상대적으로 ‘c4. 방향이 없이 나타나는 움직임’보다 높았다. 이러한 결과는 텍스트 움직임이 ‘낱자’ 생성 단위일 때, 움직임 요소 ‘하단(p)+하강(d)+초점(f)’이 대화 참여자의 높은 인지 활동을 요구하기 때문이다. 즉, ‘유형(a2)’에서만 존재하는 ‘초점(f)’은 다른 움직임 요소와 구별되는 조합 형태의 움직임으로 대화 참여자의 주의력을 분산시키고 정적인 텍스트보다 인지 활동의 차이를 높이는 것으로 판단된다.

셋째, 그룹B에서 ‘b3. 하단에서 상승하는 움직임’은 고정 시작 횟수, 전체 고정의 총 지속 시간, 전체 고정 횟수 총 3가지의 안구운동 지표에서 평균이 상대적으로 ‘c4. 방향이 없이 나타나는 움직임’보다 높았다. 또한 전체 고정의 총 지속 시간에서 ‘b3.’의 평균은 상대적으로 ‘b1. 상단에서 하강하는 움직임’보다 높았다. 이러한 결과는 텍스트 움직임이 ‘문장 이하’ 생성 단위일 때, 움직임 요소 ‘하단(p)+상승(d)’이 높은 시각적 탐색과 높은 인지 활동을 요구하는 것을 의미한다. 즉, ‘문장 이하’ 생성 단위에서 ‘하단(p)+상승(d)’은 빠른 생성으로 움직임 속도가 증가되어 대화 참여자의 주의력을 분산시키고 인지 활동의 차이를 높이는 것으로 판단된다. 넷째, 그룹B에서 ‘b2. 하단에서 하강하며 자동 스크롤링하는 움직임’은 전체 고정 횟수, 도약진폭 총 2개의 안구운동 지표에서 평균이 상대적으로 ‘c4. 방향이 없이 나타나는 움직임’보다 높았다. 이러한 결과는 텍스트 움직임이 ‘문장 이하’ 생성 단위일 때, 움직임 요소 하단의 초점(f)이 사용자의 높은 시각적 탐색에 영향을 미치는 것이며, 대화 참여자는 텍스트 움직임의 초점 요소로 인해 높은 응시 횟수가 발생하는 것을 의미한다. 즉, ‘유형(b2)’에서만 존재하는 ‘초점(f)’는 대화 참여자의 주의력을 분산시켜 움직임이 없는 텍스트보다 응시 횟수의 차이를 높이는 것으로 판단된다.

결과를 종합하면, 낱자 생성 단위의 ‘a2. 하단(p)에서 하강(d)하며 자동 스크롤링(f)하는 움직임’은 안구운동 지표가 전체적으로 높게 측정되었으며, 생성 단위 비교에서도 높았다. 즉, ‘a2’는 단어재인, 정보탐색 및 정보 수용의 인지 활동을 높게 요구한다. 그리고 문장 이하 생성 단위의 ‘b3. 하단(p)에서 상승(d)하는 움직임’은 정보 탐색(고정 시작 횟수, 도약진폭) 정도와 인지적인 활동(전체 고정의 총 지속 시간, 전체 고정 횟수)이 높은 것을 의미한다. 따라서 높은 인지 활동을 요구한 전자의 두 가지 유형2(a2), 유형3(b3)은 공통적으로 대화 텍스트가 하단(p)에서 생성되는 유형이다. 즉, 생성 단위와 상관없이 하단(p)에서 조합되는 텍스트 움직임 요소는 높은 인지 활동을 요구한다. 또한 하단(p)의 방향(d)+초점(f)은 ‘생성 단위(u)’에 따라서 대화 참여자의 다른 시각적 반응을 유도한다. 이러한 결과는 텍스트 생성 인공지능 챗봇이 제공하는 대화 텍스트 레이아웃이 여러 단락으로 구성되기 때문이다. 단락 간격과 행간 간격은 동일하지 않기 때문에 텍스트 생성 시에 불규칙한 움직임이 발생되어 안구운동 지표가 높게 발생한 것으로 파악된다. 특히 생성 위치가 하단의 경우 생성 속도가 높아지면 다른 움직임 요소와 함께 작용하면서 인지 활동을 더 높게 요구한다. 결론적으로, 텍스트 움직임은 대화 참여자의 더 높은 주의를 요구하며 움직임 요소의 조합에 따라 다른 시각적 반응이 나타난다. 특히 유형2(a2), 유형3(b3)과 같은 텍스트 움직임은 읽기에 가장 부적절하다. 하지만 움직임 요소 2개 이상의 조합 중 유형1(a1,b1)은 상대적으로 대화 참여자의 낮은 주의를 요구해 읽기에 적절한 움직임 유형으로 판단된다.

본 연구의 결과를 통해 다음과 같은 학문적 시사점을 제시할 수 있다.

첫째, 텍스트 생성 인공지능 챗봇을 상호작용 매체로서 양식의 복합적인 특성을 제기하며, 대화 참여자의 확장된 시각성을 파악하기 위해 움직임 이론의 정보교류와 표현 양식 관점으로 텍스트 생성 인공지능 챗봇의 대화형 인터페이스(CUI)를 구분했다. 둘째, 텍스트 생성 인공지능 챗봇과 상호작용에서 텍스트 움직임을 비언어적 신호체계로서 사용자의 인지에 미치는 영향을 입증했다. 따라서 대화를 디자인하는 챗봇의 핵심 과제에서 텍스트 움직임은 인간의 의사소통에서 동시다발적이고 복합적인 특성을 반영하여 텍스트 생성 인공지능 챗봇의 CUI에서 비언어적 요소를 구체화하는 데 기여된다.

실무적 시사점은 다음과 같다. 첫째, 생성형 인공지능 챗봇 서비스 개발 시, 텍스트 움직임에 따른 대화 참여자의 인지적 차이를 활용한다면, 텍스트 생성 인공지능 챗봇 서비스에서 의사소통 효율을 높일 수 있을 것이다. 둘째, 본 연구의 결과는 텍스트 생성 인공지능 챗봇과의 정보성 대화를 통해 학습 목적으로 활용할 수 있을 것이다. 텍스트 움직임에 따른 학습자의 인지 활동을 고려해 ‘상단에서 하강’하는 텍스트 움직임으로 구조화한다면 교육적 상호작용을 향상시킬 수 있을 것이다. 마지막으로 Figure 4와 같은 생성 인공지능 챗봇의 텍스트 움직임을 제안하고자 한다. 일반적인 텍스트 생성 인공지능 챗봇 서비스에서 최초대화와 연속대화는 유형1과 유형2의 텍스트 움직임으로 설계되어 있다. 하지만 하단에서 생성되는 텍스트 움직임은 대화 참여자의 인지 활동을 증가시키고 특히, ‘낱자’ 생성 단위에서는 부적절하다. 따라서 연속대화의 텍스트 움직임 설계를 ‘유형1’로 유지하면 과도한 안구운동과 인지부하를 낮출 수 있다.

Figure 4

Proposed Text Motion Designs for Text Generation AI Chatbots

본 연구는 텍스트 생성 인공지능 챗봇의 텍스트 움직임에 따라 안구운동에 미치는 영향을 정량적으로 분석했지만, 다음과 같은 한계가 있다. 첫째, 텍스트 생성 인공지능 챗봇과의 대화 맥락 중, 정보성 대화인 설명적 텍스트로 제한된 범위에서 연구가 시행되었다. 따라서 챗봇의 대화 유형에 따른 텍스트 움직임 연구가 추가 시행되어야 한다. 둘째, 사례분석을 통한 텍스트 움직임 유형 구분에서 스크롤이 실행되는 기준을 통일하기 위해 제외한 대화 참여자의 수동 스크롤의 경우 추가 연구를 통해 텍스트 움직임에 대한 영향을 밝혀야 한다. 셋째, 시선추적 연구는 대상에 따라서 차이가 있다(Holmqvist et al., 2023). 그러므로 다양한 연령을 대상으로 연구가 시행되면, 텍스트 생성 인공지능 챗봇의 설명적 텍스트 읽기 및 보기에서 텍스트 움직임의 역할이 세분화될 수 있다. 이러한 관계가 명확해짐으로써 텍스트 생성 인공지능 챗봇의 학습 목적 활용으로 가치가 증진될 것이다.

Acknowledgments

This paper was written based on the Master Dissertation Thesis in 2024.

본 연구는 2024년 석사학위논문을 바탕으로 작성되었습니다.

Notes

Citation: Park, H., & Lee, Y. (2024). The Effect of Text Movement on Eye Movements in Generative AI Chatbots. Archives of Design Research, 37(4), 181-197.

Copyright : This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/), which permits unrestricted educational and non-commercial use, provided the original work is properly cited.

References

  • Cho, G., & Yun, J. (2019). UX Evaluation of Financial Chatbot Interaction Conversation Types by Financial Services Users. The HCI Society of Korea, 14(2), 61-69.. [https://doi.org/10.17210/jhsk.2019.05.14.2.61]
  • Chung, Y. (2020). 감정을 전달하는 타이포그래피의 애니메이션 효과에 대한 연구 [A Study on Typography Animation Effects That Express Emotions] (Unpublished master's thesis). Seoul National University, Seoul, Korea..
  • Haverkamp, Y. E., Bråten, I., Latini, N., & Salmerón, L. (2023). Is It the Size, the Movement, or Both? Investigating Effects of Screen Size and Text Movement on Processing, Understanding, and Motivation When Students Read Informational Text. Reading and Writing, 36(7), 1589-1608.. [https://doi.org/10.1007/s11145-022-10328-9]
  • Holmqvist, K., Örbom, S. L., Hooge, I. T., Niehorster, D. C., Alexander, R. G., Andersson, R., ... & Hessels, R. S. (2023). Eye Tracking: Empirical Foundations for a Minimal Reporting Guideline. Behavior research methods, 55(1), 364-416.. [https://doi.org/10.3758/s13428-021-01762-8]
  • Hwang, S. (2003). 키네틱 타이포그래피의 움직임에 관한 시지각 효과 연구: Web에 적용된 사례를 중심으로 [A Study on the Visual Perception Effect of Kinetic-Typographical Motion: Mainly Focusing on the Cases Applied on the Web] (Unpublished master's thesis). Ewha Womans University, Seoul, Korea..
  • Jho, H. (2023). Understanding of Generative Artificial Intelligence Based on Textual Data and Discussion for Its Application in Science Education. Journal of the Korean Association for Research in Science Education, 43(3), 307-319..
  • Kim, H., & Oh, M. (2014, May). Research of Moving Text Perception on the Digital Media Display. Proceedings of the Societatis Design Coreanae, 188-189..
  • Kim, S. (2009). A Study on the Oral Signification of Dynamic Typography as a Circulative Mediating Language. Journal of Korea Design Forum, 23, 193-202.. [https://doi.org/10.21326/ksdt.2009..23.017]
  • Kim, S. (2023). 아이트래킹 기반의 제품 디스플레이에 대한 시각적 인지 특성 분석 [An Analysis of Eye-Tracking-Based Visual Perception Characteristics for Product Display] (Unpublished master's thesis). Hanyang Universit, Seoul, Korea..
  • Kim, T. (2023). 챗GPT가 촉발한 생성형 AI 시대, 미래 모습과 대응 방안 [The Era of Generative AI Triggered by ChatGPT, Future Prospects and Response Measures]. Future Horizon, (55), 2-9..
  • Kong, H. (2013). 시각적 요소를 고려한 텍스트성 재개념화 연구 [A Study on Reconceptualization of Textuality in Consideration of Visual Elements] (Unpublished master's thesis). Ewha Womans University, Seoul, Korea..
  • Lee, H. (2018). 아이트래커와 아이시뮬레이션을 활용한 인간 안구운동 매커니즘 분석 [Analysis of Human Eye Movement Mechanism Using Eye Tracker and Eye Simulation] (Unpublished master's thesis). Chung-Ang University, Seoul, Korea..
  • Lee, J. (2020). Artificial Intelligence and Media-Communication Studies. Institute of Communication Research, 57(3), 5-40..
  • Lee, Y. (2009). Eye Movements and Sentence Processing: A Review on Eye Movement Measurement. Korean Journal of Cognitive and Biological Psychology, 21(2), 91-110.. [https://doi.org/10.22172/cogbio.2009.21.2.003]
  • Lee. H. (2009). Study of the Relationship of the Movement, Sense of Sight, and Space in Title Sequence. Journal of Korean Society of Design Science, 22(3), 239-248..
  • Lister, K., Coughlan, T., Iniesto, F., Freear, N., & Devine, P. (2020, April). Accessible conversational user interfaces: considerations for design. In Proceedings of the 17th international web for all conference (pp. 1-11).. [https://doi.org/10.1145/3371300.3383343]
  • Min, Y., Ahn, J., & Kim, S. (2020). Structural Relationship Analysis between the Intention to Use Educational Chatbots and Influential Factors based on Technology Acceptance Model. Korea Association for Educational Information and Media, 26(4), 799-825.. [https://doi.org/10.15833/KAFEIAM.26.4.799]
  • Moon, B., & Kim, J. (2019). A Study on the Trends of Visual Perception and the Direction of Spatial Research through Eye-tracking. Journal of Korea Institute of Spatial Design, 14(7), 429-438.. [https://doi.org/10.35216/kisd.2019.14.7.429]
  • NownSurvey. (2023, June 14). 대한민국 직장인 생성형 AI 활용 현황 [Current Usage Status of Generative AI Among Office Workers in South Korea]. https://www.nownsurvey.com/board/hotissue/view/wr_id/171/.
  • Oh, H. (2012). Case Study on Expressive Attributes and Idea Patterns Affecting Visual Attention in Motion Typography Sequences. Journal of Digital Design, 12(2), 519-529.. [https://doi.org/10.17280/jdd.2012.12.2.048]
  • Park, S. (2008). Expository Text Interface and Readers' Comprehension. The Textlinguistic Society Of Korea, 24, 27-53..
  • Pyun, J., Han, J., Byeon, E., & Suh, H. (2018). A Study on the Implication of 'imagance' as Multimodal Textuality. Journal of Reading Research, 49, 125-160.. [https://doi.org/10.17095/JRR.2018.49.5]
  • Räihä, K.-J., & Sharmin, S. (2014). Gaze-Contingent Scrolling and Reading Patterns. Proceedings of the 8th Nordic Conference on Human-Computer Interaction: Fun, Fast, Foundational, 65-68..
  • Sharmin, S., Špakov, O., & Räihä, K.-J. (2012). The Effect of Different Text Presentation Formats on Eye Movement Metrics in Reading. Journal of Eye Movement Research, 5(3).. [https://doi.org/10.16910/jemr.5.3.3]
  • Shin, E., & Song, J. (2020). Visual Characteristics of Korean Kinetic Typography According to Tone and Voice on YouTube. The Korean Society Of Design Culture, 26(2), 267-278.. [https://doi.org/10.18208/ksdc.2020.26.2.267]
  • Somani, A. N., & Othman, B. A. (2023, November). Saccade. https://eyewiki.aao.org/Saccade..
  • Turner, J., Iqbal, S., & Dumais, S. (2015). Understanding Gaze and Scrolling Strategies in Text Consumption Tasks. Proceedings of the 2015 ACM International Joint Conference on Pervasive and Ubiquitous Computing and Proceedings of the 2015 ACM International Symposium on Wearable Computers, 829-838.. [https://doi.org/10.1145/2800835.2804331]
  • Yang, J., & Yoon, S. (2023). ChatGPT를 넘어 생성형(Generative) AI 시대로: 미디어·콘텐츠 생성형 AI 서비스 사례와 경쟁력 확보 방안 [Beyond ChatGPT into the Era of Generative AI: Cases of Generative AI Services for Media & Content Creation and Ways to Secure Competitiveness]. Korea Communications Agency, (55), 62-70..
  • Yu, S. (2013). 키네틱 타이포그래피의 표현 요소에 관한 연구: 케이블 TV 광고를 중심으로 [Study In The Expressive Elements of Kinetic Typography] (Unpublished master's thesis). Keimyung University, Daegu, Korea..

Figure 1

Figure 1
Text Movement Types Derived from Case Analysis

Figure 2

Figure 2
Text Movement Stimulus Types

Figure 3

Figure 3
Differences in Number of Fixation Starts by AOI(Paragraph)

Figure 4

Figure 4
Proposed Text Motion Designs for Text Generation AI Chatbots

Table 1

Elements of Motion Graphics and Kinetic Typography

구분 속성 세부 구성요소
「무빙타입」, 2001, p018-~063; 유서남(2012); 신은혜, 송지성(2020); 정영신(2020); 황성원(2003); 오호준(2012).
공간
(space)
• 레이아웃(2D, 3D, 대각선, 수평, 수직 등), 시점(주관적, 객관적, 카메라), 오브젝트(캐릭터, 구성 요소, 상징성 등)
• 디자인 ★이미지(색체와 형태, 질감 등 조형성, 가독성, 통일성, 창조성의 표현)
점, 선, 면, 부피, 투시
시간
(time)
• 모션 변화(실행, 정렬, 속도, 시각효과 등) 방향, 방위, 회전, 근접, 그룹핑, 레이어링

Table 2

CUI of Text Generation AI Chatbots Based on Movement

구분 대표 속성 챗봇 CUI 특성
텍스트 움직임 공간
(space)
인터페이스 레이아웃
• 사용자 화면 시점, 오브젝트(캐릭터, 구성 요소, 상징성 등)
• 디자인 요소(이미지, 색체, 형태, 질감 등 조형성, 가독성, 통일성, 창조성 표현)
• 다중 통신 모달리티 가능성
• 다중 채널 사용 가능성
시간
(time)
텍스트 생성
• 속도, 방향, 운동 변화, 실행, 정렬, 시각효과 등
• 대화 기반 상호작용
• 논리와 기계학습의 결합

Table 3

Text Movement Types Derived from Case Analysis

구분 ChatGPT-3.5 Bing AI Bard 뤼튼
(wrtn)
Youchat
기준일: 2023년 09월
Input 대화 입력 문자 문자+음성+이미지 문자+음성 문자+이미지 문자+이미지
추가 입력 기능 맞춤 대화 - - 맞춤 대화, PDF 첨부 콘텐츠 텍스트
대화 트리거 (trigger) - -
Output
(대화 생성)
언어적 대화 출력 텍스트 텍스트+이미지 텍스트+음성 텍스트+이미지 텍스트+이미지
대화 교환
(질문:답변)
1:1 1:1+𝛼(출처) 1:3 1:1 1:1+𝛼(출처, 연관검색)
비언어적 방향 하강 생성 상승 생성 전체 생성 하강 생성 하강 생성
초점 반자동 스크롤 수동 스크롤 자동 스크롤 수동 스크롤 수동 스크롤
대화위치 최초 상단 하단 상단 상단 상단
연속 하단 하단 상단 상단 하단
디자인 형태 대화 버블 좌측정렬 블록 좌측정렬 블록 대화 버블 대화 버블
Etc. 대화 기록 /초기화
서비스 피드백 좋아요/싫어요, 복사/공유, 중지 및 재생성
대화 모드 GPT-4
(구독 서비스)
창의/균형/정밀 - 일반/검색, 인공지능 모델 Youchat pro
(구독 서비스)
  기타 - 대화 30회 제한 Google 서비스 연동 인공지능 프로필 -

Table 4

Text Moment Elements in Text Generation AI Chatbots

텍스트 움직임 특성 구분 요소 정의
공간
(space)
인터페이스 레이아웃 대화 위치 대화 텍스트가 생성되는 공간상 위계
초점(스크롤) 대화 참여자 화면 시점
시간
(time)
텍스트 생성 생성 단위(속도) 대화 텍스트의 기본 발화 단위에 따른 시간당 위치변화
생성 방향 발화 문자가 시작되면서 기준으로부터 멀어지는 움직임

Table 5

Comprehensive Types of Text Movement in Text Generation AI Chatbots

생성 단위 위치 방향 초점
(scroll)
비고 실험물 채택
낱자 문장 이하 텍스트 상승 하강
        분석 사례 미포함  
a1 b1         ChatGPT(최초대화), Youchat(최초대화), Wrtn 유형1
        분석 사례 미포함  
        분석 사례 미포함  
a2 b2         ChatGPT(연속대화)  
        분석 사례 미포함(Youchat(연속대화))* 유형2
        분석 사례 미포함  
a3 b3         Bing AI 유형3
    c4   - - Bard 유형4
      - - 분석 사례 미포함  

Table 6

Definitions of Eye Movement Measurements in Digital Reading

측정치 정의 및 의미
1) 첫 고정 시간
(First fixation duration)
새로운 단어를 처음 봤을 때 그 첫 고정 시간(텍스트 움직임에 따른 단어재인)
2) 고정 시작 횟수
(Number of fixation starts)
움직이는 텍스트를 통해 새 정보를 습득하기 위한 응시 노력
3) 총 고정 시간과 횟수
(Total duration of whole fixations, Number of whole fixations)
텍스트 움직임을 통해 정보를 수용하고자 발생하는 인지적인 노력과 시간의 총합
4) 도약진폭
(Saccade amplitude)
움직이는 정보를 망막 상의 옮기는 탐색 시간과 길이

Table 7

Average Text Format of 5 Service Case Examples

구분 Bard BingAI ChatGPT Youchat Wrtn 평균
너비(px) 1100 735 650 798 718 800.2
행간(%) 145 140 155 160 140 148
자간(%) 0 0 0 0 0 0
크기(pt) 17.3 17.3 17.3 17.3 15.3 16.9

Table 8

Heat Map and AOI During Text Movement(50 Seconds)

구분 그룹A(n=18) 그룹B(n=18) AOI
█ area1, █ area2, █ area3, █ area4, █ area5, █ area6, █ area7, █ area8
유형1
(a1&b1)
유형2
(a2&b2)
유형3
(a3&b3)
유형4
(c4)

Table 9

Analysis of Number of Fixation Starts by AOI(Paragraph)

구분 그룹A 그룹B
유형1
(a1)
유형2
(a2)
유형3
(a3)
유형4
(c4)
유형1
(b1)
유형2
(b2)
유형3
(b3)
유형4
(c4)
█ 유형별 관심영역(AOI)의 고정 시작 횟수 평균 중 실험 참가자의 최고 기록
area1 15 16 20 5 5 2 29 1
area2 58 57 67 52 49 22 63 26
area3 94 83 101 94 104 55 118 91
area4 101 93 90 84 102 97 116 89
area5 108 107 94 76 103 119 100 73
area6 94 105 108 73 96 87 129 73
area7 46 118 84 70 65 122   78
area8   70 6 53   62   57

Table 10

Mauchly's Sphericity Test Results

구분 그룹 Mauchly's W Approx.
Chi-square
df p
A(n=18), B(n=18)
첫 고정 시간 A .924 2.594 3 .762
B .732 4.901 3 .429
고정 시작 횟수 A .650 14.121 3 .781
B .775 4.005 3 .549
전체 고정 횟수 A .721 5.148 3 .399
B .486 11.630 3 .767
전체 고정의 총 지속 시간 A .845 5.509 3 .357
B .345 16.759 3 .784
도약진폭 A .766 8.723 3 .121
B .500 10.891 3 .054

Table 11

Results of Repeated Measures ANOVA on Eye Movements

구분 그룹A(n=18) 그룹B(n=18)
a1 a2 a3 c4 b1 b2 b3 c4
*p<.05, **p<.01, ***p<.001; 생성 단위(A=낱자, B=문장 이하)
첫 고정 시간 SS 1125971.194 214873.667
df 3 3
MS 375323.731 71624.556
F(p) 2.624(.052) .670(.574)
고정 시작 횟수 SS 30414.465 13478.944
df 3 3
MS 10138.155 4492.981
F(p) 6.474(.001)*** 4.724(.006)**
전체 고정 횟수 SS 67549.944 27406.333
df 3 3
MS 22516.648 9135.444
F(p) 5.805(.002)** 3.675(.018)*
전체 고정의 총 지속 시간 SS 7160924636.3 3575726760.6
df 3 3
MS 2386974878.8 1191908920.2
F(p) 11.637(<.001)*** 6.769(.002)**
도약진폭 SS 1040955.274 341941.418
df 3 3
MS 346985.091 113980.473
F(p) 8.563(<.001)*** 4.346(.008)**

Table 12

Eye Movement Post-hoc Analysis Results

구분 그룹A(낱자 단위) 그룹B(문장 이하 단위)
그룹A(n=18), 그룹B(n=18)
첫 고정 시간(1) a2 > c4  
고정 시작 횟수(2) a2 > c4 b3 > c4
전체 고정 횟수(3) a2 > c4 b2, b3 > c4
전체 고정의 총 지속 시간(4) a2, a3 > c4 b3 > b1, c4
도약진폭(5) a2, a3 > c4 b2 > c4
(1)첫 고정 시간 (2)고정 시작 횟수
(3)전체 고정 횟수 (4)전체 고정의 총 지속 시간
 
(5)도약진폭  

Table 13

t-test Results for Generation Units(Duration of First Fixation)

구분   단위: /ms t(p)
N M SD
*p<.05, **p<.01, ***p<.001
유형1
(a1-b1)
그룹A.-낱자 18 1,291.83 586.75 .481(.317)
그룹B-문장 이하 18 1,211.94 389.89
유형2
(a2-b2)
그룹A.-낱자 18 1,538.89 419.61 2.206(.017)*
그룹B-문장 이하 18 1,255.44 348.10
유형3
(a3-b3)
그룹A.-낱자 18 1,501.28 575.29 .803(.214)
그룹B-문장 이하 18 1,362.06 459.10
유형4
(c4)
그룹A.-낱자 18 1,183.00 449.39 -.540(.296)
그룹B-문장 이하 18 1,273.44 550.32