Home > Vol. 36, No. 4

AI 어시스턴트의 반말 구사 요청의 언어적 표현의 차이에 대한 사용자 경험 연구
User Experience Research on the Differences in Linguistic Representation of Request about Informal Language from AI Assistant
  • Soonkyu Jang : Visual Communication Design, Assistant Professor, Keimyung University, Daegu, Korea
  • 장 순규 : 계명대학교 시각디자인학과 조교수, 대구, 대한민국
  • Jungho Suh : Media Communication, Assistant Professor, Gachon University, Seongnam, Korea
  • 서 정호 : 가천대학교 미디어커뮤니케이션학과 조교수, 성남, 대한민국

연구배경 본 연구는 AI가 사용자와 누적된 대화를 통해서 어느 정도 친밀해진 상황에서 반말을 구사하게 되기 전 상황에 집중한 연구이다. AI가 반말을 구사하는 요청에 대하여, 어떠한 대화 방식이 사용자 경험에 가장 긍정적인지 알아보고자 했다.

연구방법 조사를 위해 UX 라이팅 측면에서 사용자에게 전달하는 언어 방식을 존댓말, 반말로 구분하였다. 더하여, 반말 구사를 하겠다는 요청을 질문과 평서문으로 구분하였다. 4가지 유형을 프로토타입으로 제작한 뒤, 사용자에게 반말 구사 요청을 간접적으로 경험할 수 있도록 하였다. 실험은 프로토타입을 경험한 뒤, 5점 리커트 척도로 요인을 사용자 경험 및 서비스 요인을 평가하도록 했다.

연구결과 존댓말로 질문하는 유형이 사용자 경험에 있어 가장 긍정적으로 평가되었다. 사용자의 성별 차이는 유의한 영향을 미친다. 남성 사용자 집단에서는 존댓말 평서문과 반말 질문에 차이가, 여성 사용자 집단에서는 반말 유형 간 차이가 사용성, 신뢰감, 친밀감 만족감에서 무의미하였다.

결론 본 연구는 AI가 사용자와 친밀해진 관계에서 반말 구사를 하기 전, 가장 긍정적인 태스크 시작 상황에 집중하였다. 결과적으로, AI는 이해관계자 입장에서 서비스 제공처이기 때문에, 사용자를 고객으로 둔 관점에서 가능한 존댓말 구사가 사용자에게 긍정적일 것이라 판단한다.

Abstract, Translated

Background This research is focused on situations before artificial intelligence (AI) is familiar with users through a cumulative conversion. This research aims to find the most positive user experience relevant in the case of speech on a situation when AI asks the user to converse through the informal word ‘Banmal’, which is a culture spoken in Korea.

Methods For the test, the language was sorted not only by honorific, but also informal words based on the perspective of user experience (UX) writing. The test also divided language through question and declarative markers. The prototype was designed as four cases, which were possible to indirectly experience the request from AI, based on the four factors as above. After using the prototype, an experiment was conducted to evaluate the user experience and service factors on a 5-point Likert-type scale.

Results Case A, which is based on a polite word and a question, was the most positive in the user experience. The gender difference is meaningful as a regulation effect on the experiment. In the male group, the difference between Case B, which is based on a polite word and an assertive sentence and Case C, which is constructed by an informal word and a question, had a meaningless effect on the factors of usability, trust, intimacy, and satisfaction. On the other hand, in the female group, the difference between Case D, which is based on informal word and declarative sentence and Case C, had a meaningless effect on the same factors as above.

Conclusions This research asserts that the tone from AI based on an informal word and a question to the user before AI asks the user, results in the most positive experience. AI, which is a service provider from the perspective of stakeholders, is judged that the use of honorifics is possible from the perspective of users as customers will be positive for users.

Keywords:
AI, Anthropomorphism, UX Writing, UX Design, Informal Speech, 의인화, UX 라이팅, UX 디자인, 반말.
pISSN: 1226-8046
eISSN: 2288-2987
Publisher: 한국디자인학회Publisher: Korean Society of Design Science
Received: 06 Jul, 2023
Revised: 06 Aug, 2023
Accepted: 13 Sep, 2023
Printed: 30, Nov, 2023
Volume: 36 Issue: 4
Page: 255 ~ 269
DOI: https://doi.org/10.15187/adr.2023.11.36.4.255
Corresponding Author: Soonkyu Jang (jeanskyu@kmu.ac.kr)
PDF Download:

Citation: Jang, S., & Suh, J. (2023). User Experience Research on the Differences in Linguistic Representation of Request about Informal Language from AI Assistant. Archives of Design Research, 36(4), 255-269.

Copyright : This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/), which permits unrestricted educational and non-commercial use, provided the original work is properly cited.

1. 서론

최근 음성 어시스턴트는 사람처럼 답변하고 말을 구사하는 기술로 인하여 발전하고 있다. 이 중에서 음성 어시스턴트와 사용자가 대화를 통해서 태스크를 수행하는 방식을 음성 인터페이스라고 한다. 이러한 음성 인터페이스는 사용자가 자신의 목소리를 통해서 직접 태스크 수행을 요청하고, 음성 어시스턴트는 태스크 수행의 결과를 TTS로 구현되는 목소리로 답변한다.

Wunderlich,&Paluch(2017)는 음성 인터페이스가 사람과 직접 대화를 주고받으며 태스크를 수행하기 때문에, AI를 보다 사람처럼 느끼도록 하는 목소리, 발화 방법의 의인화 정도가 사용자 정서에 영향을 미친다고 했다. 이러한 의인화 표현의 방법 하나로 언어의 문화 요소인 ‘반말’이 있다. 김광식(2014)은 반말이 심리적으로 대화의 주체 간 위계질서를 만든다고 했으나, Kim(2014)은 반말이 친근한 사이에서 구사되는 언어라 설명했다. 이처럼 반말은 청자와 화자가 서로 친근함을 표현할 때 구사할 수 있는 언어 요인이라 할 수 있다. 이러한 친근한 표현의 반말은 주로 화자와 청자가 서로 간의 간계를 인지하고 동의하에 구사하게 된다.

이에 본 연구는 인간의 언어문화인 반말을 음성 어시스턴트가 구사하게 될 경우에 집중한다. 이는 사용자와 AI 음성 어시스턴트의 대화 횟수가 누적되어 다소 친밀한 관계를 만들었을 때, 반말 구사에 대하여 동의를 요청하는 상황이다. 위 상황에서, AI 음성이 반말을 구사하도록 하는 동의에 있어 어떠한 요청이 사용자에게 긍정적인지 확인하고자 한다.

따라서, 본 연구는 AI 음성의 반말과 존댓말, 평서문과 질문을 중첩한 4가지 언어 표현의 방법 중 사용자 경험에 가장 긍정적인 방향을 찾고자 한다. 이는 UX 라이팅 관점에서 언어 표현 방식이 사용자에게 어떠한 심리를 만들고, 사용성에 영향을 미치기 때문이다. 이에, 가장 긍정적인 표현 방법을 발굴하여 AI와 사용자의 긍정적인 관계 수립에 도움이 되고자 한다.

2. 이론적 배경
2. 1. AI 음성의 언어 구사에 따른 의인화

AI 음성 인터페이스는 사용자와 대화를 통해서 태스크를 수행하고 결과를 음성이나 텍스트로 전달하는 환경을 뜻한다. 이러한 음성 인터페이스는 사용자가 AI를 호출하고 명령을 수행하는 구조로 구성되어 있다. Michael et al.(2004)은 사용자와 음성 인터페이스가 상호작용하는 모델을 <Figure 1>로 제시했다.


Figure 1 Interaction Model between User and System of AI

사용자와 AI의 인터랙션을 보다 긍정적으로 만들기 위한 방법으로서 보다 사람처럼 느끼도록 만드는 의인화가 있다. Schiaffino&Amandi(2004)는 AI 어시스턴트가 사람처럼 느껴지게 하는 의인화가 사용자에게 영향을 미친다고 제시했다. 이처럼 AI의 의인화가 미치는 영향에 대한 연구는 지속되고 있다. Lim et al.(2017)은 영화 Her의 AI인 사만다의 말투에서 드러나는 개성이 사용자의 호감에 영향을 미친다고 했다. Paek&Jung(2021)은 AI가 사람과 같은 목소리로 대화하면 호감에 영향을 미친다고 했다. 이처럼 AI 음성의 말투를 보다 사람처럼 느껴지도록 표현하는 의인화 접근은 사용자 경험에 영향을 미친다고 할 수 있다.

Jang&Lee(2019)는 인간 문화적 요인인 사투리를 AI 음성이 구사할 경우, 친밀감 및 사용성 증가에 영향을 미친다는 것을 확인했다. 이처럼 인간 문화의 부분을 AI 음성에 작용할 경우 사용자 경험에 영향을 미치게 된다. Clark(2018)는 언어적 개념으로서의 공손한 표현을 AI 음성이 구사할 경우 사용자에 미치는 영향을 연구했다. 하지만 이는 문화적 측면보다 대화 구성원 간 관계에 집중한 연구이다. 이에 본 연구는 상기 연구에서 고려하지 못한, 한국 언어문화인 반말에 집중하고자 한다.

2. 2. 반말 문화

언어는 특정 국가나 지역, 민족, 문화를 대표하는 요소이다. 동일한 문자, 언어를 구사하는 그룹 간에도 다소 표현에 차이가 있는 경우가 있다. 이러한 차이 중 하나로, 반말이 있다. 반말은 청자와 화자의 관계에 따라 언어 표현의 틀이 변화하는 문화 요소이다. 이처럼 언어의 틀이 변하는 것은 대우법(待遇法)의 영향 때문이다. 대우법은 언어 공동체 구성원 사이에서 공유되는 언어적 규범을 바탕으로, 청자와 화자가 적절한 언어를 선택해 말을 구사하는 법이다. 즉, 반말은 언어 공동체 구성원 사이에서 만들어진 관습법이라 할 수 있다.

반말은 국가와 문화에 따라 다소 차이가 있다. 유럽 및 북미 문화권에는 존중어(formal)와 평어(informal)로 구분되는 언어적 표현이 있다. 이는 관계는 동등하나 상대를 높이는 표현의 차이로 구분되는 언어적 차이이다. 한국과 언어 구조가 다소 유사한 일본의 경우에는 평어, 존경어, 겸양어로 구분한다. 즉, 한국과 일본의 문화권에서는 대화 구성원 사이의 위계질서가 형성되어 언어 표현에 차이가 만들어진다고 할 수 있다. 이처럼, 위계질서에 기반하여 윗사람이 아랫사람에게 구사하는 언어 표현 중 하나가 반말이다.

이 외, 친근감을 표현하기 위한 수단으로 반말이 구사되기도 한다. Ren(2018)은 위계질서가 없는 청자와 화자 사이에서 오랫동안 지속된 상호작용을 통해 더욱 친밀한 사이로 인지된 시점에서 구사된다고 했다. Li(2002)는 친밀관계에서 구사되는 반말은 대화 구성원 사이의 암묵적이거나 명시적인 상호 동의하에 구성되며, 청자와 화자 사이의 긍정적인 친밀감을 유발하여 새로운 관계 정립에 영향을 미친다고 했다.

이에 본 연구는 문화적으로 반말이 미치는 영향이 AI와 사용자 사이의 인터랙션에 어떠한 영향을 미치는지 확인하고자 한다. 이는 현재 반말을 구사하는 AI에 대한 연구가 부족한 실정이기 때문이다.

2. 3. UX 라이팅

UX 라이팅(writing)은 사용자 경험이나 브랜드 경험을 향상하도록 인터페이스 안에 보이는 언어와 텍스트 구성을 다루는 업무다. Kwon(2021)은 텍스트 문구가 사용자 경험과 브랜드 경험에도 영향을 미치기 때문에, 친숙하고 명료한 표현으로 긍정적인 영향을 미쳐야 한다고 했다. Podmajersky(2019)는 문맥에 맞는 대화 패턴이 필요하며, 사용자 행동을 자연스럽게 유발하는 마이크로 카피가 전략적으로 필요하다 했다. Yifrah(2019)는 UX 라이팅은 사용자가 제품이나 서비스를 사람처럼 느끼게 하는 방법이며, 사용자의 마음을 얻고 반응하는 데 감정적 연결 고리를 만든다고 했다. Jeong&Yeoun(2022)은 UX 라이팅을 표현, 지시, 설명, 알림, 경고 등의 요인을 통해서 사용자가 확신을 갖고 다음 태스크를 수행하도록 하는 컨트롤이라 했다. Jung&Lee(2022)는 UX 라이팅과 광고업계의 카피, 기술적 글쓰기의 차이를 <Table 1>처럼 제시했다.

Table 1
Differences in Writing among UX, Copy and Technical

Case Explanation
UX writing 사용자가 제품/서비스를 쉽게 이해하고, 원하는 행동을 할 수 있도록 도와주는 글
Copy writing 제품/서비스를 경험하지 못한 고객을 대상으로 제품/서비스를 매력적으로 포장하는 글
Technical writing 제품/서비스를 이용하는 고객을 대상으로 사용 방법을 설명하기 위해서 작성하는 글

문헌 조사를 통해, UX 라이팅은 문구, 알림, 경고 등의 정보 전달 수단을 통해서 사용자가 다음 단계의 태스크를 수행하는 데 있어 자신감을 가지고 행동할 수 있도록 도와주는 요소라 할 수 있다.

본 연구는 위 내용을 바탕으로 AI 음성이 사용자의 태스크 요청에 미치는 영향을 UX 라이팅의 관점을 바탕으로 살펴보고자 하며, 이를 통해 AI의 반말 구사가 VUI 발화 디자인에 영향을 미칠 것임을 설명하고자 한다. 이는 문헌 조사를 통해 파악한 UX 라이팅의 목적이 사용자에게 다음 단계의 태스크 수행에 대한 정보를 전달하는 VUI 발화 디자인의 목적과 유사하기 때문이다.

3. 연구 방법
3. 1. 연구 접근

문헌 조사를 통해, 반말은 친한 관계의 사람 사이에서 구사되는 언어 관습임을 확인했다. Kwon(2023)은 AI와 사용자의 관계가 다소 친밀할 경우에 반말로 태스크 결과를 전달하는 상황이 사용자 경험에 긍정적이라 했다. 하지만, 반말을 구사하는 상황에 집중한 결과이기 때문에, 반말을 요청하게 되는 상황을 다루지 못하였다. 본 연구는 반말 요청 상황에 집중한다. 반말은 대화 구성원 사이에서 친밀감이 형성된 뒤에 암묵적으로 구사할 수도 있으나, 기본적으로 구성원 간의 상호 동의하에 구사되기 때문이다.

Kim et al.(2022)은 AI가 사용자의 사용 패턴을 분석하여 필요한 태스크를 먼저 요청하는 능동적 AI의 인터랙션이 트렌드가 될 것이라 분석했다. 이에 본 연구는 AI 음성 어시스턴트가 사용자와의 누적된 대화 횟수로 친밀감을 형성한 상황에서 AI 음성의 반말 구사 요청 방법에 집중한다.

이를 위해, AI 음성이 반말 구사를 요청하는 단계에서 긍정적인 사용자 경험을 유발하는 UX 라이팅의 관점을 바탕으로 한 콘셉트 VUI 발화 디자인을 한다. 이는 반말을 구사하는 방법에 대한 AI 어시스턴트의 요청 문구를 음성으로 전달하는 상황의 디자인이다. 이를 위해 설정한 요소들은 다음과 같다.

3. 2. 언어 표현 차이(독립변수)

본 연구는 AI 음성 어시스턴트가 반말 구사를 하기 위해서 사용자에게 요청하는 발화 문구를 2가지 요인으로 구분하고자 한다.

첫째, 반말, 존댓말의 구분이다. AI 음성이 반말을 구사하기 전, 사용자와의 대화는 존댓말을 기반으로 이루어졌다. 그리고, 대화가 누적되어 다소 친밀감이 쌓인 상황에서, 반말이 구사될 것이다. 이에, 실험에서는 존댓말로 태스크를 요청하는 방법과 가볍게 반말로 태스크를 요청하는 2가지 표현 방법을 구분하고자 한다.

둘째, 평서문과 의문문의 구분이다. 평서문은 목소리의 높낮이 변화가 적은 구조로 설정했고, 의문형은 문장 끝에서 질문을 하듯 목소리 톤을 높이는 방식으로 된 구조로 설정하였다.

위 요인의 차이를 적용한 사분면은 <Figure 2>와 같다.


Figure 2 Cases Classification of Independent Variables
3. 3. 사용자 경험 요인(종속변수)

본 연구는 사용자 경험을 종속변수로 설정한다. 이는 AI 음성이 태스크 수행을 위해 전달하는 말투의 방법을 측정하기 위함이다. 이를 위해, 문헌 조사를 통해서 확인한 AI의 사용자 경험 평가 요소를 종속변수로 설정한다. 이는 다음과 같다.

시스템이 사용자가 얼마나 예측하며 수용할 정도인지 확인하는 사용성, 신뢰감, 만족감이다.(Lim et al., 2017; Hanafuzadeh et al., 2014). 그리고, 사용에 대한 어려움, AI에 대한 믿음과 친밀감이다.(Kim, 2021,; Jang&Lee, 2019). 더하여, 문헌 조사에서 서비스에 대한 사용자 경험을 평가하는 요인으로 확인한 만족도, 기술 수용도, 지속 사용 의도를 추가한다.(Xu, 2018,; Hu et al., 1992).

위 요인은 독립변수를 모두 평가할 때 너무 많은 질문으로 피험자가 지루함 혹은 스트레스로 답변을 대충 하게 되는 상황을 통제하기 위해 단 문항으로 구성한다.

Table 2
Factors of User Experience for Survey

Factors Notification
사용성 본 요청을 이해하고 사용하는 데 어려움이 없었나요?
신뢰감 본 요청에 대하여 믿음이 가셨나요?
친밀감 본 요청이 친하게 느껴지셨나요?
만족감 본 요청에 대하여 어느 정도 만족하셨나요?
기술 수용도 본 요청에 대하여 순응할 수 있는 수준이었나요?
재사용 의도 본 기능을 반복하여 사용할 의사가 있나요?

3. 4. 사용자 성별의 차이(조절변수)

본 연구는 실험 참여자의 성별을 조절변수로 설정한다. Lee(2018)는 사람을 대하는 서비스에서 반말 문화는 성별에 따라 위계를 중층적으로 드러내게 되는 수단이 된다고 했다. 즉, 성별의 차이는 반말을 수용하는 조건에서 타협적이거나, 수용적인 주체성을 요구받을 수 있다고 하였다.

이에 AI가 친밀감이 축적된 상황에서 반말을 요구하는 경우, 사용자의 성별 차이가 사용자 경험에 영향을 미칠 수 있는지 확인하고자 한다.

3. 5. 실험 설정

실험을 위해서 사용자의 태스크 시나리오는 <Figure 4>와 같이 설정했다. 그리고 유형별 말투는 <Table 3>처럼 설정했다. 유형 C와 D는 동일한 문장에서 질문의 경우는 어조를 높이고, 평서문은 낮추는 차이를 두었다. 이를 바탕으로 연구 모형과 가설을 설정한다.


Figure 3 The Task Process for Experiment

Figure 4 Research Model
Table 3
UX writing of Voice assistant for each Cases

Case UX writing
A (존댓말 + 질문) 그렇다면 이제 말을 놓아도 될까요?
B (존댓말 + 평서문) 그렇다면 이제 말을 놓겠습니다.
C (반말 + 질문) 그렇다면 이제 말을 놓자?
D (반말 + 평서문) 그렇다면 이제 말을 놓자.

실험물에 사용한 AI 음성은 네이버의 AI인 클로바 더빙 서비스에서 무료로 제공하는 ‘아라’ 음성으로 구성하였다. 실험물 유형을 통제하기 위해서, 동일한 음성으로 설정하였다. 실험물에서 사용자와 AI의 관계 정립에 대한 상황 설정 및 인식을 위해, 자주 듣던 음악을 재생했으니 친한 관계가 된 것이라 발언한다. 연구 모형은 <Figure 4>, 연구 가설은 <Table 4>와 같다.

Table 4
Research Hypothesis

H Content
H1-1 언어 표현의 차이는 사용성에 영향을 미칠 것이다.
H1-2 언어 표현의 차이는 신뢰감에 영향을 미칠 것이다.
H1-3 언어 표현의 차이는 친밀감에 영향을 미칠 것이다.

4. 실험 결과

본 실험은 2023년 6월 17일부터 30일까지, AI 사용이 다른 연령대보다 높은 20~30대를 중심의 피험자를 대상으로 진행되었다.(Lee et al., 2019). 실험은 온라인에 제시된 연구 소개와 프로토타입으로 구성된 실험물을 경험하고 5점 리커트 척도를 평가하는 방식으로 진행되었다. 상기의 조사가 끝나면, 피험자에게 평가에 미친 개인의 의견을 주관식으로 답변하도록 하는 비구조식 질문을 추가로 제시했다. 이는 정량 조사로 확인할 수 없는 사용자의 생각을 수집하기 위함이다.

실험은 온라인을 통해 진행하되, 프로토타입이 가능한 실제와 같이 느껴지게 하도록 환경을 구성하였다. 이를 위해, 프로토타입을 영상으로 만들어 스마트폰에서 보이도록 구성하되, 전체화면으로 보이도록 세로 중심 비율의 쇼츠 영상으로 실험물을 공유하였다. 실험에는 총 97명이 참여하였고, 남성은 43명, 여성은 54명이었다. 본 실험에 참여한 피험자는 총 30명 이상의 중심극한정리 상황이기에 정규성을 가정하고 분석을 진행한다.

4. 1. ANOVA 분석 결과

본 실험에서 제시한 유형별 사용자 경험의 차이를 분석하기 위해 일원변량분석을 진행했다. 그리고, 피험자가 모든 유형을 평가하여 표본수가 동일하기에 Tukey 사후분석을 진행했다. 실험 결과, 각 언어 표현의 차이는 모든 사용자 경험 요인에서 유의변수 0.05보다 낮았다.(p < 0.05). 따라서, 각 언어 표현의 차이는 유의하다는 것을 확인했다. 이에 H1의 모든 가설을 채택한다. 추가로, 존댓말, 질문의 A 유형이 모든 사용자 경험에서 가장 긍정적이었다. 그리고 존댓말 기반의 A, B 유형이 반말의 C, D 유형보다 긍정적인 것을 확인했다. 더하여, 질문 유형이 같은 존댓말, 반말의 그룹에서 긍정적인 것을 확인했다.

Table 7
Result of ANOVA

(n=97)



Dependent
Variable
Case M SD F Sig Post-hoc
사용성 A 4.41 .625 107.335*** .000 A > B > C > D
B 3.99 .674
C 3.32 .789
D 2.65 .751
신뢰감 A 4.38 .620 130.682 .000 A > B > C > D
B 3.96 .660
C 3.43 .749
D 2.58 .643
친밀감 A 4.45 .629 129.616*** .000 A > B > C > D
B 3.95 .667
C 3.36 .664
D 2.72 .625
만족감 A 4.44 .612 241.333*** .000 A > B > C > D
B 3.81 .546
C 3.27 .621
D 2.25 .578
기술 수용도 A 4.45 .610 273.715*** .000 A > B > C > D
B 3.95 .574
C 3.36 .601
D 2.72 .610
재사용 의도 A 4.52 .597 274.948*** .000 A > B > C > D
B 3.96 .576
C 3.09 .647
D 2.19 .601
* p ≤ 0.05, ** p ≤ 0.01, *** p ≤ 0.001

4. 2. 사용자 성별 차이(조절변수) 분석 결과

본 실험은 피험자의 성별을 구분하여 조절효과를 확인한다. 이를 위해, 언어 표현의 차이와 사용자 성별 차이의 명목형 변수를 2가지로 설정하여 이원변량분석(2-way ANOVA)을 진행한다. 실험 결과, 남녀 성별의 차이는 유의변수 0.05보다 낮음으로, 유의한 차이가 있다는 것을 확인했다.(p < 0.05). 더하여, 모든 사용자 경험 요인에서 부분 에타제곱의 값이 0.14보다 높았다. 이에, 성별 차이는 언어 표현 차이에 강력한 효과를 미친다는 것을 확인했다. 이에, H2의 모든 가설을 채택한다.

Table 6
Results of moderating effect analysis

(n=97)



Source Dependent Variable F Sig Eta squared
언어표현차이*
사용자성별
사용성 6.135 .000 .046
신뢰감 12.114 .000 .087
친밀감 13.634 .000 .097
만족감 9.771 .000 .072
기술 수용도 3.293 .021 .025
재사용 의도 9.365 .000 .069
* p ≤ 0.05, ** p ≤ 0.01, *** p ≤ 0.001

성별의 차이가 유의하다는 결과를 바탕으로, 피험자의 성별을 구분하여 일원변량분석을 재차 진행하였다. 이는 각 성별 집단군에서 나타나는 차이를 명확히 확인하기 위함이다. 남성 피험자 집단에서 언어 차이는 사용자 경험 요인에서 유의한 차이를 보였다.(p < 0.05). 하지만, 사후분석 결과에서는 사용성, 신뢰감, 친밀감, 만족감의 요인에서 존댓말 평서문 B 유형과 반말 질문의 C 유형이 같은 그룹으로 묶인 것을 확인했다. 이에, 남성 피험자 집단에서 무의한 차이가 있다는 것을 확인했다.

Table 7
Result of ANOVA for man

(n=43)



Dependent
Variable
Case M SD F Sig Post-hoc
사용성 A 4.49 .631 48.545*** .000 A > B = C > D
B 3.84 .652
C 3.77 .527
D 2.81 .764
신뢰감 A 4.40 .660 54.962*** .000 A > B = C > D
B 3.72 .630
C 3.81 .732
D 2.63 .578
친밀감 A 4.51 .592 58.766*** .000 A > B = C > D
B 3.67 .644
C 3.72 .549
D 2.77 .866
만족감 A 4.63 .578 144.718*** .000 A > B = C > D
B 3.63 .489
C 3.47 .592
D 2.12 .586
기술 수용도 A 4.58 .587 124.817*** .000 A > B > C > D
B 3.84 .615
C 3.33 .606
D 2.12 .625
재사용 의도 A 4.44 .629 88.903*** .000 A > B > C > D
B 3.91 .570
C 3.44 .619
D 2.37 .975

여성 피험자 집단에서도 언어 차이는 모든 사용자 경험 요인에서 유의한 차이가 있다는 것을 확인했다.(p < 0.05). 하지만, 여성 집단에서는 반말의 C, D 유형이 사용성, 신뢰감, 친밀감, 만족감에서 차이가 무의하다는 것을 확인했다.

Table 8
Result of ANOVA for woman

(n=54)



Dependent
Variable
Case M SD F Sig Post-hoc
사용성 A 4.35 .619 73.729 .000 A > B = C > D
B 4.20 .711
C 2.96 .800
D 2.52 .720
신뢰감 A 4.37 .592 100.360 .000 A > B = C > D
B 4.15 .627
C 3.13 .616
D 2.54 .693
친밀감 A 4.41 .659 97.179 .000 A > B = C > D
B 4.16 .607
C 3.07 .610
D 2.69 .609
만족감 A 4.30 .603 157.981 .000 A > B = C > D
B 3.96 .548
C 3.11 .604
D 2.35 .555
기술 수용도 A 4.31 .603 123.833 .000 A > B > C > D
B 4.02 .532
C 3.07 .587
D 2.11 .604
재사용 의도 A 4.57 .570 229.797 .000 A > B > C > D
B 4.00 .583
C .281 .517
D .204 .548
* p ≤ 0.05, ** p ≤ 0.01, *** p ≤ 0.001

4. 3. 주관식 답변 결과

본 실험은 정량 분석의 결과를 보완하기 위해서, 설문조사 후 간단한 주관식 질문을 통해서 수집한 데이터를 오픈코딩으로 정리한다. 이는 정량 분석의 결과를 통해 확인한 유의한 차이에 영향을 미치는 환경, 요인 등을 면밀히 확인하기 위한 정성 분석이다. 실험에서 반복되거나 유사한 의견을 묶어서 영향을 미치는 5가지 상황을 정리하였다.

첫째, 존댓말로 질문하는 유형이 사용자에게 가장 긍정적이다. 이는 실험 결과에서 존댓말과 질문의 A 유형이 모든 사용자 경험에서 긍정적인 평가를 받고, 모든 유형 간 차이가 유의미했기 때문이다. 더하여, AI가 반말로 문의하는 유형은 존댓말 유형보다 모두 부정적이었다. 피험자들은 서비스 관점에서 사용자보다 낮은 위치의 서비스 제공자인 AI가 반말을 구사하는 것이 부정적이라 했다. 또한, 질문을 통해서 서비스에 대한 요구를 명확하게 물어보는 것이 정보 전달에 오류가 없을 것이라 했다. 이는 평서문 말투가 질문이 아닌 강요, 통보로 느껴질 수 있다고 했다.

“AI는 서비스 관점에서 사용자에게 서비스를 제공하는 대상자라 존댓말로 물어보는 것이 맞다 싶다. 어떠한 서비스든 친해지기 전에 고객에게는 최대한 존대하기 때문이다.” (피험자 8)
“서비스 자체에서 급작스럽게 반말을 하는게 컨셉이 아니라면, 갑자기 말을 내려두면 기분이 나빠질 것 같다. 서비스를 제공받는 입장에서 나보다 낮은 위치가 아닌가.” (피험자 56)
“질문으로 물어봐야지 요청하는지 이해할 것 같다. 질문이 아닌 말투는 강요하거나 통보하는 것처럼 느껴졌다.” (피험자 34)
“질문하지 않으니 요청인지 태스크 수행 답변인지 헛갈린다. 정보 오류를 줄이기 위해 가능한 AI는 질문하는게 옳은 듯.” (피험자 79)

둘째, 질문과 평서형의 뉘앙스 차이는 사용자에게 영향을 미친다. 이는 동일한 존댓말, 반말 내 질문과 평서형 유형 중에서 질문이 보다 긍정적으로 평가되었기 때문이다. 이와 관련하여 피험자는 질문의 뉘앙스에서 느끼지 못하는 부분을 평서형에서 느끼는 경우에 대한 답변을 하였다. 이는 반말 평서형으로 전달하면, 비꼬는 느낌이 든다고 한 부분이다. 더하여, 평서형으로 물어보는 경우는 통보나 명령으로 느껴져 어감이 묘하다는 의견을 제시했다.

“질문으로 물어보면 반말이든 존댓말이든 정말 몰라서 물어본다는 인식이 드는데, 평서형은 명령을 하거나 통보하는 느낌이 들어서 어감이 묘하게 느껴졌다.” (피험자 36)
“반말을 할 때, 언니라던가, 존대를 할 대상이라는 명칭이 없이 반말을 하니까 약간 비꼬는 것 같은 느낌이 든다..” (피험자 83)

셋째, 성별에 따라 AI 음성의 발화 방법에서 느끼는 부분이 다르다. 실험에서 피험자의 성별 차이가 유의한 영향을 미치는 결과를 확인했다. 남성 사용자는 존댓말 질문이 아니면 존댓말과 반말에 있어 심리적으로 다소 영향을 받지 않을 수도 있다. 이는 사후검정에서 존댓말 평서문과 반말 질문의 차이가 사용성, 신뢰감, 친밀감, 만족감에 미치는 차이가 무의미했기 때문이다. 피험자는 AI가 존댓말 평서문으로 문의하는 것이 다소 통보하는 것 같고, 반말 질문은 친해지고 싶어 티를 내는 느낌이라고 했다. 여성 사용자의 경우, 여성 집단은 반말에 대하여 무엇이 되었든 부정적인 입장이다. 이는 존댓말 유형과 반말 유형의 차이가 유의미하나, 반말 간 사용성, 신뢰감, 친밀감, 만족감 차이가 무의미했기 때문이다. 피험자는 반말을 급작스럽게 구사하면 윗사람 혹은 다소 힘이 있는 사람이 강압적으로 요구하는 느낌이 든다고 했다.

“존댓말로 물어보지 않고 말하니까 이미 반말 한다는 통보로 느껴진다. 반말로 물어보는 건 조금 귀여운 느낌이다. 보통 친해지면 형들에게 반말로 말 놓는다는 경험처럼 느껴져서 부정적이란 생각은 들지 않았다.” (피험자 5, 남성)
“보통 윗사람이나 힘이 있는 사람이 좀 강압적으로 말하거나 할 때 반말로 세게 말한다. 그런 점에서 무섭게 느껴지거나 좋지않던 경험이 있어서 AI가 반말하는 건 좀 부정적이다.” (피험자 35, 여성)
“아니 꼽게 보거나 조금 기분이 상할 때 갑자기 반말을 하는 경우가 있다. 이건 여자가 많은 무리인 여대나 회사에서 남자들하고 조금 다른 문화에서 오는 경험 때문에 좋지 않게 느껴졌다.” (피험자 77, 여성)

넷째, AI의 보이스의 성별이 다르다면, 결과가 다를 수도 있을 것이다. 본 연구는 시리의 기본 보이스인 여성 보이스로 실험을 진행하였다. 이에 대해 피험자는 AI의 보이스가 남성일 경우 느껴지는 전문성, 분위기가 달라질 수 있을 것이라 제시했다. 이는 Shin et al.(2022)이 AI 보이스의 성별 차이가 사용자 감성에 영향을 미칠 것이라 분석한 내용과 같다. 즉, 반말을 요청하는 태스크에서 AI의 보이스가 남성, 여성일 때에 차이가 있으리라 예측할 수 있다. 이에, 추후 연구에서는 남녀 보이스 차이가 반말 요청을 하게 될 경우 미치는 영향을 보다 면밀히 조사하고자 한다.

“남자와 여자가 반말하자 할 때 분위기가 다르다. 남자가 갑작스레 요구하면 조금 무서울 수도 있다고 생각한다. 따라서 AI 목소리가 남자, 여자일 때 차이가 있지 않을까 한다.” (피험자 32)
“실험에서 시리가 여성 목소리로 물어보는데, 남성이 진중하게 반말해도 되는지 묻는다면 느낌이 다르지 않을까 싶다. 또, 말 놓을까 묻는 목소리가 젊은 여성이나 남성이면, 받아들이는 사람마다 느낌이 다르지 않을까.” (피험자 47)
5. 결론 및 제언

본 연구는 사람처럼 느끼도록 하는 의인화 요인인, 한국 언어문화 ‘반말’을 AI가 구사하기 전 상황에서 VUI 발화 디자인의 차이가 사용자 경험에 미치는 영향을 확인하고자 했다. 이를 위해, 화자와 청자가 친밀해진 관계에서 반말 구사에 대한 동의를 구하는 상황에 집중했다.

5. 1. 이론적 함의

본 연구는 AI가 사용자에게 반말 구사를 위해서 요청하는 말투를 존댓말, 반말과 질문, 평서문으로 구분한 4가지 요인으로 실험을 진행하였다. 이는 UX 라이팅 측면에서 사용자가 가장 긍정적으로 느끼는 텍스트 구성을 확인하기 위함이다. 위 4가지 유형을 6가지 사용자 경험을 통해 조사한 결과는 다음과 같다.

첫째, AI가 존댓말로 반말해도 될지 질문하는 말투가 긍정적인 사용자 경험을 유발할 것이다. 이는 실험 결과에서 존댓말과 질문의 유형이 모든 사용자 경험에서 긍정적이었으며, 유형 간 차이는 유의했기 때문이다. 또한, 반말로 반말 구사를 문의하는 말투는 사용자에게 부정적인 경험을 유발한다. 이는 반말로 구성된 2가지 유형이 가장 부정적으로 평가받았기 때문이다.

둘째, 사용자의 성별에 따라 느껴지는 경험이 다를 수 있다. 이는 반말 구사를 위해 AI가 문의하는 말투에 있어 사용자 성별의 차이가 유의한 영향을 미치기 때문이다. 남자 집단은 존댓말 평서문과 반말 질문이, 여성 집단은 반말의 질문과 평서문이 사용성, 신뢰감, 친밀감, 만족감에서의 차이가 무의하다는 것을 확인했다. 하지만, 서비스 평가요인인 기술 수용도와 재사용 의도에서 차이는 유의하였다. 따라서, 반말 유형은 존댓말 유형보다 부정적인 경험을 유발할 것이라 할 수 있다.

5. 2. 실증적 함의

본 연구는 상기의 정량조사 결과와 주관식 답변의 정성조사 내용을 바탕으로 다음과 같이 실험 결과를 정리한다.

첫째, 서비스를 제공받는 고객의 입장인 사용자 관점에서 AI가 존댓말로 사용자에게 문의하는 것이 긍정적이다. 이는 실험 결과에서 존댓말 질문이 가장 긍정적이었고, 존댓말 평서문이 2번째로 긍정적이었기 때문이다. 사용자 성별의 차이가 유의했으나, 남녀 집단에서 반말은 부정적인 경험을 유발할 수 있음을 확인했다. 이는 남성 집단에서 반말 평서문은 사용자 경험에 부정적이었으며, 반말 질문은 존댓말 평서문보다 서비스 요인에서는 부정적이었고 그 차이가 유의했기 때문이다. 그리고 여성 집단에서는 반말 자체가 존댓말 유형보다 부정적이며 그 차이는 유의했다. 피험자는 집단에 따라 반말이 강압적으로 느껴질 수 있거나, 서비스 제공처가 반말하는 것이 심리적으로 불편하다는 의견을 제시했다.

둘째, 남녀의 성별 차이에 따른 유의한 영향이 있기 때문에, UX 라이팅 측면에서 사용자 상황을 고려해야 할 것이다. 이는 사용자 성별의 차이가 조절효과로 유의했기 때문이며, 피험자의 남녀 집단 사이에서 다른 결과가 있기 때문이다. 즉, 여성 사용자 집단에서는 AI가 반말로 문의하는 것은 가능한 피하는 것이 긍정적이다. 하지만, 남성 집단에서는 AI의 반말 질문 구사가 여성 집단에 비해서 다소 덜 부정적 일 수 있다는 점을 고려할 수 있다. 이는 남성 집단에서 반말 질문과 존댓말 평서문이 사용성, 신뢰감, 친밀감, 만족감에서 차이가 무의했기 때문이다. 하지만, 성별에 따라 반말 요청 방법의 영향이 다르게 작용하더라도, 서비스 평가 측면에서 존댓말 평서문보다 부정적이라는 결과를 바탕으로, 되도록 AI가 반말로 문의하지 않는 것이 긍정적일 것으로 판단한다.

셋째, 정보의 오류가 없기 위해서, 가능한 질문을 활용하는 것이 긍정적일 것이다. 실험 결과에서 평균적으로 존댓말, 반말의 동일한 어투 그룹에서 질문이 평서문보다 긍정적이었다. 피험자는 AI가 반말을 구사하겠다는 확답을 받기 위해서 질문이 나을 것이라 했다. 즉, AI가 질문을 하지 않는 평서문은 사용자의 요청을 처리했다는 결과를 알려주는 착각을 일으킬 수 있음을 유의해야 할 것이다.

5. 3. 연구의 한계

본 연구의 한계는 애플의 AI 시리의 사용 경험이 충분히 많은 경우가 사용자에게 미치는 영향을 확인하지 않은 데 있다. 즉, 사용자의 누적된 경험이 미치는 부분에 대하여, 피험자 설정에 한계가 있다고 할 수 있다. 이는 본 실험물의 UI 디자인이 시리 기반이기 때문이다.

또한, 20대 여성의 음성을 바탕으로 구성되어 있기 때문에, 다른 성별 및 연령대의 음성일 경우 사용자에게 미치는 세밀한 차이를 확인하지 못하였다. 사용자의 성별, 연령대에 따라 AI의 음성에서 인지되는 의인화가 다른 영향을 미친다는 Oh&Kwon(2020)의 연구 결과처럼, 추후 연구로 AI 음성에 성별, 연령대의 요인의 미치는 영향을 확인하고자 한다.

References
  1. 1 . Clark, L. (2018). Social Boundaries of Appropriate Speech in HCI: A Politeness Perspective, Proceedings of the 32nd International BCS Human Computer Interaction Conference, 1-5. [https://doi.org/10.14236/ewic/HCI2018.76]
  2. 2 . Hanafizadeh, P., Keating, B., & Khedmatgozar, H. (2014). A systematic review of internet banking adoption. Telematics and Informatics, 31(3), 492-510. [https://doi.org/10.1016/j.tele.2013.04.003]
  3. 3 . Hu, P., Chau, P., Sheng, O., & Tam, K. (1992). Examining the technology acceptance model using physician acceptance of telemedicine technology. Journal of Management Information Systems, 16(2), 91-112. [https://doi.org/10.1080/07421222.1999.11518247]
  4. 4 . Jang, S., & Lee, J.(2019). User Experience Research on Intimacy and Usability When an AI Voice-Activated Personal Assistant Uses a Dialect. Archives of Design Research, 32(4), 71-82. [https://doi.org/10.15187/adr.2019.11.32.4.71]
  5. 5 . Jeong, C., & Yeoun, M. (2022). A Study on User Experience for UX Writing in Fintech. KSDS Conference Proceeding, 146-147.
  6. 6 . Keshtche, Y. (2022, May). UX Writing Salaries in 2022: Survey Rep. Retrieve from https://uxwritinghub.com/ux-writing-salary-survey/.
  7. 7 . Kim, E. (2019). Measuring the User Experiences Using Bio-Signal for Explainable AI (XAI) Problems. (Unpublished Master thesis). Kookmin University, Seoul, Korea.
  8. 8 . Kim, H. (2014). A Study on Establishing Grade of Panmal Style in Korean Speech. Korean Language in China, 2014(3), 29-34.
  9. 9 . Kim, K. (2014). Für die gemeinsame Nutzung von Duzen in der koreanischen Gesellschaft: Duzen-Manifest einer kognitiv-kulturellen Philosoph. Korean Society for Social Philosophy, 28, 25-40.
  10. 10 . Kim, N., Jeon, M., Choi, J., Lee, S., Kwon J., Lee, J., Lee, H., Han, D., Lee, H., & Choo, Y. (2022). Trend Korea 2023. Seoul: miraebook.
  11. 11 . Kwon, M., Park, H., Lee, S., & Jang, S. (2023). Research on the Circumstance and Command about Informal Speech Request of AI Voice Assistant. Korea HCI Conference Proceeding, 1218-1223.
  12. 12 . Kwon, O. (2021). Starting with UX Lighting Message - Guide for Managing Customer Experience. Seoul: UX Review.
  13. 13 . Lee, H. (2018). Elderspeak and Elderly Subjectivity among Female Patients in South Korea : Gender Politics of Care. Cross-Cultural Studies, 24(2), 397-430. [https://doi.org/10.17249/CCS.2018.08.24.2.397]
  14. 14 . Li, S. (2002). The Position of Informal speech and Informal Speech in the Listener's Treatment Method. Korean Language in China, 2002(5), 28-31.
  15. 15 . Lim, J., Shin, M., Moon, H., Yoon, J., Jeong, T., Lee, Y., & Yu, S. (2017). AI Robot Anthropomorphism Study : A Semantic Network Analysis of AlphaGo Press Coverage. Korean Journal of Journalism & Communication Studies, 61(4), 113-143. [https://doi.org/10.20879/kjjcs.2017.61.4.004]
  16. 16 . Lim, T., Lee, S., Park, S., & Lee, S. (2017). Antecedents and Consequences of Customer Experience in Internet Shopping Environments. Asia-pacific Journal of Multimedia Services Convergent with Art, Humanities, and Sociology, 7(7), 633-645. [https://doi.org/10.14257/AJMAHS.2017.07.14]
  17. 17 . Oh, E., & Kwon, G. (2020). Effects of Perceived Anthropomorphism on Acceptance of Voice AI Agent - Focusing on the Comparison by Gender and Age. Korea HCI Conference Proceeding, 31-42. [https://doi.org/10.17210/jhsk.2020.09.15.3.31]
  18. 18 . Paek, S., & Jung, Y. (2021). A Study on the Users'Response to Voice Characteristics of AI Speakers. Proceedings of Symposium of the Korean Institute of communications and Information Sciences, 749-750.
  19. 19 . Podmajersky, T. (2019). Strategic Writing for UX: Drive Engagement, Conversion, and Retention with Every Word. CA: O'Reilly Media.
  20. 20 . Ren, H. (2018). A study on non-honorific expressions of Korean language education plan by using webtoons : focused on social factors and expression forms. (Unpublished Master thesis). Chungang University, Seoul, Korea.
  21. 21 . Shin, G., Kang, J., Park, Y., & Kim, S. (2022). Moderating Effects of User Gender and AI Voice on the Emotional Satisfaction of Users When Interacting with a Voice User Interface. The Korean Society For Emotion & Sensibility, 25(3), 127-134. [https://doi.org/10.14695/KJSOS.2022.25.3.127]
  22. 22 . Schiaffino, S., & Amandi, A.(2004). User-interface agent interaction: Personalization issue. International Journal of Human-Computer Studies. 60, 129-148. [https://doi.org/10.1016/j.ijhcs.2003.09.003]
  23. 23 . Wunderlich, V., & Paluch, A. Nice and Friendly Chat with a Bot : User Perceptions of AI Based Service Agents. ICISDM '17: Proceedings of the 2017 International Conference on Information System and Data Mining, 6-7.
  24. 24 . Xu, Y. (2018). A Study on User Satisfaction and Intention of Continuous use of IoT-Based Healthcare Wearable Devices: Focusing on the Extend Unified Theory of Acceptance and Use of Technology(UTAUT2) and the Post Acceptance Model(PAM). (Unpublished Master thesis). Chungang University, Seoul, Korea.