Archives of Design Research
[ Article ]
Archives of Design Research - Vol. 32, No. 4, pp.71-83
ISSN: 1226-8046 (Print) 2288-2987 (Online)
Print publication date 30 Nov 2019
Received 03 Sep 2019 Revised 18 Nov 2019 Accepted 18 Nov 2019
DOI: https://doi.org/10.15187/adr.2019.11.32.4.71

AI 음성비서의 사투리 구사가 사용자의 친밀감과 사용성에 미치는 영향

Soonkyu Jang , 장순규 , Jihoon Lee , 이지훈
Department of Visual Communication Design, Student, Hongik University, Seoul, Korea 홍익대학교 시각디자인과, 학생, 서울, 대한민국 Department of Visual Communication Design, Student, Hongik University, Seoul, Korea 홍익대학교 시각디자인과, 학생, 서울, 대한민국
User Experience Research on Intimacy and Usability When an AI Voice-Activated Personal Assistant Uses a Dialect

Correspondence to: Soonkyu Jang jeanskyu@gmail.com

초록

연구배경 본 연구는 음성 기반의 AI 에이전트가 사투리를 구사하는 경우에 나타나는 친밀성 증가와 사용성 증가에 대해 연구하였다.

연구방법 수도권, 충청도, 경상도, 전라도 지역 출신의 참가자들을 각각 25명씩 편의 추출로 모집하여 표준어를 사용하는 AI 음성비서와 지역별 사투리를 사용하는 에이전트를 사용하도록 요구하였다. 참가자들은 사전에 작성된 16개의 질문 목록 중 4개를 임의적으로 질문하였다. 모든 실험이 종료된 이후에 정서적 친밀성, 인지적 친밀성, 사용성에 대한 설문을 참여자들에게 작성하도록 하였다.

연구결과 정서적 친밀성에서 수도권 지역을 제외한 모든 지역의 참가자들은 출신 지역의 사투리를 사용하는 AI 음성비서에게 더 높은 친밀성을 느꼈다. 인지적 친밀성에서는 수도권 지역을 포함한 모든 지역의 참가자들이 출신 지역의 사투리를 구사하는 AI 음성비서에게 더 높은 친밀성을 느꼈다. 사용성에서는 모든 참가자들이 타 지역의 사투리를 사용하는 AI 음성비서에 비하여 출신 지역의 사투리를 사용하는 음성비서가 더 사용성이 높다고 평가하였으나 표준어를 사용하는 음성비서와는 사용성 부분에서 통계적으로 유의미한 차이가 나타나지 않았다.

결론 본 연구의 결과는 사용자와 AI 음성비서 사이에 있어 친밀감 향상을 위한 전략을 수립하는데 기여할 것으로 사료된다. 또한 기업이 사용자의 개인 정보에 맞는 사투리를 구사하는 전략을 세우는데 도움이 될 것으로 생각된다. 더불어, 사용자와 관련 없는 타 지역의 사투리를 AI 음성비서가 구사하는 경우 부정적인 영향을 미칠 수 있기 때문에, 상황에 따른 음성 서비스 제공이 중요할 것으로 판단된다.

Abstract

Background Personification is becoming important in efforts to increase the intimacy between users and artificial intelligence assistants. While previous studies have tried to personify artificial intelligent assistants in various ways, there has been no research into how user intimacy changes when a voice-activated personal assistant (VAPA) uses a dialect.

Methods One hundred participants from Seoul (25), Chungcheongdo (25), Gyeongsangdo (25), and Jeonrado (25) were recruited through convenience sampling. Every participant was asked to try four types of VAPA (standard language, Chungcheongdo dialect, Gyeongsangdo dialect, and Jeonrado dialect) and randomly told four of 16 pre-written commands. After testing the VAPA, each participant was asked to complete three questionnaires (emotional intimacy, cognitive intimacy, and system usability scale questionnaires).

Results In terms of emotional intimacy, participants from all regions except Seoul felt a higher level of intimacy when using VAPA with a dialect from the participant’s region. In terms of cognitive intimacy, every participant felt more intimate with a VAPA that used the dialect native to their region. In terms of usability, all participants rated the VAPA that used the dialect from their region as more usable than a VAPA that used a dialect from a different region. However, there was no difference in usability between VAPA that used standard language and a VAPA that used a dialect from the participant’s region.

Conclusions The results of this paper could help companies develop detailed strategies to increase the level of intimacy between artificial intelligence agents and users.

Keywords:

AI, Voice, VUI, VAPA, Dialect, Speech, Vernacular, Patois, Emotion Design, UX Design, 사투리, 지역방언, AI, 음성비서 UX디자인, VUI

1. 연구의 배경 및 목적

근래 대화형 플랫폼인 AI 에이전트를 사용할 수 있는 스마트 폰과 스피커가 등장하고 있다. AI 음성비서와 사용자 사이의 인터랙션에서 ‘의인화’는 친밀성을 높이는 중요한 요소이다. Bartneck et al.(2009)은 인간이 아닌 전자기기, 로봇 같은 대상에 사람과 유사한 속성을 부여하는 의인화는 사용자의 정서적 만족에 영향을 미친다고 하였다. Wunderlich et al.(2017)은 사용자가 AI를 기계로 인지하게 될 경우 커뮤니케이션에 어려움을 겪기 때문에, AI의 목소리에 인간적 특징을 부여해야 한다고 언급했다. 구가인(2018)은 삼성전자의 AI 음성비서 빅스비가 명랑하고 쾌활한 캐릭터를 여성 목소리로, 적극적이고 자신감이 넘치는 캐릭터를 남성 목소리로 구현한 기사를 다루었다. 이처럼, 사용자와 AI 음성비서 사이의 친밀성을 높이기 위해서 사람의 특징을 살린 목소리로 의인화를 시도한 것을 확인할 수 있다. 현재 AI 음성비서의 의인화 과정에서 사용되는 언어는 대부분 표준어다. 이는 표준어가 한 국가의 언어적 규범으로서, 지방 지역을 초월한 명확한 커뮤니케이션을 유도하기 때문이다. 비록 표준어에 비해서 명확한 커뮤니케이션 유도의 능력은 떨어지지만, 사투리는 화자 간 친밀감을 향상시키는 특성이 있다. ee & Moon(2006)은 ‘사투리’ 혹은 ‘지역 방언’으로 커뮤니케이션을 하는 경우, 고향과 관련된 정체성이 친밀감 향상에 긍정적 영향을 미친다고 하였다. 이에 따라, 본 연구는 AI 음성비서가 사투리를 구사하는 경우, 사용자가 느끼는 친밀감과 사용성에 미치는 영향을 조사하고자 한다.


2. 이론적 배경

2. 1. AI와 의인화

의인화는 사전적으로 사람이 아닌 것에 사람과 같은 특징을 제시하여 생명을 부여하는 것을 뜻한다. Schiaffino&Amandi(2004)는 인간이 AI와 인터렉션 하는데 개성의 반영이 명확할수록 감정이 변화하는 것을 발견 하였다. Lim et al.(2017)은 영화 <그녀(Her)>에서 AI 인공비서 ‘사만다’에 대한 사용자의 감정이입은 목소리로 표현되는 인터페이스 때문인데, 이를 인터페이스 의인화에 따른 호감도의 향상으로 제시했다. Dautenhahn (2007)은 인간과 AI 사이의 ‘사회적 관계와 행동’의 차원에서 서로 대화가 가능하다고 제시했다. 즉, 사람과 유사한 말투를 구사하는 AI의 의인화는 현실감을 반영하고 사용자의 호감을 향상시킨다고 할 수 있다.

2. 2. 언어규범

언어규범은 올바른 커뮤니케이션을 위해 구사하는 주된 말의 성질을 의미한다. 정부에서는 지역, 계층, 집단의 차이에 따라 구사하는 언어의 차이가 있기 때문에, 표준화 된 언어사용을 장려했다. 하지만, 표준어 보급은 특정 지역의 정체성이 사라지는 문제와 직결된다. Hong(2008)은 지역정체성을 타 지역과 차이를 통해 느낄 수 있는 심리적인 특성으로 제시했다. 이러한 지역정체성으로, ‘사투리’ 또는 ‘지역 방언’이 있다. Han&Park(2004)은 고향과 관련한 정체성이 반영된 사투리는 청자와 화자 사이에 정서적 친밀감을 향상시킨다고 제시했다. 즉, 사투리는 지역 정체성을 바탕으로 화자와 청자의 심리에 영향을 미치는 언어규범이다.

2. 3. 사투리 및 지역 방언

사투리 및 지역 방언은 특정지역에서 구사되는 일상적인 생활언어이다. 사투리는 특정한 지역에서 사용되는 말이고, 지역 방언은 지역을 단위로 규합할 수 있는 언어체계를 의미한다. 사투리는 표준어와 다르다고 해서 성립되지는 않는다. 이는 언어학적으로 대인간의 커뮤니케이션이 가능할 때 성립된다. 따라서 동일한 언어를 사용함에도 커뮤니케이션이 불가능하거나 어려움이 따른다면, 그 언어는 사투리로 정의할 수 없다. 사투리는 및 지역 방언은 세계적으로 존재하는 언어문화다. 한국의 경우, 북부(평안도, 함경도), 중부(황해도, 경기도, 강원도 영서지방), 남부 (충청도, 전라도, 경상도)의 지역으로 방언을 구분할 수 있다. 제주도말은 한반도 내 한국어와 의사소통이 어려워 별도의 언어로 취급한다. 다음으로 해외 사례다. 일본의 경우, 동일본(도쿄, 도호쿠, 도카이토산)과 서일본(오사카, 교토, 긴키, 주고쿠, 운파쿠, 시고쿠), 큐슈지역(호니츠, 히치쿠, 사쓰구)의 지역으로 방언을 구분한다. 오키나와, 하치조 섬의 말은 본토와 의사소통이 어려워 별도의 언어로 취급한다. 영국은 지역 문화에 따라 사투리를 구분한다. 이는 앵글로색슨과 켈트의 문화의 차이에 따라, 스코틀랜드, 웨일즈, 아일랜드 방언의 구분이다. 또한 잉글랜드는 남부와 북부의 지역차이에 따른 방언을 구분할 수 있다. 여기서, 남부에서는 상류층과 노동자 계급의 언어차이를 구분한다.

2. 4. AI의 음성 서비스

Mitchelle et al.(2011)은 AI가 디바이스와 어울리지 않는 보이스로 커뮤니케이션하면 사용자가 로봇으로 인지하여 친근감이 하락한다고 제시했다. 따라서, AI 음성비서는 친밀감 향상을 위해 다양한 목소리 서비스를 제공한다. AI 음성비서 목소리 서비스는 다음과 같다. 첫째, 삼성전자의 빅스비는 여성과 남성의 성우와 방송인 ‘서유리’의 목소리를 제공한다. 둘째, 네이버의 클로바는 여성, 남성의 목소리 외 친절한, 장난 스러운, 빠른, 앙증맞은 목소리를 선택할 수 있다. 또한, 방송인 ‘유인나’ 목소리를 제공한다. 셋째, 카카오의 카카오아이는 여성, 남성의 목소리와 친절한 말투, 친구같은 말투를 제공한다. 별도로 카카오 네비에서는 애니메이션의 캐릭터 목소리와 방송인 ‘배성재’, ‘장예원’ 아나운서 등 목소리 다운로드할 수 있다. 넷째, 구글 어시스턴트의 사례다. 구글은 오렌지, 레드로 명명된 서비스로 남녀 목소리를 제공한다. 구글은 국내의 사례와 다르게, 다양한 국가의 언어 서비스를 제공하고 있다. 여기서, 영어는 국가 별 특징을 분류하여 음성 서비스를 제공한다. 이는 미국, 영국, 캐나다, 오스트레일리아, 인도, 탄자니아 등 지역특징이 구현된 영어 음성서비스의 사례다. 사투리는 표준어와 차이가 있지만 커뮤니케이션이 가능한 언어규범이다. 따라서, 영어로 커뮤니케이션이 가능하지만 지역 별 차이에 따른 정체성 구분이 가능하다면, 이는 사투리의 개념으로 설명할 수 있다. 따라서, 구글 어시스턴트 영어 음성서비스는 사투리의 개념으로 설명할 수 있다. 이러한 개념을 바탕으로, 본 연구는 사투리가 사용자에게 미치는 영향을 조사한다.

Figure 1

A Case of Voice Change in AI voice-activated personal assistant service in Korea

Figure 2

Case of Voice Change in AI voice-activated personal assistant service of Google


3. 연구접근

3. 1. 관련연구 문헌조사

사투리를 구사하는 내비게이션, 사투리를 이해하는 AI의 기업적 사례는 존재하나, 학술적으로 연구된 사례는 찾아보기 어렵다. AI의 사투리 구사가 사용성에 미치는 연구는 국내에서 비교적 최근에 진행되었다. Jeong(2019)는 경상도 사투를 구사하는 AI과 관련한 영상을 통해 유대감과 지속사용의도를 연구했다. 위 연구의 한계는 다음과 같다.

사투리 구사가 관련집단 사이의 유대감 향상의 유의미한 결과를 도출 하였지만, (1)지속사용의도를 발견하지 못하였다. (2)한 지역의 사투리로 연구를 진행하였다. (3)사용자는 사투리를 구사하는 AI와 관련한 영상을 시청한 후 설문조사를 진행한 간접적 인터렉션으로 구성 되었다. 본 연구는 다양한 사투리를 구사하는 AI와 사용자의 직접적 인터렉션으로 실험하여 상기 연구의 한계를 보완하고자 한다.

3. 2. 연구모형 및 가설

본 연구는 사투리를 구사하는 AI 음성비서가 친밀성과 사용성에 미치는 영향을 조사한다. 연구 진행을 위한 독립변수로 한국의 표준어와 사투리 (충청도, 경상도, 전라도)를 제시한다. 그리고 AI 음성비서 사용에 따른 ‘친밀감’과 ‘사용성’을 종속변수를 설정한다. Law(2008)은 사용자는 AI와 인터렉션에서 감정적 유대 및 기대감을 형성하게 되는데, 이러한 심리적 영향은 사용성 만족도 조사로서 평가가 가능하다고 제시했다. 따라서, 본 실험은 사용자가 AI 음성비서가 구사하는 표준어와 사투리의 서비스를 사용하고 느끼게 되는 만족도를 평가하고자 한다. 더하여, 사투리와 관련이 있는 지역의 사용자와 타지의 사용자를 조절변수로 설정한다. 이를 통해, 인구통계학 변인에 따른 사용자 집단에 따른 결과를 분류하여 결과를 확인하고자 한다.

Figure 3

Research model

Study hypothesis

3. 2. 실험 과정

실험참가자는 근 3개월 동안 AI 음성비서의 사용경험이 있는 사용자를 모집했다. Song(2011)은 사람의 성장기에 사투리의 특수성을 습득하게 되고, 언어문화의 인식체계를 확장해간다 제시했다. 이에 따라, 참가자는 출생 후 고등학교 졸업까지 동일지역에서 성장한 사용자를 대상으로 선정한다. 이는 성장기에 습득하게 되는 언어가 변화하면 실험에 영향을 미칠 수 있기 때문이다. 그리고, 참가자는 기본값으로 설정된 AI 음성비서만 사용한 경험자를 모집했다. 이는 사투리, 연예인의 목소리와 같은 음성을 경험한 경우, 실험에 있어 편향된 답변을 제시할 수 있기 때문이다. 이를 바탕으로, 편의추출을 통해 수도권, 경상도, 전라도, 충정도 출신의 사용자를 25명씩 총 100명 모집했다. 실험 진행은 <Table 2>의 16가지 항목을 무작위로 AI 음성비서에게 질문하도록 요구했다.

Collection of usual questions to AI voice assistant

학습효과를 최소화하기 위해 라틴스퀘어를 적용하여, 사투리의 순서를 무작위로 배정하였다. 사투리 순서의 변화는 4번의 질문마다 적용하였다.

AI 음성비서가 구사하는 표준어와 사투리는 전문적인 여성 성우가 녹음한 파일을 사용하였다. 전문 성우는 지역 별 사투리 녹음 경험이 있는 성우로 모집했다. 전문 성우 한 명이 녹음을 한 이유는, 사투리 별 성우를 개별로 녹음하게 되면 성우 개인의 목소리 특징에 따른 청자의 호불호가 평가에 영향을 미칠 수 있기 때문이다. 성우가 녹음한 답변의 리스트는 <Table 3>과 같다.

Answers in standard language and dialect

실험은 AI음성비서가 활성화되는 영상을 재생한 아이폰으로 진행했다. 참가자는 컴퓨터와 연결된 블루투스 이어폰을 장착한 뒤, 아이폰에 질문하였다. 재생되는 영상은 질문에 답변을 할 수 없기 때문에, 답변은 컴퓨터로 연결된 이어폰으로 들려줬다. 테스크 진행 후, 친밀성에 대한 5점 리커트 척도와 벤다이어그램 기반의 설문조사를 진행했다. Park & Park(2006)은 비교적 단시간 안에 형성 되는 친밀감을 (1)AI와 유대감, 애정에 대한 정서적 친밀성과 (2)AI를 자율적 이고 독립적인 존재로 인정하는 인지적 친밀성으로 구분했다. 이를 바탕으로, 본 실험은 정서적 친밀성과 인지적 친밀성으로 구분하여 실험을 진행했다. 벤 다이어그램은 타인과 참여자가 유사하다고 느끼는 정도를 나타낸 IOS Scale로 Aron et al에 의해 개발되었다. 벤다이어그램은 교집합의 영역이 넓을수록 친밀도가 높아지도록 설정했다. 이는 <Table 4>, <Figure 4>와 같다.

Questions of emotional intimacy

Figure 4

Van diagram for question of cognitive intimacy

다음으로, 사용성 평가는 시스템 유용척도인 SUS(System usability scale) 평가항목에서 본 연구에 활용 가능한 부분을 바탕으로 제작하였다.

Questions of usability based SUS(System Usability Scale) questionnaires

마지막으로, 개인 성우가 구사하는 사투리는 지역출신의 참가자가 어색 하게 느낄 수 있는 변수가 있다. 이를 확인하고자, 설문조사 후 1:1 인터뷰를 통해서 참가자의 주관적 의견을 확인하였다.


4. 연구결과

총 100명의 참가자로부터 실험데이터를 수집했다. 참가자는 남성(59명), 여성(41명)으로 구성되었다. 연령대는 20대(45명), 30대( 47명), 40대 (8명)로 구성되었다. AI 음성비서의 사용주기는 월 0회~5회(37명), 5회~10회(41명), 10회~15(17명), 15~20회(5명)로 구성되었다.

실험결과는 다음과 같다.

Figure 5

Result of Kruskal-walis test on emotional intimacy

Figure 6

Result of Kruskal-walis test on cognitive intimacy

Figure 7

Result of Kruskal-walis test on usability

Result of emotional intimacy research

Result of cognitive intimacy research

Result of usability research

4. 1. 정서적 친밀성

Kruskal-walis 결과 출신지역의 사투리를 구사하는 AI와 타 지역 사투리와 표준어를 구사하는 AI의 사이의 정서적 친밀성은 차이가 유의미하였다.(충청도 출신 참가자:chi-squared=37.449, p=3.687e-08***, 경상도 출신 참가자:chi-squared=21.054, p=0.0001026***, 전라도 출신 참가자:chi-squared=34.391, p=1.638e-07***) 수도권 출신 사용자들은 표준어를 사용하는 AI에게 정서적 친밀성을 느끼지 않았다. (chi-squared=0.624, p=0.89). 사후검정 결과, 타 지역이 사투리와 표준어를 구사보다 출신지역의 사투리를 구사하는 AI 음성비서의 정서적 친밀성을 유의미하게 평가했다 <Table 6>. 따라서 가설 H1-1, H1-2를 수용한다.

4. 2. 인지적 친밀성

Kruskal-walis 결과 출신지역의 사투리를 구사하는 AI와 타 지역 사투리와 표준어를 구사하는 AI의 사이의 인지적 친밀성은 차이가 유의미하였다.(충청도 출신 참가자: chi-squared=26.704, p=6.791e-06***, 경상도 출신 참가자:chi-squared=21.054, p=0.0001026***, 전라도 출신 참가자:chi-squared=32.45, p=4.206e-07***) 정서적 친밀성 결과와 달리 인지적 친밀성의 수도권 사용자 평가에서 유의미한 차이가 관찰되었다. (chi-squared=26.704, p=6.791e-06***) 사후검정 결과, 타 지역 사투리를 구사보다 출신지역의 사투리(수도권 지역의 경우 표준어)를 구사하는 AI에 높은 인지적 친밀성을 느낀다는 점을 확인하였다 <Table 7>. 따라서 가설 H2-1, H2-2를 수용한다.

4. 3. 사용성

수도권 출신 참가자를 제외한 참가자들은 타 지역 사투리를 구사하는 AI 음성비서와 출신지역의 사투리를 구사하는 AI 음성비서 사이의 사용성에 차이가 있다고 응답하였다.(충청도 출신:chi-squared=21.642, p= 7.744e-05***, 경상도 출신:chi-squared=21.054, p=0.0001026***, 전라도 출신:chi-squared=13.276, p=0.004076***) 사후검정 결과, 타 지역 사투리를 구사보다 출신지역 사투리를 구사하는 AI 음성비서의 사용성을 높게 평가하였다. 그러나, 표준어를 구사하는 AI 음성비서와 출신 지역의 사투리를 구사하는 AI 음성비서 사이의 사용성 차이는 무의미했다. 사후검정 결과는 <Table 8>과 같다. 따라서 가설 H2-1, H2-2를 수용한다.

4. 4. 1:1 인터뷰

실험참가자는 본 실험에서 사용한 사투리에 어색함을 제시하지 않았다. 하지만, 지역 별 사투리 구사가 완벽하지 못하다는 의견을 제시하였다. 이는 전라도 출신에 있어 전라북도와 전라남도의 차이, 경상북도와 경상남도의 사투리에 차이가 존재한다는 의견이다. 실험참가자 출신 중 전주, 광주 출신과 대구, 울산, 부산 출신이 동일한 의견을 제시하였다.


5. 결론 및 제언

본 연구는 AI 음성비서가 사투리를 구사할 때 친밀감과 사용성에 미치는 영향을 연구하였다. 주 발견점은 다음과 같다. (1)AI 음성비서가 참가자의 출신 지역과 동일한 사투리를 구사하면, 타 지역 사투리나 표준어를 구사할 때보다 친밀성이 향상한다. (2)AI 음성비서가 참가자의 출신 지역과 동일한 사투리를 구사하면, 타 지역 사투리를 구사할 때 보다 사용성이 향상한다.

본 연구에서 제시한 선행연구와 차별화되는 점은 다음과 같다. (1)본 연구는 수도권, 충청도, 경상도, 충청도의 사투리를 구사하는 AI 음성비서를 통해 친밀감과 사용성을 측정하였다. 이전 연구는 경상북도 사투리에 한정되었다. (2)본 연구는 수도권 지역의 사용자가 서울, 경기지역 방언으로 분류 가능한 ‘표준어’를 구사하는 AI 음성비서에 대하여 느끼는 친밀감과 사용성을 조사했다. (3)본 연구는 실험의 신뢰도를 위해 프로토타입을 제작하여 진행하였다. 이전 연구는 실험참가자가 사투리를 구사하는 AI의 영상을 보면서 진행되었다. 본 연구는 사용자는 사투리를 구사하는 AI와 직접 인터렉션 하며 실험을 진행하였다. 따라서, 이전 연구보다 평가의 신뢰성을 높였다는 점에서 차별성을 갖는다.

5. 1. 이론적 함의

본 연구의 이론적 함의는 다음과 같다. (1)사투리를 구사하는 AI 음성비서에 친밀성이 향상되는 이유는 사투리로 커뮤니케이션하는 화자와 청자 사이에 고향과 관련한 지역정체성 때문이라 사료된다. 사투리는 지역정체성의 특징을 나타나는 언어규범으로, 타 지역과 차별화되는 지역만의 정서적 심리로 영향을 미치기 때문이다. (2)수도권 출신 사용자는 표준어를 구사하는 AI 음성비서에 정서적 친밀감을 느끼지 못한다. 문헌조사에서 표준어는 한 국가에서 명확한 커뮤니케이션을 위해 통일한 언어적 규범임을 확인했다. 즉, 표준어는 한 국가의 모든 지역에서 구사하는 언어다. 현재 한국의 표준어는 서울방언이며, 경기방언은 표준어와 유사한 특징이 있다. 따라서, 보편적으로 사용하는 일상어이기 때문에 수도권 참가자들은 인지적으로는 친밀하나, 정서적으로는 친밀하게 느끼지 못하였다고 사료된다. (3)표준어를 구사하는 AI 음성비서는 친밀성과 사용성에서 다른 타 지역 사투리보다 높은 평가를 받았다. 이는 본 실험의 참가자는 표준어로 설정된 AI 음성비서만 사용하였기 때문이다. 즉, 표준어를 구사하는 AI 음성비서만을 사용한 경험은 본 실험에 대한 답변에 영향을 미쳤을 것이다. 또한, 국가에서 표준어 사용을 장려하기 때문에 다른 지역의 사투리보다 친근하다는 생각이 영향 미친 결과로 사료된다.

5. 2. 실증적 함의(Contribution)

본 연구의 실증적 함의는 다음과 같다. (1)사용자와 관련된 사투리를 구사하는 AI 에이전트는 대화와 지속적인 사용을 유도하여 친밀감 향상에 긍정적 영향을 미칠 것이다. 이는 기계학습을 위한 데이터 수집에도 기여할 수 있을 것이라 사료된다. (2)사용자의 과거 데이터를 기반으로 사투리 구사여부를 판단해야 한다. 사용자의 출신 지역과 성장 지역이 다를 경우, 출신 지역의 사투리가 긍정적이지 않을 수 있기 때문이다. (3)사투리를 명확하게 구분하여 구사해야 한다. 이는 지역 방언으로서 긍정적인 영향을 미칠 수 있지만, 출신지역의 사투리와 다르다고 느낀다면 지역정체성에 따른 긍정적 영향을 기대할 수 없기 때문이다.

5. 3. 한계

본 연구의 한계는 다음과 같다. (1)크게 네 지역의 사투리로 나누어 실험을 진행하였으나, 사투리는 더 정밀하게 남도-북도의 차이처럼 모든 지역의 세밀한 사투리를 모두 반영하지 못하였다. (2)데이터 수집 방식에 있어 설문조사를 이용한 점이다. 이는 로그데이터 수집에 비해 인지적인 평가기 때문에 신뢰도가 부족할 수 있다. (3)실험참가자 연령대가 20~30대에 집중된 표본의 한계가 존재한다. 특히, 경상도의 경우 타 지역에 비하여 40대 표본이 부족하였다. 따라서, 지역 별 연령대에 따른 명확한 조사가 부족하다. (4)경상도 지역 참가자들은 타 지역의 참가자들에 비해서 자신의 고향에 현재 거주중인 경우가 많았다. 이는 지방 출신이지만 현재 수도권에 거주중인 참가자들과 차이가 날 수 있다.

5. 4. 후속 연구

본 연구에서 제시한 한계점을 개선하는 후속 연구를 진행하고자 한다. 이는 지역 별 특색이 명확한 사투리를 사용하여, 지역 방언의 개념보다 명확한 조사를 진행하고자 하는 점이다. 그리고, 실험참가자를 다양한 연령대를 구분하여, 연령대 별로 친밀감과 사용성에 대한 조사를 명확하게 하고자 한다. 더하여, 현재 고향 지역에 계속하여 거주하는 사용자 및 수도권으로 이동하여 지내는 사용자를 구분하여 조사하고자 한다. 이는 수도권에 오래 지낸 지방 출신의 참가자와 현재 까지도 출신지역에 거주하는 사용자 사이에서 친밀감과 사용성에 차이가 있을 것이라 예측하기 때문이다. 또한, 충청도, 경상도, 전라도 출신의 사용자가 타 지역의 사투리를 구사하는 AI 음성비서에 대한 호감도를 추가적으로 조사하고자 한다. 이는 타 지역에 대한 좋지 않은 생각이나 편견과 같은 ‘지역감정’이 친밀감과 사용성에 영향을 미치는지 조사하기 위함이다. 이러한 지역감정이 AI 음성비서의 의인화에 악영향을 미친다는 점을 고려한다면 부정적 영향을 미연에 방지할 수 있을 것이기 때문이다.

Notes

Citation: Jang, S., & Lee, J. (2019). User Experience Research on Intimacy and Usability When an AI Voice-Activated Personal Assistant Uses a Dialect. Archives of Design Research, 32(4), 71-83.

Copyright : This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/), which permits unrestricted educational and non-commercial use, provided the original work is properly cited.

References

  • Koo, G. (2018). AI 로봇, 유독 여자 목소리가 많은 이유는?. Donga Ilbo. Retrieved May, 2019, from http://news.donga.com/3/all/20180727/91248338/1.
  • Bartneck, C., Kulic, D., Croft, E., & Zoghbi, S. (2009). Measurement instruments for the Anthropomorphism, Animacy, Likeability, Perceived Intelligence and Perceived safety of Robos. International Journal of Social Robotics, 1(1), 71-81.. [https://doi.org/10.1007/s12369-008-0001-3]
  • Bentley, F., Luvogt, C., Sliverman, M., Wirasinghe, R., White, B., & Lotteridge, D. (2018). Understanding the Long-Term Use of Smart Speaker Assistants. In Proceedings of the ACM on Interactive, Mobile, Wearable and Ubiquitous Technologies, 2(3), 91:1-24.. [https://doi.org/10.1145/3264901]
  • Choi, H. (2018, October). AI 스피커가 가장 많이 듣는 말 TV 켜줘. Retrieved from https://news.joins.com/article/23054879.
  • Dautenhahn, K. (2007). Socially intelligent robots: Dimensions of human-robot interaction. Philosophical Transactions of the Royal Society, 362, 679-704.. [https://doi.org/10.1098/rstb.2006.2004]
  • Gallagher, D. (2017, October). Why Big Tech Is Tuning In to Speakers -Amazon has strong lead in smart speakers, but market still in early days. Retrieved from https://www.wsj.com/articles/why-big-tech-is-tuning-in-to-speakers-1507474800.
  • Han, D., & Park, G. (2004). 사투리 사용에 기여하는 심리 요인들. The Korean Psychological Association, 2, 51-56..
  • Hong, S. (2008). A Study on the Reflect of the Locality and the Multiculturalism in the Local Broadcasting. The Korea Society of Digital Policy and Management, 6(3), 149-158..
  • Jasani, M. (2019). Tips and Tricks to Make Alexa Smarter by the Best Alexa Commands and Skills. Retrieved June, 2019, from https://hackernoon.com/tips-and-tricks-to-make-alexa-smarter-by-the-best-alexa-commands-and-skills-eaa8b42403a0.
  • Law, E., Roto, V., Vermeeren, A. P., Kort, J., & Hassenzahl, M. (2008, April). Towards a shared definition of user experience. In CHI'08 extended abstracts on Human factors in computing systems (pp. 2395-2398). ACM.. [https://doi.org/10.1145/1358628.1358693]
  • Jeong, J., Park. D., Yoon. J., & Jang. M.. (2019). Exploring Effects of Dialect on User Perception of Conversational Agents. Journal of Digital Contents Society, 20(7), 1439-1446.. [https://doi.org/10.9728/dcs.2019.20.7.1439]
  • Kim, M., & Han, D. (2006). Study on the Relationship between Media-Uses Behavior and Psychological Experience along with Intimacy : Focusing on Mediated Interpersonal Communication (MIC). Korean Journal of Journalism & Communication Studies, 50(3), 94-121..
  • Mitchelle, W. J., Szerszen A. S,, Lu, A, S., Schermerhorn, W., Scheutz, M,, & McDorman, F. (2011). A Mismatch in the Huamn Realism of Face and Voice Produce an Uncanny Vally. I-Perception, 2(1), 10-12.. [https://doi.org/10.1068/i0415]
  • Lee, G., & Moon, J. (2006). The Effect of "Regional Identity" on Local TV News Viewing and Evaluation. Journal of communication science of Korea, 6(3), 342-377..
  • Lim, J., Shin, M., Moon, H., Yoon, J., Jeong, T., Lee, Y., & Yu, S. (2017). AI Robot Anthropomorphism Study : A Semantic Network Analysis of AlphaGo Press Coverage. Korean Journal of Journalism & Communication Studies, 61(4), 113-143.. [https://doi.org/10.20879/kjjcs.2017.61.4.004]
  • NPR. (2018). The Smart Audio Report from NPR and Edison Research, Fall-Winter 2017. Retrieved June, 2019, from https://www.nationalpublicmedia.com/smart-audio-report/previous-reports/.
  • Park, J., & Park, S. (2006). Study on the Building The Close Relationship with a Pet Robot, AIBO : The Effect of Storytelling The Correlation Between Elements of the Close Relationship. The conference of HCI Society of Korea, 1963-1970..
  • Schiaffino, S., & Amandi, A. (2004). User-interface agent interaction: Personalization issue. International Journal of Human-Computer Studies, 60, 129-148.. [https://doi.org/10.1016/j.ijhcs.2003.09.003]
  • Sciuto, A., Saini, A., Forlizzi, J., & Hong, J. I. (2018, June). Hey Alexa, What's Up?: A mixed-methods studies of in-home conversational agent usage. In Proceedings of the 2018 Designing Interactive Systems Conference (pp. 857-868). ACM.. [https://doi.org/10.1145/3196709.3196772]
  • Song, C. (2011). Regulation on Dialect of Local Broadcasting Program. Journal of Communication Science, 11(3), 120-146..
  • Wunderlich, N. V., & Paluch, S. A. (2017). Nice and Friendly Chat with a Bot : User Perceptions of AI Based Service Agents. Proceedings of International Conference on Information Systems (ICIS), 6-7..

Figure 1

Figure 1
A Case of Voice Change in AI voice-activated personal assistant service in Korea

Figure 2

Figure 2
Case of Voice Change in AI voice-activated personal assistant service of Google

Figure 3

Figure 3
Research model

Figure 4

Figure 4
Van diagram for question of cognitive intimacy

Figure 5

Figure 5
Result of Kruskal-walis test on emotional intimacy

Figure 6

Figure 6
Result of Kruskal-walis test on cognitive intimacy

Figure 7

Figure 7
Result of Kruskal-walis test on usability

Table 1

Study hypothesis

분류 가설
H1-1 AI 음성비서가 출신 지역과 관련한 사투리를 구사하면, 친밀감이 향상할 것이다.
H1-2 AI 음성비서가 사투리를 구사하면, 사투리와 관련이 있는 사용자와 관련이 없는 사용자 사이에 친밀성(인지적, 정서적)은 차이가 있을 것이다.
H2-1 AI 음성비서가 출신 지역과 관련한 사투리를 구사하면, 사용성이 향상할 것이다.
H2-2 AI 음성비서가 사투리를 구사하면, 사투리와 관련이 있는 사용자와 관련이 없는 사용자 사이에 사용성은 차이가 있을 것이다.

Table 2

Collection of usual questions to AI voice assistant

질문 선행연구
Set a timer for twenty minutes Sciuto, A. et al. (2018)
What's the weather for tomorrow
good morning
tell me trump joke
what time is it?
play caskey on iheartradio
Connect to the phone
set the volume to five
What's the temperature Bentley, F. et al. (2018)
Set the alarm at 7am Jasani, M. (2019)
How's the traffic be like?
TV 채널 바꿔줘 최현주 (2018)
심심해
오늘 며칠이야?
장바구니에 우유 추가해줘 Dan Gallagher (2017)
치킨 주문해줘 (배달 주문)
Control household devices NPR (2017)

Table 3

Answers in standard language and dialect

충청도답변 전라도답변 경상도답변 표준어답변
20분 뒤 알람이
설정 되었구만유
20분 뒤 알람이
설정 되었당께
20분 뒤 알람이
설정 되았습니더
20분 뒤 알람이
설정 되었습니다
최고 기온은 32도
최저 기온은 25도
대체로 흐릴 것 같응께
최고 기온은 32도
최저 기온은 25도
대체로 흐릴 것 같소만
최고 기온은 32도
최저 기온은 25도
대체로 흐릴 것 같아예
최고 기온은 32도
최저 기온은 25도
대체로 흐릴 것 같아요
안녕하셔요,
좋은 하루 보내유
안녕하씨오.
좋은 하루 보내랑께
안녕하세요.
좋은 하루 보내세예
안녕하세요.
좋은 하루 보내세요
고전 개그 하나
들어 볼래유?
고전 개그 하나
들어 볼랑께?
고전 개그 하나
들어 볼랍니꺼?
고전 개그 하나
들어 보실래요?
인자 시각은
오전 7시 20분 이내유
거시기 시각은
오전 7시 20분 이랑께요
현재 시각은
오전 7시 20분 입니더
현재 시각은
오전 7시 20분 입니다
유투브에서 음악을
재상했구만유
참말로 유투브에서
음악을 재생 했씨오.
마 유투브 에서
음악을 재생합니더
유투브에서 음악을
재생합니다
블루투스랑 연결했어유 블루투스랑 연결했당께요. 블루투스랑
연결했다아입니꺼
블루투스랑 연결했습니다
말씀하신 설정값으로
변경하는 중 이어유
말씀하신 설정값으로
변경하는 중 이었씨오
말씀하신 설정값으로
변경하는 중 이데이
말씀하신 설정값으로
변경하는 중 입니다
현재 기온은 26도 이어유 현재 기온은 26도 이랑께요 현재 기온은 26도 입니데이 현재 기온은 26도입니다
7시에 알람을 마쳤응께유 7시에 알람을 마쳤어라우 7시에 알람을 마쳤데이 7시에 알람을 마쳤습니다
인자 퇴근 시간이라
차가 도로에 가득하여유
지금 퇴근 시간이어라
차가 도로에 허벌나씨오
지금 퇴근 시간이라 차가
도로에 천지빼까리다예
지금 퇴근 시간이라
차가 도로에 가득합니다
TV 채널을 몇 번으로
바꿀까유?
TV 채널을 몇 번으로
바꿀꺼랑께요?
TV 채널을 몇 번으로
바꿀까예?
TV 채널을 몇 번으로
바꿀까요?
무서운 얘기 해봐유? 라고
말씀하시면 들려드릴께유
무서운 얘기 해보씨오? 라고
말씀 하시면 들려 드릴랑께
무서운 얘기 하나 해보 라예?
라고 말씀 하시면 들려 드릴께예
무서운 얘기 해봐? 라고
말씀하시면 들려 드릴께요
인자 7월 29일 이어유 거시기 7월 29일 이어라 오늘은 7월 29일 입니데이 오늘은 7월 29일 입니다
네, 장바구니에 우유를
추가 하겠어유
네, 장바구니에 우유를
추가하것씨오
네, 장바구니 에 우유를
추가 하겠십니더
네, 장바구니 에 우유를
추가 하겠 습니다
업체명을 먼저
말씀 해주셔야 되어유
업체명을 먼저 말씀
해주서야 됬어라우
업체명을 먼저 말씀
해주셔야된다 아입니까
업체명을 먼저 말씀해 주셔야
합니다
방에 있는 에어컨을
실행 했어유
방에 있는 에어컨을
실행 했당께요
방에 있는 에어컨을
실행 했습니데이
방에 있는 에어컨을
실행 했습니다

Table 4

Questions of emotional intimacy

질문 내용
1 AI 에이전트가 친근하게 느껴졌다.
2 AI 에이전트와 더 친근하게 대화를 나누고 싶어졌다.
3 AI 에이전트와 대화하기가 즐거웠다.
4 AI 에이전트가 어떤 특성을 갖고 있는지 알게 되었다는 생각이 든다.
5 AI 에이전트와 가까워 질 수 있을 것 같다.
6 AI 에이전트와 대화하기가 어려웠던 것 같다.
7 AI 에이전트와는 절대로 더 친해질 수 없을 것 같다.

Table 5

Questions of usability based SUS(System Usability Scale) questionnaires

질문 내용
1 AI를 더욱 자주 사용할 것이라는 생각이 들었다.
2 AI는 사용하기 쉬웠다.
3 AI의 다양한 기능들이 잘 통합되어 있다고 생각한다.
4 자신 있게 이 AI를 사용할 수 있다.
5 AI가 불필요하게 복잡하다고 생각한다.
6 AI를 사용하기 위해서 많은 학습과정이 필요하다 생각한다.

Table 6

Result of emotional intimacy research

질문 충청도 사투리 경상도 사투리 전라도 사투리
충청 경상 전라 충청 경상 전라 충청 경상 전라
경상 4.438* - - -4.236* - - -0.122 - -
전라 4.913* 0.474 - 0.618 4.855* - -4.168* -4.045* -
충청 5.346* 0998 0.523 1.646 5.883* 1.027 1.384 1.507 5.552*

Table 7

Result of cognitive intimacy research

질문 수도권 사투리 충청도 사투리 경상도 사투리 전라도 사투리
수도권 경상 전라 충청 경상 전라 충청 경상 전라 충청 경상 전라
경상 3.679* - - 4.438* - - -4.236* - - -0.122 - -
전라 0.148 0.148 - 4.913* 0.474 - 0.618 4.855* - -4.168* -4.045* -
충청 -4.156* -4.167* -4.316* 5.346* 0998 0.523 1.646 5.883* 1.027 1.384 1.507 5.552*

Table 8

Result of usability research

질문 충청도 사투리 경상도 사투리 전라도 사투리
충청 경상 전라 충청 경상 전라 충청 경상 전라
경상 3.885* - - -3.614* - - 0.264 - -
전라 4.134* 0.249 - 0.212 3.826* - -3.014* -3.278* -
충청 2.370 -1.151 -1.764 -2.438 1.176 -2.650* -0.985 -1.249 2.029