
정신건강 상담을 위한 AI 챗봇 상담가 페르소나 설계 전략 제안: AI 상담가 요인과 내담자의 상담 만족도를 중심으로
초록
연구배경 정신건강 문제에 대한 사회적 관심이 증가하고 있음에도 불구하고, 실제 상담 서비스 이용률은 여전히 낮은 수준에 머무르고 있다. 이에 따라 상담 서비스의 접근성과 정서적 부담을 해소할 수 있는 대안으로 AI 상담가에 대한 관심이 높아지고 있다. 그러나 기존 연구는 주로 AI 챗봇 상담의 효용성이나 기술적 구현에 초점을 두고 있어, 상담 맥락에 적합한 페르소나 설계 전략에 대한 연구는 미흡한 실정이다. 본 연구는 정신건강 상담 상황에서 상담 만족도에 영향을 미치는 AI 상담가 요인을 도출하고, 이를 바탕으로 AI 상담가 페르소나를 설계 및 검증함으로써 효과적인 페르소나 설계 전략을 제안하고자 한다.
연구방법 1차 연구에서는 정신건강 상담 경험이 있는 내담자 및 상담가를 대상으로 심층 인터뷰를 실시하여, 상담 만족도에 영향을 미치는 상담가 요인을 탐색하였다. 이후 요인 분석을 통해 AI 상담가 요인을 도출하고, 군집 분석을 통해 AI 상담가의 페르소나 유형을 도출하였다. 2차 연구에서는 도출된 페르소나 유형을 기반으로 실험용 상담 체험 자극물을 구성하고, 온라인 설문조사를 통해 AI 상담가 요인과 페르소나 유형이 상담 만족도에 미치는 영향을 검증하였다. 또한 내담자 특성(연령, 상담 횟수, 상담 원인)에 따른 조절 효과도 함께 분석하였다.
연구결과 분석 결과, ‘인간다운 대화’, ‘상담가의 자기개방’, ‘중립적인 상담 태도’, ‘데이터 기반 정보 분석’, ‘공감적 경청과 피드백’의 다섯 가지 AI 상담가 요인이 모두 상담 만족도에 긍정적인 영향을 미치는 것으로 나타났다. 또한 ‘감정중심 공감형’, ‘해결중심 객관형’, ‘정보중심 분석형’의 세 가지 AI 상담가 페르소나 모두 상담 만족도에 유의미한 영향을 미쳤으며, 내담자의 연령과 상담 경험 수준에 따라 선호하는 페르소나 유형에 차이가 있는 것으로 나타났다.이를 바탕으로 내담자 특성에 따른 ‘AI 상담가 페르소나 설계 전략’을 제안하였다.
결론 본 연구는 정신건강 상담에 적합한 AI 챗봇 상담가 페르소나 설계 전략을 제안하고 이를 실험적으로 검증하였다는 점에서 학문적·실무적으로 의미가 있다. 특히 효과적인 정신건강 상담을 위해서는, AI 상담가 요인과 내담자 특성을 반영한 맞춤형 페르소나 설계가 핵심적임을 시사한다. 본 전략은 향후 AI 정신건강 상담 서비스의 설계에 실질적인 참고 자료가 될 수 있으며, 효과적인 페르소나 설계를 위한 전략적 프레임워크로도 활용될 수 있을 것으로 기대된다.
Abstract
Background Although social awareness of mental health issues is increasing, the actual utilization rate of counseling services remains low. As a result, artificial intelligence (AI) chatbot counselors are gaining attention as a potential alternative to improve access and to reduce the emotional burden associated with traditional counseling. However, previous studies have primarily focused on the technological implementation or general utility of AI chatbot, lacking research on persona design strategies tailored to counseling contexts. This study aims to propose and empirically validate an effective persona design strategy for AI chatbot counselors in mental health settings by identifying key AI counselor attributes that influence counseling satisfaction.
Methods In the first phase, in-depth interviews were conducted with clients and counselors who had prior experience with mental health counseling to explore factors influencing satisfaction. Based on the interview data, factor analysis was performed to derive five AI counselor factors, followed by cluster analysis to classify three persona types of AI chatbot counselors. In the second phase, experimental stimuli were developed based on the identified personas, and an online survey was conducted to assess the effects of AI counselor factors and persona types on counseling satisfaction. Additionally, the moderating effects of client characteristics (age, number of counseling sessions, and counseling motivation) were examined.
Results The analysis revealed five key factors (human-like conversation, counselor self-disclosure, neutral attitude, data-driven information provision, and empathic listening and feedback) all of which had significant positive effects on counseling satisfaction. The three identified persona types (emotion-focused empathic, solution-focused objective, and information-focused analytical) were all found to influence satisfaction meaningfully. Furthermore, preferences for persona types varied depending on client age and counseling experience level. Based on these findings, the study presents a persona design strategy tailored to different client characteristics.
Conclusions This study contributes both theoretically and practically by proposing and validating a persona design strategy suitable for AI chatbot counselors in mental health contexts. In particular, the study highlights the importance of incorporating both AI counselor attributes and client characteristics into the persona design process. The proposed strategy can serve as a practical reference for the future development of AI-based mental health services and as a strategic framework for enhancing counseling outcomes.
Keywords:
AI Chatbot, AI, Mental Health Counseling, Counselor Persona, Counseling Satisfaction, AI 챗봇, 인공지능, 정신건강 상담, 상담가 페르소나, 상담 만족도1. 서론
1. 1. 연구의 배경 및 목적
오늘날 많은 사람들은 일상에서 슬픔과 우울을 경험하고 있다. 건강보험심사평가원(2022)에 따르면, 2017년부터 2021년 사이 우울증 환자는 35.1%, 불안장애 환자는 32.3% 증가한 것으로 나타났다. 슬픔은 삶의 어려움이나 상실을 겪을 때 느끼는 자연스러운 감정이지만, 일정 기간 이상 지속되거나 일상에 영향을 줄 경우 의학적인 도움이 필요하다. 그러나 많은 사람들은 정신질환에 대한 부정확한 인식, 사회적 편견, 자아 개방의 어려움 등의 이유로 상담 이용을 꺼린다(kim et al., 2023). 이처럼 심리적 장벽으로 인해 실제로 도움이 필요한 사람임에도 불구하고 상담 서비스를 이용하지 않는 현상을 ‘서비스 갭(service gap)’이라고 한다(Stefl & Prosperi, 1985). 이 문제를 해소하기 위해서는 상담의 접근성과 이용률을 높이는 것이 중요하며, 내담자의 상담 만족도는 이를 위한 핵심 요인으로 강조된다(Norfolk et al., 2009). 하지만 정신건강 전문가와의 상담은 비용, 접근성, 대기 시간 등의 제약이 따를 수 있다.
최근 의료 및 연구 분야에서는 비대면 상담을 포함한 다양한 형태의 기술 기반 상담 방식이 시도되고 있으며, 그중 하나로 AI 챗봇을 활용한 심리 상담이 주목받고 있다(Park et al., 2023). 기존 연구에 따르면, AI 챗봇은 상담 접근성을 높이고 실제 상담가를 보완하거나 대체할 수 있는 가능성을 지닌다(Torous et al., 2021). 특히 정서적 안정감을 제공하고, 인간보다 더 솔직한 감정 표현을 유도할 수 있다는 점에서 긍정적으로 평가된다(Omarov et al., 2021). AI 챗봇은 자연어 처리 기술을 기반으로 사회적 역할을 수행하는 디지털 에이전트로, 누구나 쉽게 접근할 수 있어 정신건강 분야에서의 활용 가능성도 높다(Kim et al., 2020). 지금까지의 관련 연구는 주로 AI 챗봇 활용의 효용성이나 상담 성과 등에 초점이 맞춰져 있다(Aggarwal et al., 2023). 반면, 정신건강 상담 맥락에서 효과적인 상호작용을 이끌어내기 위한 AI 챗봇의 페르소나에 대한 실증적 연구는 아직 미흡한 실정이다. 이에 본 연구는 정신건강 상담 맥락에서 내담자의 상담 만족도에 영향을 미치는 AI 상담가 요인을 도출하고, 이를 기반으로 AI 챗봇 상담가의 페르소나 유형을 설계하고자 한다. 나아가 도출된 페르소나가 내담자의 상담 만족도에 어떠한 차이를 만들어내는지를 실증적으로 검증하고, 연령·상담 경험과 같은 내담자 특성에 따른 조절 효과를 분석하고자 한다. 특히 본 연구는 AI 챗봇이 구현하는 상호작용 방식, 상담 태도, 공감적 반응, 인간유사성 등 AI 상담가 요인이 내담자 경험에 미치는 영향을 규명하는 데 초점을 둔다. 이를 바탕으로 기존의 성과 중심 연구를 넘어, AI 상담가 페르소나 설계를 위한 실질적 전략을 제안하는 데 목적이 있다.
1. 2 연구 흐름 및 구성
본 연구는 정신건강 상담에 있어 AI 챗봇의 활용 가능성을 탐색하고, 상담 만족도를 높일 수 있는 페르소나 설계 전략을 제안하는 것을 목적으로 한다. 이를 위해 정신건강과 AI 챗봇에 관련된 선행 연구 및 사례를 검토하고, 1차 실험을 통해 AI 상담가 요인 기반의 AI 챗봇 상담가 페르소나를 도출하였다. 이후 2차 실험을 통해 그 효과를 검증하였다.[Table 1].
또한 본 연구는 AI 챗봇이 생성하는 개별 상담 발화의 정확성 평가보다는, 상담 과정에서 드러나는 상호작용적 특성과 페르소나 차이가 내담자 경험에 미치는 영향을 중심으로 연구 흐름을 구성하였다.
첫째, 정신건강 상담의 중요성과 내담자의 상담 만족도에 영향을 미치는 요인을 파악하기 위해 선행 연구 및 사례 조사를 수행하였다. 아울러 정신적 지원 도구로서의 AI 챗봇 활용 가능성을 검토하고, 정신건강 상담에 특화된 페르소나 설계의 필요성을 확인하였다.
둘째, AI 챗봇 상담가 페르소나를 도출하기 위해 심층 인터뷰를 실시하고, AI 챗봇 상담에서 내담자의 상담 만족도에 영향을 미치는 요인을 파악하였다. 이후, 탐색적 요인 분석(EFA)을 통해 AI 상담가 요인을 도출하고, 군집 분석을 통해 AI 챗봇 상담가 페르소나를 도출하였다.
셋째, 도출된 요인과 페르소나 유형을 바탕으로 실험 자극물을 개발하고, 그 효과를 검증하기 위한 실험을 설계하였다.
넷째, 실험 결과를 통해 각 요인과 페르소나가 상담 만족도에 미치는 영향을 검증하고, 내담자 특성의 조절 효과를 확인하였다.
마지막으로, 연구 결과를 종합하여 정신건강 상담에 적합한 AI 챗봇 페르소나 설계 전략을 제안하고, 본 연구의 의의와 한계점을 논의하였다.
2. 이론적 배경
2. 1. 정신건강 상담
오늘날 정신건강은 삶의 모든 영역에 영향을 미친다. 급변하는 사회와 치열한 경쟁 속에서 현대인들은 다양한 정서적 어려움을 경험하고 있으며, 이러한 문제에 적절히 대처하지 못하면 자살, 우울증 등의 심각한 결과를 초래할 수 있다(Yang et al., 2016). 미국 정신의학회의 조사(American Psychiatric Association, 1994)에 따르면, 정신질환 초기 단계에서 적절한 상담을 받으면 자살, 심리적 고통 등의 문제를 예방할 수 있다(Yang et al., 2016). 상담은 자기 성장과 대인관계 능력 향상에 긍정적인 영향을 미친다(Jeong, 2011). 최근 상담 서비스의 중요성이 더욱 강조되고 있는 가운데, 한국에서도 국민들의 삶의 질과 정신건강에 대한 관심이 높아지고 있다. 하지만, 우리나라는 주요 13개 정신질환의 평생 유병률은 27.8%에 이르지만, 실제로 전문가에게 상담을 받은 사람은 12.1%에 불과하다(National Center for Mental Health, 2021). 지난 1년 동안 정신건강 서비스를 이용한 비율은 7.2%로, 미국(43.1%)이나 캐나다(46.5%)에 비해 현저히 낮은 수준을 보인다(Lee & Lee, 2023). 1995년 정신보건법이 제정되었으나, 이는 주로 의료 모델을 중심으로 중증 정신장애 치료에 집중되었다. 그 결과, 정신 질환자를 제외한 일반 대중의 정신건강 관리와 상담 서비스는 미비한 상황이다(Ko, 2019). 이는 정신건강 상담에 대한 사회적 인식 부족과 접근성 문제를 반영하며, 보다 실질적인 상담 서비스 확대와 인식 개선이 필요하다.
심리적 문제를 겪고 있음에도 불구하고 상담이나 심리치료와 같은 전문 서비스를 이용하지 않는 현상을 ‘서비스 갭’(Service Gap)이라고 한다(Stefl, Prosperi, 1985). 상담은 ‘도움을 필요로 하는 사람이 전문적으로 훈련받은 상담가와 대면하여 생활 과제 해결과 감정적 성장을 위한 학습 과정’으로 정의된다. 이를 서비스 갭에 적용하면, 상담이 필요한 사람과 상담가가 연결되지 못하는 문제로 이해할 수 있다(Lee & Lee, 2023). 서비스 갭이 발생하는 원인으로는 심리 상담에 대한 낙인과 차별 경험(Thornicroft et al., 2009), 민감한 문제를 타인과 공유하는 데 대한 불편함(Pauw et al., 2022), 비용 부담, 낮은 접근성, 긴 대기 시간 등이 있다(Pauw et al., 2022). 이러한 요인들은 상담에 대한 접근을 제한하고, 그로 인해 필요한 사람들이 상담을 받지 못하는 상황을 초래한다. 이처럼 서비스 갭이 클수록 심리적 문제는 방치되고, 악화되어 사회적 부담과 경제적 손실로 이어질 수 있다(Lee & Kim, 2024). 따라서 정신건강 서비스 이용률 차이에 영향을 미치는 요인을 파악하고, 접근성을 높일 수 있는 방안을 모색할 필요가 있다(Na et al., 2024). 최근에는 상담 수요의 다양화와 기술의 발전에 따라, 비대면 기반의 상담 방식에 대한 관심이 증가하고 있으며, 그중에서도 AI 챗봇을 활용한 상담이 새로운 대안으로 주목받고 있다. 이는 기존 대면 상담의 한계를 보완하고, 접근성을 높일 수 있는 가능성을 제시한다.
① 상담 만족도의 개념상담 만족도는 내담자가 일련의 상담 과정을 마친 후 상담의 목적이나 목표에 도달했다고 느끼는 정도를 평가하는 개념으로 정의된다(Park, 2022). 이는 상담가와 내담자 간의 상호작용 및 그 과정에서 얻어진 결과에 따라 결정된다(Kim, 2017; Choi & Han, 2015). 즉, 상담 만족도는 상담 성과에 대한 내담자와 상담가의 만족 정도를 의미한다(Park, 2022). 상담의 궁극적인 목적은 내담자가 긍정적이고 바람직한 방향으로 변화하도록 돕는 것이며, 상담 후 내담자의 삶에 긍정적인 변화가 나타난 경우 이를 상담 성과로 간주할 수 있다. 내담자가 상담을 통해 기대가 충족되었고 문제 해결에 도움을 받았다고 느낄 때, 상담에 대한 만족감을 경험하게 된다. 이러한 맥락에서 상담 성과를 평가할 때는 상담가가 지각한 성과보다 내담자가 경험하고 지각한 성과에 중점을 두는 것이 더욱 의미 있다고 볼 수 있다(Han & Choi, 2013). 이에 따라 본 연구에서는 상담 만족도를 내담자의 상담 만족도로 정의한다.
상담 만족도 관련 다수의 연구자들(Wampold, 2000; Kim et al., 2008; Kim, 2014)은 상담 성과에 영향을 미치는 주요 요인을 상담가 특성과 내담자 특성으로 분류하여 탐색해 왔다. 특히, 상담 성과에 필수적인 기여를 하는 상담가 요인은 최근 여러 연구자들의 주목을 받고 있다(Choi & Han, 2015).
② 상담 만족도 요인(상담가 요인)최근 상담의 질과 성과에 영향을 미치는 주요 요인으로 상담가의 역할이 중요하게 인식되고 있다(Park & Yoo, 2007). 최근 연구에 따르면, 상담가의 역할은 상담 성과와 밀접한 관련이 있음이 검증되었다(Kim et al., 2006). 이는 상담가가 내담자의 문제 해결을 돕는 협력자이자 주도적인 역할을 하기 때문이다(Lim & Kim, 2008). 상담가의 자기 효능감, 역전이 행동, 상담 협력 관계, 그리고 내담자에 대한 빠르고 정확한 이해는 상담 성과에 영향을 미치는 주요 요인으로 확인되었다(Cho, Kwon, 2011 ; Kim et al., 2008). 특히, 공감은 여러 상담 이론에서 중요한 상담가 요인으로 간주되며, 상담가의 중요한 자질이자 주요한 상담 기법으로 상담 성과에 긍정적인 영향을 미친다(Vivino et al., 2009). 김미란(kim, 2014)의 연구에 따르면, 내담자가 상담가의 전문성과 신뢰성, 호감도를 높게 평가할수록 상담에 대한 긍정적인 영향을 더 많이 느끼며, 상담의 성과 역시 커진다고 보고되었다. 특히, 상담가의 전문적인 능력은 상담가 자신의 성장을 촉진시킬 뿐 아니라 상담 과정에서 불필요한 방해 요소를 제거하고 효과적으로 상담을 진행하는 데 도움을 준다(Mohr et al., 2005). 이와 유사한 맥락에서 김미란(kim, 2014)은 상담가의 태도가 내담자의 상담 경험에 중요한 영향을 미치며 이는 이론적 배경이나 기법보다 더 큰 영향을 미칠 수 있음을 강조했다. 상담 태도의 주요 요소로는 공감적 이해, 수용성, 자기공개, 지시성, 외적 태도를 들 수 있다. 또한 박수영(Park, 2011)은 상담가의 전문성이나 기법보다 내담자에 대한 상담가의 태도와 그들의 내적 세계를 이해하려는 노력이 더 중요하다고 강조하였다. 즉, 이러한 선행 연구를 종합해보면 상담가의 전문성, 신뢰성, 공감성, 수용성, 자기공개와 같은 특징들이 내담자의 만족도에 중요한 영향을 미치는 것을 알 수 있다.
상담 만족도는 상담가의 요인뿐만 아니라 내담자의 개인적 특성에도 영향을 받을 수 있다. 스위프트와 그린버그(Swift & Greenberg, 2012)는 내담자의 특성이 상담 지속성과 결과에 의미 있는 영향을 미칠 수 있으며, 상담가의 특성뿐 아니라 내담자 특성 자체가 상담 결과에 중요한 역할을 할 수 있음을 강조하였다. 또한, 주요 우울 장애를 가진 내담자들을 대상으로 우울증 심각도에 따라 상담 결과를 분석한 연구에서는 내담자의 정신건강 심각도 수준이 상담 효과 및 만족도에 차이를 가져올 수 있음이 제시되었다(Barkham et al., 1996). 특히 스트레스, 우울증, 불면증 등 내담자가 상담을 시작하게 된 정신건강 문제 유형에 따라 상담 과정에 대한 몰입, 회기 지속성, 상담 만족도에 차이가 발생할 수 있음이 보고되었다. 상담 회기 수와 치료 효과 간의 관계를 분석한 연구에서는 평균적으로 13회기 이상의 상담이 진행될 때 절반 이상의 환자가 의미 있는 변화를 경험하는 것으로 나타났다(Hansen et al., 2002). 이 결과는 상담 횟수에 따라 상담 몰입도와 만족도 수준이 달라질 수 있음을 시사한다. 또한, 상담가의 특성과 상담 만족도 간 관계가 내담자의 개인적 특성에 따라 달라질 수 있음을 시사하는 연구들도 보고되었다(Ackerman, Hilsenroth, 2004). 이러한 연구들은 동일한 상담가 특성이라 하더라도 내담자의 연령, 상담 경험, 정신건강 문제 유형에 따라 상담가의 특성이 해석되고 받아들여지는 방식이 달라질 수 있으며, 결과적으로 상담 만족도에 차이를 초래할 수 있음을 보여준다.
따라서 본 연구에서는 내담자의 특성을 조절변수로 설정하여, AI 챗봇 상담가 페르소나 유형과 상담 만족도 간 관계에서 내담자 특성의 조절효과를 분석하고자 한다.
2. 2. 정신건강 상담에서 AI 챗봇의 활용
최근 IT 및 인공지능(AI) 기술의 발전으로 인해, 언제 어디서나 접근 가능한 디지털 심리치료(digital psychotherapy)에 대한 관심이 급격히 증가하고 있다. 특히 AI 챗봇(Chatbot)을 활용한 텍스트 기반 대화형 개입 방식은 사용자의 정서와 사고를 이해하고 지원함으로써, 정신건강 상담가로서의 역할을 수행하는 AI상담가로 연구되고 있다(Fitzpatrick et al., 2017; Ly et al., 2017). 인공지능(AI) 기술은 상담가의 역할을 대체하기보다는 보완적 도구로서 기능한다. 예를 들어 상담 회기 사이에서 피드백을 제공하거나, 위기 상황에서 신속히 대응하며, 내담자의 행동 데이터를 분석해 객관적인 판단을 돕는 등 상담자의 개입을 더욱 효과적으로 지원한다(Lucas et al., 2014). 특히 대규모 데이터 속에서 규칙과 패턴을 학습하는 AI의 특성은 인간 상담가의 인지적 한계를 보완하여 보다 빠르고 정확한 판단과 개입을 가능하게 한다(Kim et al., 2020). AI 챗봇을 포함한 디지털 심리치료는 심리적 낙인(stigma)을 완화하고, 상담 접근성을 높이며, 일상 속에서 지속적인 정서 지원을 제공할 수 있는 새로운 형태의 치료 도구로 발전하고 있다(Kim et al., 2020). AI 챗봇은 자연어처리(NLP, Natural Language Processing) 기술을 기반으로 사용자의 언어 입력을 이해하고, 적절한 응답을 생성함으로써 인간의 사고와 감정을 모방하며 사회적 상호작용 주체로 기능한다. 최근에는 대규모 언어모델(Large Language Model, LLM) 기반 챗봇이 등장하면서, 이전보다 훨씬 자연스럽고 개인화된 상호작용이 가능해졌다(Hehsun, 2024). LLM 챗봇은 방대한 데이터 학습을 통해 맥락을 이해하고, 사용자의 정서 상태와 대화 흐름에 맞는 응답을 생성하며, 인간과 유사한 말투로 대화할 수 있다(Casu et al., 2024). 이러한 기술적 진보를 바탕으로, AI 챗봇은 단순한 정보 제공을 넘어 정서적 지지자 또는 상담가의 역할을 수행하게 되었다. 최근 연구에서는 AI 챗봇이 우울증(depression), 불안(anxiety), 자살 위험(suicidal risk), 스트레스(stress), 양극성 장애(bipolar disorder) 등 다양한 정신건강 문제의 조기 탐지·진단·개입 및 관리에 효과적임이 보고되고 있다(Omarov et al., 2023). 또한 AI 챗봇을 활용한 정신 건강 상담이 심리적 불안감 완화와 내담자의 만족도에 긍정적인 영향을 미친다는 결과도 나타났다(Park et al., 2023). 상담가 대상 인식 연구에서도 AI 챗봇이 제공하는 기능에 대해 전반적으로 적절하다고 평가되었으며, 실제 상담에서의 활용 가능성 역시 긍정적으로 인식되고 있다(Jang, 2021). 현재 다양한 챗봇 기반 정신건강 서비스가 개발·운영되고 있으며, 이들의 효과를 검증하는 연구도 활발히 이루어지고 있다. 대표적인 사례로는 Woebot, Wysa, Tess, Therabot 등이 있으며, 이러한 챗봇들은 사용자의 심리적 부담을 완화하고 상담 접근성을 높이는 데 효과가 있는 것으로 보고되었다(Fitzpatrick et al., 2017; Wilks et al., 2021; D&Alfonso, 2020; Heinz et al., 2025). 이에 본 연구에서는 정신건강 상담 분야에서의 AI 챗봇의 효용성을 중심으로 선행 연구를 검토하고, 주요 사례를 [Table 3]에 제시하였다.
이처럼 기존 연구들은 주로 AI 챗봇의 기술적 발전이나 임상적 효과성에 초점을 맞추고 있다. 그러나 정신건강 상담에 효과적으로 활용되기 위해서는, 보다 구체적이고 체계적인 페르소나 설계 전략이 마련될 필요가 있다. 실제 상담 상황에서 내담자는 상담가의 말투, 공감 수준, 태도 등 상담가의 페르소나에 따라 신뢰감과 몰입도가 달라지며, 이는 상담 몰입도와 상담 만족도에 직접적인 영향을 미친다. 따라서 AI 상담가가 효과적으로 기능하기 위해서는 기술적 완성도뿐 아니라 상담 맥락에 적합한 페르소나 설계가 필수적이다(An & Koo, 2024). 이에 본 연구는 향후 버추얼 휴먼 상담가의 실질적인 도입 가능성을 고려하여, 정신건강 상담 상황에서 상담 만족도를 높이고 보다 효과적인 AI 상담가 역할을 수행할 수 있도록 지원하는 페르소나 설계 전략을 제안하고자 한다.
2. 3. AI 챗봇의 페르소나
페르소나 개념은 원래 UX 분야에서 앨런 쿠퍼(Alan Cooper)가 제안한 ‘목표 지향 디자인(goal-directed design)’의 핵심 도구로, 특정 사용자 집단의 목표와 특성을 대표하는 가상의 인물 모델이다(Cooper & Reimann, 2007; Lidwell et al., 2010). AI 에이전트 서비스 분야에서는 사용자와의 상호작용을 강화하고 사회적 존재감을 높이기 위해, 고유한 성격과 행동 패턴을 갖춘 페르소나 설계의 중요성이 강조되고 있다(Lee, 2021). 이러한 경향은 AI 챗봇 설계에도 반영되어, 몰입감 있는 상호작용을 유도하기 위한 페르소나 연구가 활발히 이루어지고 있다(Hehsun, 2024). 대규모 언어모델(Large Language Model, LLM)의 발전으로, 헬스케어 분야에서도 특정 페르소나를 부여한 개인화된 챗봇 구현이 가능해졌다. 기존 연구들은 AI 챗봇에 역할과 성격을 부여했을 때 사용자의 참여도와 신뢰가 어떻게 달라지는지를 탐색해 왔다. 예를 들어, 모일라넨(Moilanen et al., 2022)은 Big Five Personality 모형을 기반으로 다섯 가지 성격 유형의 챗봇을 설계하고 스트레스·불안 완화 대화를 실험한 결과, 성실한 성격의 챗봇이 사용자 참여를 가장 효과적으로 유도한다고 보고했다. 또한 리(Li et al., 2023)는 헬스케어 챗봇의 의인화 단서(인간적인 언어 스타일이나 따뜻한 말투)가 사회적 현존감과 신뢰 형성을 높이는 데 긍정적인 영향을 미친다고 밝혔다. 한편, 황(Hwang et al., 2021)은 일상 속 행동을 돕는 챗봇이 지속적인 건강 습관 형성에 효과를 내기 위해서는 사용자와의 신뢰 형성이 중요하다고 보았다. 이에 가족 구성원이나 의료진 등 현실 관계를 모방한 역할 기반 페르소나를 적용해, 챗봇이 더 신뢰감 있게 상호작용하도록 설계하는 방법을 제안했다. 또한 그로스(Gross et al., 2021)는 의사와 환자의 대화 방식을 참고해 가부장적 스타일과 협의적 스타일의 챗봇을 만들고, 만성질환자를 대상으로 반응을 비교했다. 그 결과, 사용자의 연령과 질병 경험에 따라 선호하는 대화 방식이 달랐으며, 챗봇의 상호작용 스타일이 신뢰와 관계의 질에 영향을 미친다는 점을 확인했다. 이처럼 챗봇의 페르소나 설정은 신뢰 형성과 유대감 증진에 핵심적인 역할을 한다. 챗봇이 특정 성격이나 태도를 갖출 경우, 단순한 정보 제공 도구를 넘어 정서적 지지자이자 사회적 교류자로 기능할 수 있음을 보여준다(Hehsun, 2024). 그러나 어떤 페르소나 유형이 가장 효과적인가에 대해서는 연구마다 상이한 결과가 보고되고 있으며(Aggarwal et al., 2023), 여전히 명확한 합의가 부족하다.이처럼 챗봇의 페르소나를 적용한 시도는 다양하게 이루어져 왔지만, 정신건강 상담 맥락에서의 AI 챗봇 연구는 여전히 효용성이나 정서적 반응 효과에 초점을 두는 경우가 많다. 반면, 상담가로서의 페르소나 특성과 역할을 체계적으로 탐색한 연구는 부족한 실정이다. 그러나 정신건강 상담에서는 단순한 정보 제공보다 공감, 신뢰, 정서적 안정감이 핵심이며, 이를 위해서는 상담가의 심리적 특성을 반영한 페르소나 설계가 필요하다. 특히 내담자의 특성과 상황에 맞춘 언어 표현, 성격, 가치관 등의 다면적 요소가 통합되어야 한다.이에 본 연구는 AI 상담가의 페르소나 유형을 정의하고, 유형별 특성이 내담자의 상담 만족도에 미치는 영향을 분석함으로써, AI 상담가 페르소나 설계 전략을 제안하고자 한다.
3. 연구 방법
3. 1. 연구 문제 및 목적
본 연구는 정신건강 상담 분야에서 AI 상담가의 효과적인 페르소나 설계 전략을 제안하는 데 목적이 있다. 이를 위해, 먼저 상담 만족도에 영향을 미치는 AI 상담가의 주요 요인을 파악하고, 이 요인을 바탕으로 상담가 페르소나 유형을 구분하였다. 이후 각 페르소나가 상담 만족도에 미치는 영향을 실험적으로 검증하였으며, 내담자의 연령, 상담 횟수, 상담 원인과 같은 특성에 따라 이들 관계에 차이가 나타나는지도 함께 살펴보았다. 이러한 목적을 바탕으로 본 연구는 다음과 같은 연구문제를 설정하였다.
RQ1.상담 만족도에 영향을 미치는 AI 상담가 요인은 무엇인가?
RQ2.도출된 AI 상담가 요인에 따라 구분되는 AI 상담가의 페르소나 유형은 무엇인가?
RQ3.AI 상담가 요인은 상담 만족도에 유의미한 영향을 미치는가?
RQ4.AI 상담가의 페르소나 유형에 따라 상담 만족도에 차이가 있는가?
RQ5.내담자의 특성(연령, 정신건강 상담 경험, 상담 이유)에 따라 페르소나 유형과 상담 만족도의 관계에서 조절 효과가 존재하는가?
본 연구는 1차 실험(AI 상담가 요인 및 페르소나 도출)과 2차 실험(AI 상담가 요인 및 페르소나의 효과 검증)으로 연구를 진행하였다.
1차 실험에서는 심층 인터뷰를 통해 AI 챗봇 상담 상황에서 상담 만족도에 영향을 미치는 요인을 도출하고, 이를 기반으로 설문조사를 실시하였다. 이후 요인 분석을 통해 AI 상담가 요인을 도출하고, 군집 분석을 통해 AI 상담가 페르소나를 도출하였다.
2차 실험에서는 도출된 페르소나별 실험물을 제작한 후, 온라인 설문조사를 실시하였다. 이를 통해 AI 상담가 요인과 AI 상담가 페르소나에 따른 상담 만족도에 대한 효과를 검증하였다. 또한, 내담자의 연령, 상담 횟수, 상담 원인과 같은 특성에 따른 조절효과를 분석하였다. 각 실험의 방법, 목적, 대상 및 기간은 아래 [Table 5]에 정리하였다.
4. 1차 실험: AI 상담가 요인 및 페르소나 도출
4. 1. AI 상담가 요인 도출: 심층 인터뷰
이론적 배경과 사례 분석을 통해 AI 상담가 설계에서 챗봇의 페르소나가 내담자의 상담 만족도를 극대화할 수 있다는 관점을 도출할 수 있었다. 이에 본 연구는 AI 상담가 페르소나를 설계하기에 앞서, 내담자의 상담 만족도와 AI 상담 서비스에 대한 인식을 심층적으로 탐색하고자 하였다.
이를 위해 선행 연구에서 도출된 ‘상담 만족도에 영향을 미치는 상담가 요인’을 기반으로 인터뷰 질문지를 구성하였으며, 내담자와 상담가를 대상으로 심층 인터뷰를 진행하였다. 질문지는 총 세 가지 카테고리로 구성하였다. 첫째, 심리상담 경험과 관련하여 상담이 필요했던 이유와 상담 과정에서의 만족·불만족 경험을 자유롭게 진술하도록 하였다. 둘째, 상담 만족도에 영향을 미치는 상담가의 특성과 그에 대한 추가 의견을 탐색하였다. 셋째, AI 상담의 장단점과 실제 상담가와의 공통점 또는 차이에 대한 인식을 수집하였다. 모든 질문은 참여자들이 자신의 경험에 몰입하여 다양한 관점을 공유할 수 있도록 개방형으로 설계하였으며, 내담자용 질문지는 [Appendix 1]에 제시하였다.
심층 인터뷰는 정신건강 상담 경험이 있는 내담자 8명과 상담 전문가 2명을 대상으로 대면 및 비대면 방식으로 진행되었으며, 2024년 12월 20일부터 2025년 1월 3일까지 이루어졌다. 인터뷰는 참여자별로 약 30분씩 진행되었으며, 참여자의 특성과 정보는 [Table 6]에 정리하였다.
본 연구에서는 심층 인터뷰 결과를 분석하기 위해 주제 분석(Thematic Analysis) 기법을 활용하였다. 먼저 의미 있는 문장을 도출하고, 핵심 내용을 Meaning unit으로 설정한 뒤 의미를 해석해 키워드를 도출하였다. 도출된 키워드는 유사한 의미끼리 묶어 상위 요인으로 정리하고, 이를 바탕으로 핵심 인사이트를 도출하였다. 이때 인터뷰 분석은 기존 선행 연구에서 제시된 상담 만족도 요인을 참고하여 진행되었다. 문헌에서 제시된 요인들을 바탕으로 내담자의 경험을 해석하고, 인터뷰를 통해 보다 구체적이며 AI 상담에 특화된 요인을 추가로 도출하였다.
분석 결과, 내담자의 만족에 영향을 미치는 10개의 상위 요인과 20개의 하위 요인이 도출되었다. 긍정적 피드백, 상담가의 자기 개방, 감정 공감과 즉각적 반응, 맞춤형 상담, 비밀보장과 객관성 유지, 경청, 전문성, 인간 유사성 등이 주요 요인으로 나타났다. 이 중 ‘AI의 인간 유사성’과 관련된 항목은 기존 문헌에는 나타나지 않았지만, 버추얼 상담 환경의 특수성에 따라 인터뷰 과정에서 새롭게 확인된 요인이다.
내담자들은 특히 개인화된 해결책 제안, 비판단적 태도, 데이터 기반 전문성, 익명성 보장 등을 높게 평가했으나, 일부는 AI 상담에서 진정성 있는 공감과 감성적 교류의 한계를 지적하기도 했다. 도출된 요인은 AI 상담의 만족도 요인으로 정리되었으며, 구체적인 내용은 [Table 7]에 제시하였다. 본 연구는 이를 바탕으로 AI 상담가 요인과 AI 상담가 페르소나 도출을 위한 실험의 설문 문항을 구성하였다.
4. 2. 1차 실험 설계 및 분석
1차 실험은 정신건강 상담 경험이 있는 20~40대 대한민국 국민을 대상으로 실시하였다. 본 설문조사는 AI 상담 만족도에 영향을 미치는 AI 상담가 요인을 탐색하고, 이를 기반으로 군집 분석을 통해 페르소나 유형을 도출하는 것을 목표로 하였다. 설문 문항은 심층 인터뷰를 통해 도출된 21개의 항목을 활용하였으며, 설문 기간은 2025년 1월 24일부터 31일까지 7일간 진행되었다. 온라인 설문을 통해 총 223명의 응답을 확보하였으며, 이 중 불성실한 응답 2건을 제외한 최종 221명(남성 78명, 여성 143명)의 데이터를 분석에 활용하였다. 설문은 구글 폼으로 진행되었고, 참여자에게 사전에 AI 챗봇의 개념을 설명하였다. 데이터 분석은 IBM SPSS Statistics 29.0을 사용하였다. 빈도 분석으로 참여자의 일반적 특성을 파악하였고, 요인 분석으로 AI 상담 만족도에 영향을 미치는 요인을 도출하였다. 이후 군집 분석으로 상담가 페르소나 유형을 구분하고, 각 군집에 이름과 말투, 태도, 상담 목표를 설정하여 페르소나 유형을 구체화하였다.
이러한 1차 실험을 바탕으로, 본 연구는 다음 두 가지 연구 문제에 대한 검증을 수행하였다.
RQ1. 상담 만족도에 영향을 미치는 AI 상담가 요인은 무엇인가?
RQ2. 도출된 AI 상담가 요인에 따라 구분되는 AI 상담가의페르소나 유형은 무엇인가?
① 신뢰도 분석 및 요인 분석
본 연구에서는 AI상담가의 상담 만족도에 영향을 미치는 AI 상담가 요인을 파악하기 위해 리커트 5점 척도로 21문항을 측정하고 요인 분석을 실시하였다. 전체 문항의 신뢰도는 α = .956으로 매우 높았으며, 내적 일관성 또한 확보되었다.[Table 8].
요인 분석을 위해 주성분 분석(PCA)과 베리맥스(Varimax) 회전법을 적용하였고, KMO = .958, Bartlett의 구형성 검정 결과 χ² = 3054.514(df = 210, p < .001)로 분석의 적합성이 확인되었다.
분석 결과 총 5개의 AI 상담가 요인이 도출되었다. 첫째, ‘공감적 경청과 피드백’(α = .914)은 내담자의 감정을 공감하고 긍정적 피드백을 제공하는 역량을 의미한다. 둘째, ‘데이터 기반 정보 분석’(α = .902)은 내담자 정보를 신속히 파악하고 데이터에 기반한 상담을 제공하는 역량을 의미한다. 셋째, ‘중립적인 상담 태도’(α = .774)는 비판단적이고 객관적인 태도로 신뢰를 형성하는 역량이다. 넷째, ‘인간다운 대화’는 AI 챗봇이 자연스럽게 대화하는 요소를 반영하며, 단일 문항으로 구성되어 신뢰도 계수는 산출되지 않았다. 다섯째, ‘상담가의 자기개방’ 역시 단일 문항으로, 상담가가 자신의 경험을 적절히 공유해 내담자와 공감대를 형성하는 능력을 의미한다.
각 요인의 설명력 및 상세 분석 결과는 [Table 9]에 제시하였다.
본 연구를 통해 “공감적 경청과 피드백”, “데이터 기반 정보 분석”, “중립적인 상담 태도”, “인간다운 대화”, “상담가의 자기개방”이 상담 만족도에 중요한 AI 상담가 요인임을 확인할 수 있었다.
본 연구에서는 AI 상담가의 특성을 기반으로 군집 분석을 통해 상담가 유형을 도출하고자 하였다. 이를 위해 요인 분석 결과를 바탕으로 계층적 군집 분석(Ward 덴드로그램)을 실시하고, 군집 수를 2개, 3개, 4개로 설정하여 적절성을 비교·분석하였다. 군집 수를 2개로 설정하면 사례 수는 균형적이었으나 대표성이 모호하였고, 3개로 설정하면 사례 수 불균형으로 특정 군집이 명확히 구분되지 않았다. 반면 4개로 분류했을 때 사례 수가 비교적 균형을 이루고 각 군집의 특성이 뚜렷하게 나타나 최종적으로 4개의 군집을 선정하였다. 이후 K-means 군집 분석을 통해 군집화를 정교화하였고, 군집 간 유의미한 차이를 기준으로 특성을 분석하여 각각의 유형을 명명하였다. 군집별 주요 요인 평균값과 유의미한 차이는 [Table 10]에 제시하였다.
첫 번째 군집인 ‘불만족형 상담가’는 상담 만족도에 기여하는 핵심 요소가 거의 없고, 내담자들은 전반적으로 낮은 만족도를 보고하였다. 두 번째 군집인 ‘감정중심 공감형 상담가’는 공감적 경청과 긍정적 피드백, 인간다운 대화를 중심으로 감정에 민감하게 반응하며 정서적 공감을 기반으로 상담을 진행한다. 세 번째 군집인 ‘해결중심 객관형 상담가’는 중립적인 태도를 유지하면서 인간다운 대화와 자기개방을 통해 내담자와 신뢰를 형성한다. 네 번째 군집인 ‘정보중심 분석형 상담가’는 데이터 기반 분석과 객관적 태도를 바탕으로 논리적이고 체계적인 상담을 제공하며, 감정적 동조보다는 정보 전달에 집중하는 특징이 있다.
4. 3. 1차 실험 결과: AI 상담가 페르소나 도출
본 연구에서는 총 4개의 군집을 도출하였으며, 네 번째 군집은 ‘불만족형’으로 분류되었다. 이 군집의 내담자들은 AI 상담가의 감정적인 측면과 객관적인 측면을 신뢰하지 않으며, 부정적인 태도를 가지고 있어 I 상담 자체를 선호하지 않을 가능성이 있다. 따라서 본 연구에서는 이 군집을 상담가 페르소나 설계에서 제외하고, 나머지 3개 군집을 기반으로 페르소나를 도출하였다. 각 군집의 특성에 따라 이름을 부여하고, 말투, 태도, 상담 목표 등을 구체화하였으며, 주요 특징은 [Table 11, 12, 13]에 제시하였다.
이 페르소나는 감정적 공감과 피드백을 중시하며, 논리적 해결책보다는 따뜻한 지지와 위로를 통해 정서적 만족을 높이는 것을 목표로 한다. 이를 위해, 내담자의 이야기에 적극적으로 경청하고 요약·확인하며, 강점과 노력을 인정하는 긍정적 피드백을 제공한다. 또한, 부드럽고 따뜻한 톤으로 내담자를 이해하고 공감하는 말투를 사용하며 “많이 힘드셨겠어요. 그동안 마음고생이 컸겠네요.”와 같은 표현을 통해 내담자의 감정을 공감한다. 이 유형을 선호하는 내담자는 감성적 지지와 공감을 중시하며, AI의 인간다움을 중요하게 생각한다.
이 페르소나는 중립적인 태도를 유지하면서도 인간다운 대화를 통해 신뢰를 구축하고, 내담자가 상황을 객관적으로 바라보도록 돕는다. 감정적 위로보다는 실질적인 해결책 제공에 초점을 맞추며, 상담가의 경험 공유를 통해 내담자의 자기개방을 유도한다. 차분하고 신뢰를 주는 톤으로, “이 상황에서 그렇게 느끼는 건 충분히 이해할 수 있어요. 하지만, 현재 상황을 여러 각도에서 바라보는 것이 중요해요.”와 같이 내담자에게 객관적인 시각을 제공하며 방향성을 제시한다. 이 유형을 선호하는 내담자는 객관적이고 논리적인 상담을 원하면서도 AI의 인간다움을 기대한다.
이 페르소나는 데이터 기반의 체계적 분석과 근거 있는 전략 제시를 통해 문제 해결을 돕는 것을 목표로 한다. 이를 위해 감성적 위로보다는 실제 적용 가능한 해결책을 제안한다. 상담가는 명확하고 직관적인 톤으로, “비슷한 사례를 보면, 이런 접근 방식이 성공률이 높았습니다.”와 같은 표현을 통해 내담자에게 데이터 기반의 명확한 해결책을 제시한다. 이 유형을 선호하는 내담자는 AI의 전문성과 객관성을 신뢰하며, 인간다움보다는 논리성과 비밀보장을 중시한다.
본 연구에서는 도출된 AI 상담가 요인과 AI 상담가 페르소나가 내담자의 상담 만족도에 미치는 영향을 2차 실험을 통해 검증하고자 한다. 이를 통해 페르소나별 상담 효과를 비교하고, 내담자 특성에 따른 조절 효과를 추가적으로 분석하고자 한다.
5. 2차 실험: AI 상담가 요인 및 페르소나 검증
5. 1. 2차 실험 연구 모형 및 연구 문제
본 연구는 도출된 5가지 AI 상담가 요인과 3가지 AI 상담가 페르소나 유형이 내담자의 상담 만족도에 미치는 영향을 실험적으로 검증하고자 2차 실험을 설계하였다. 먼저, AI 상담가 요인이 상담 만족도에 미치는 영향을 분석하고자 한다. 이후, AI 상담가 페르소나 유형에 따라 상담 만족도에 차이가 나타나는지를 비교하고, 내담자의 특성(연령, 정신건강 상담 횟수, 정신건강 상담 원인)에 따라 페르소나 유형과 상담 만족도 간의 조절 효과가 존재하는지를 추가적으로 검토하고자 한다. 이러한 2차 실험을 바탕으로, 본 연구는 아래와 같은 연구 문제에 대한 검증을 수행하였으며, 연구 모형은 [Figure 1]과 같다. 또한, 주요 변수에 대한 조작적 정의는 [Table 14]와 같이 정리하였다.
RQ3.AI 상담가 요인은 상담 만족도에 유의미한 영향을 미치는가?
RQ4.AI 상담가의 페르소나 유형에 따라 상담 만족도에 차이가 있는가?
RQ5.내담자의 특성(연령, 정신건강 상담 경험, 상담 이유)에 따라 페르소나 유형과 상담 만족도의 관계에서 조절 효과가 존재하는가?
5. 2. 2차 실험 설계
2차 실험은 정신건강 상담 경험이 있는 20~40대 성인을 대상으로, AI 상담가 요인과 AI 상담가 페르소나를 검증하고자 실시되었다. 설문은 2025년 4월 29일 부터 5월 3일까지 약 5일간 진행하였다. 온라인 설문을 통해 총 251명의 응답을 확보하고, 불성실한 응답 30건을 제외한 최종 221명(남성 83명, 여성 138명)의 데이터를 분석에 활용하였다. 설문은 구글 폼을 활용한 온라인 방식으로 사전 설문, AI 상담 체험, 체험 후 설문 응답의 세 단계로 구성되었다. 먼저 참여자는 인구통계학적 특성과 정신건강 상담 경험 횟수, 주요 상담 이유(스트레스, 우울감, 불안, 대인관계 문제, 수면 문제)에 응답하였다. 이후, AI 챗봇 플랫폼을 활용해 개발된 AI 상담가와 상호작용하는 체험을 진행하였다. AI 챗봇 상담가는 ‘감정중심 공감형’, ‘해결중심 객관형’, ‘정보중심 분석형’의 세 가지 페르소나로 구분되며, 참여자는 세 유형을 순서대로 체험하였다. 각 체험은 사전 설문에서 선택한 상담 이유에 맞춰 진행되었으며, 상담가별로 최소 10턴 이상의 대화를 약 5분 이상을 유지하는 것을 기준으로 하였다. 상담 체험 직후, 해당 상담가에 대한 설문에 응답하였다. 설문은 실험물 조작 점검 항목, 상담 만족도 척도로 구성되었다. 이 과정을 상담가 유형별로 총 3회 반복하여, 모든 상담가 유형에 대한 체험 및 평가를 완료하였다.
본 연구에서는 측정 항목을 실험물 조작 점검, 정신건강 상태, 상담 만족도, 내담자 특성으로 구성하였으며, 사용된 설문지는 [Appendix 2]에 제시하였다.
① 실험물 조작 점검
AI 상담가 요인 검증과 AI 상담가 페르소나별 상담 스타일의 적절성을 확인하기 위해 상담가 특성에 대한 평가 문항을 구성하였다. 측정 요인은 ‘공감적 경청과 피드백’, ‘데이터 기반 정보 분석’, ‘중립적인 상담 태도’, ‘인간다운 대화’, ‘상담가의 자기개방’ 등 5개로, 각 요인당 2문항씩 총 10문항을 5점 리커트 척도로 응답하도록 하였다.
② 정신건강 상태
내담자의 정신건강 상태는 골드버그와 힐리어(Goldberg & Hillier, 1979)가 개발한 GHQ(General Health Questionnaire)를 사용하였다. GHQ-12는 짧은 시간에 정신건강을 간편하게 평가할 수 있으며, 국내외에서 높은 신뢰도와 타당성이 검증된 도구이다(Kook & Son, 2000). 각 문항은 5점 리커트 척도로 구성되며, 점수가 높을수록 정신적 고통 수준이 높음을 의미한다.
③ 상담 만족도
상담 만족도는 라슨 등(Larsen et al., 1979)이 개발한 Client Satisfaction Questionnaire (CSQ)를 활용하였고, 국내에서는 황(Hwang, 2005)이 번안 및 수정하였다. 신뢰도는 기존 연구에서 Cronbach’s α .96~.97로 보고되었으며, 본 연구에서는 수정된 버전을 사용하여 총 4문항을 5점 리커트 척도로 응답하도록 하였다.
④ 내담자 특성
내담자의 개인적 특성은 상담가 페르소나 유형에 따라 상담 만족도에 영향을 미칠 수 있는 조절변수로 설정하였다.
첫째, 연령은 디지털 친숙도와 상담 수용 태도의 차이를 고려해 20대, 30대, 40대 세 집단으로 구분하였다.
둘째, 정신건강 상담 경험 횟수는 초기(10회 미만), 중간(10~30회 미만), 숙련(30회 이상)으로 구분하였다.
셋째, 상담 이유는 선행 연구에서 자주 다뤄진 스트레스, 우울감 및 무기력감, 불안 및 공황, 대인관계 문제, 수면 문제 중 하나를 선택하도록 하였다(Lee & Lee, 2023).
5. 3. 실험물 설계
본 연구에서는 Poe AI 플랫폼을 활용하여 상담가 유형별 AI 챗봇 상담 체험을 개발하고 이를 실험 자극물로 구성하였다. 1차 실험을 통해 도출된 AI 상담가 페르소나 유형(감정중심 공감형, 해결중심 객관형, 정보중심 분석형)을 기반으로 자극물을 설계하였으며, 상담 만족도에 영향을 미치는 5가지 AI 상담가 요인(공감적 경청과 피드백, 데이터 기반 정보 분석, 중립적인 상담 태도, 인간다운 대화, 상담가의 자기개방)을 중심으로 조작 기준을 설정하였다.
각 상담가 유형별로 위 기준에 따라 각 요인의 반영 수준을 ‘상’, ‘중’, ‘하’로 구분하였다. ‘상’은 해당 요인이 3개 이상의 대화에서 명확하게 표현된 경우로, 페르소나의 핵심 특성을 형성한다. ‘중’은 해당 요인이 1~2개 항목에서 보조적으로 반영된 경우로, 일부 특성을 뒷받침하는 역할을 한다. ‘하’는 해당 요인이 직접적으로 반영되지 않거나, 아주 간접적으로만 나타나는 경우를 의미한다.
‘인간다운 대화’는 말투, 종결 어미, 감탄사 사용 등 언어적 요소를 통해 조작화하였다. 대화의 인간 유사성 수준에 따라 낮음(AI 같은 대화)과 높음(사람 같은 대화)으로 구분하였다. 낮은 수준에서는 “~합니다”, “~입니다”와 같은 형식적 종결 어미를 사용하고, 감탄사나 필러를 배제하여 기계적인 대화 톤을 구성하였다. 반면 높은 수준에서는 “~해요”, “~죠”, “~있어요” 등 자연스러운 구어체 표현과 함께 감탄사(“음”, “그렇죠” 등)를 포함하여, 실제 사람과 대화하는 듯한 자연스러움을 구현하였다.
구체적인 반영 수준은 [Table 15]에 제시하였다. 이 조작 기준을 바탕으로 페르소나별 특성을 명확히 구분하여 시나리오와 프롬프트를 작성하였으며, 실험물 조작 점검 항목 평가 문항으로도 활용하였다.
상담 체험 실험물 구현을 위해 각 페르소나 유형별로 실험용 상담 스크립트를 작성하였다. 스크립트는 사전에 설정된 5가지 AI 상담가 요인에 따른 조작 기준과 각 페르소나의 특징을 충실히 반영하여 구성되었다. 작성된 스크립트는 정신건강 상담 경험이 있는 내담자 2인과 상담 전문가 1인의 피드백을 통해 검토되었다. 검토 과정에서는 문맥의 자연스러움, 말투의 적절성, 페르소나 특성과의 일치도를 중점적으로 점검하였다. ‘감정중심 공감형 상담가’의 경우, 감정에만 집중해 대화의 맥락이 다소 어색한 부분이 보완되어 감정 표현의 구체성과 감정 단계 구분을 강화하여 수정되었다. ‘해결중심 객관형 상담가’는 질문과 해결책 제시가 지나치게 많아 부담감을 느낄 수 있다는 피드백을 반영하여, 질문 수를 줄이고 선택형 어투로 조정하여 대화 흐름을 자연스럽게 보완하였다. 또한 ‘해결중심 객관형’과 ‘분석형 상담가’의 언어 사용과 접근 방식의 차이가 불분명한 부분에 대한 전문가의 피드백을 반영하여, 분석형 스크립트에 인지행동치료(CBT) 요소를 추가하고 문제 접근과 언어 표현의 차별성을 강화하였다. 피드백 내용은 [Table 16]에 정리하였다.
수정된 스크립트는 감정 탐색의 흐름, 질문 방식, 이론적 기반 등을 보완하여 각 상담가 유형의 특성과 상담 상황에 보다 부합하도록 완성하였다.
최종 실험 자극물은 AI와 사용자 간 실시간 대화를 지원하며, 설정한 프롬프트에 따라 AI의 대화 스타일을 세밀하게 조정할 수 있는 AI 플랫폼 기반의 챗봇 인터페이스를 활용하여 구현되었다[Appendix 3].
1차 실험에서 도출된 AI 상담가 페르소나 정보(보이스톤, 상담 목표, 태도 특성) 및 상담 스크립트 예시를 반영하여 프롬프트 템플릿을 구체화하였다. 상담가의 외형은 실험 결과에 영향을 미치지 않도록 통제 변수로 설정하였으며, 세 페르소나 모두 동일한 상담가 이미지를 사용하였다. 상담 체험은 Poe 플랫폼 내에 각 상담가 유형별 별도 페이지를 개설해 구현하였고, 각 페이지에 GPT 프롬프트를 적용하여 상담가의 성격과 특성이 반영된 답변이 자동으로 생성되도록 설정하였다. 참여자는 온라인 설문 링크를 통해 체험 사이트에 접속한 뒤, 간단한 상담가 소개와 안내를 확인하고 상담을 시작하였다. 체험은 참여자가 자신의 고민이나 상황을 자유롭게 입력하면, 사전에 설계된 AI 상담가 페르소나의 말투와 응답 스타일에 따라 각 상담가가 실시간으로 응답하는 방식으로 진행되었다. 구현된 상담 체험 화면 예시는 [Figure 2]에 제시하였다. 본 연구에서는 AI 상담가의 페르소나별 상호작용 특성을 비교하기 위해, 프롬프트 기반으로 대화 톤과 응답 방식을 조정하는 방식으로 실험 자극물을 구현하였다. 이러한 접근은 챗봇의 발화 내용 자체의 정확성을 검증하기보다, 상호작용 과정에서 나타나는 상담가의 태도·대화 스타일이 사용자 경험에 어떠한 차이를 만드는지를 파악하는 데 초점을 둔 기존 연구들과도 유사한 흐름을 따른다(Yang & Oh, 2024).
따라서 본 연구의 실험물 구현 또한 AI 상담가의 응답 방식과 페르소나 특성이 내담자 경험에 어떤 영향을 미치는지 탐색하기 위한 목적으로 설계되었다.
6. 2차 실험 연구 결과
데이터 분석은 IBM SPSS Statistics 29.0을 활용하여 수행하였다. 먼저 인구통계학적 특성 파악을 위해 기술통계 및 빈도분석을 실시하였으며, 변수 간의 관계를 파악하기 위해 변인 간 상관관계 분석을 수행하였다. 이후, 주요 변수들의 신뢰도를 평가하기 위해 Cronbach’s α를 활용한 신뢰도 분석도 함께 진행하였다. 실험물의 조작 적절성은 조작 점검 문항의 평균값과 분산값 등을 분석하여 확인하였다. 연구 문제에 대한 검증은 다음과 같은 순서로 이루어졌다. RQ3은 다중 회귀분석을 통해 AI 상담가 요인이 상담 만족도에 미치는 영향을 검증하였고, RQ4는 버추얼 상담가 페르소나 유형 간 상담 만족도 차이를 비교하기 위해 반복측정 이원분산분석(repeated-measures ANOVA)을 적용하였다. 마지막으로, RQ5는 내담자의 특성(연령, 상담 횟수, 상담 원인)에 따라 페르소나 유형과 상담 만족도의 관계에서 조절효과가 나타나는지를 확인하기 위해 반복측정 ANOVA 및 교차효과 분석을 수행하였다.
6. 1. 기초 분석 및 측정 도구 검토
2차 실험은 총 221부의 유효 응답을 바탕으로 분석되었다. 성별 분포는 남성 83명(37.6%), 여성 138명(62.4%)으로 여성 응답자가 더 많았다. 연령대는 20대가 66명(29.9%), 30대가 104명(47.1%)으로 가장 많았으며, 40대는 51명(23.1%)으로 나타났다. 직업은 직장인이 135명(61.1%)으로 가장 높은 비율을 차지하였으며, 다음으로는 학생 23명(10.4%), 구직/무직/은퇴 22명(10.0%), 자영업 16명(7.2%) 등의 순이었다. 정신건강 상담 경험과 관련하여, ‘10회 미만’ 응답자가 153명(69.2%)으로 다수를 차지하였으며, ‘10회 이상 30회 미만’은 45명(20.4%), ‘30회 이상’은 23명(10.4%)으로 조사되었다. 상담을 받게 된 주요 원인은 우울감 및 무기력감(49.8%)과 스트레스(26.2%)가 가장 많았으며, 불안 및 공황 증상(16.7%)도 주요한 이유로 나타났다.
본 연구에서는 측정도구의 신뢰도를 검증하기 위하여 Cronbach’s α 값을 산출하였다. 일반적으로 Cronbach’s α 값이 .60 이상이면 수용 가능한 수준으로 간주되며, .70 이상일 경우 신뢰도가 양호한 것으로 평가된다. 분석 결과, 모든 변수에서 Cronbach’s α 값이 .60 이상으로 나타났으며, 특히 정신건강 측정(.848), 상담가의 자기개방(.833), 상담 만족도(.903)는 높은 신뢰도를 보였다. 그 외 공감적 경청과 피드백(.737), 인간다운 대화(.732), 데이터 기반 정보 분석(.688), 중립적인 상담 태도(.625) 역시 수용 가능한 수준을 보였다.[Table 17].
주요 변수 간 상관관계 분석 결과는 [Table 18]에 제시하였다. 분석 결과, 모든 변수는 통계적으로 유의한 정적 상관관계를 보였으며(p < .01), 특히 상담 만족도와의 관계에서 다음과 같은 상관 계수가 나타났다. 공감적 경청과 피드백(r = .583), 데이터 기반 정보 제공(r = .675), 중립적 상담 태도(r = .632), 인간다운 대화(r = .776), 상담가의 자기개방(r = .706). 이는 각 AI 상담가 요인이 상담 만족도와 밀접하게 관련되어 있음을 의미한다.
본 연구에서는 감정중심 공감형(P1), 해결중심 객관형(P2), 정보중심 분석형(P3)으로 구분된 세 가지 AI 상담가 페르소나가 조작 의도대로 인식되었는지를 확인하기 위해 반복측정 분산분석(Repeated Measures ANOVA)을 실시하였다. 분석 결과는 다음과 같다. [Table 19]. 먼저, 공감적 경청과 피드백에서는 유의미한 차이가 나타났다(F(2, 219) = 16.191, p < .001, η² = .069). 사후검정 결과, 감정 표현과 피드백을 강조한 감정중심 공감형(P1)이 다른 유형(P2, P3)보다 유의하게 높게 인식되었으며, 이는 해당 조작이 성공적으로 인식되었음을 나타낸다. 인간다운 대화 항목에서도 유의한 차이가 확인되었다(F = 5.117, p = .006, η²= .023). 해결중심 객관형(P2)은 정보중심 분석형(P3)에 비해 보다 인간적인 말투로 인식되어 조작이 성공했음을 나타낸다.
반면, 데이터 기반 정보 제공(F = 1.325, p = .267), 중립적인 상담 태도(F = 0.906, p = .405), 상담가의 자기개방(F = 2.563, p = .078)에서는 페르소나 간 유의한 차이가 나타나지 않았다. 이들 항목은 조작 강도가 다소 부족했거나, 참여자들이 차이를 명확히 느끼기 어려웠을 가능성이 있다. 그럼에도 불구하고, 공감적 경청과 인간다운 대화에서는 유의한 차이가 도출되었고, 전체적인 평균 경향성과 효과 크기는 전반적으로 의도한 방향성과 유사한 흐름을 보였다.
이를 바탕으로 볼 때, 본 연구에서 설계한 상담가 페르소나 조작은 전반적으로 타당하다고 판단된다.
6. 2. 연구 문제에 대한 검증
AI 상담가의 페르소나를 구성하는 5가지 AI 상담가 요인이 상담 만족도에 유의미한 영향을 미치는지 확인하기 위해 다중 회귀분석을 실시하였다.[Table 20].
분석 결과, 전체 회귀모형은 통계적으로 유의미하게 나타났으며(F(5, 215) = 126.285, p < .001), 설명력(Adjusted R²)은 .740으로 매우 높은 수준이었다. 이는 AI 상담가 요인이 내담자의 상담 만족도를 설명하는 데 있어 충분한 설명력을 지닌다는 것을 나타낸다.개별 요인의 영향을 살펴보면, 인간다운 대화가 상담 만족도에 가장 큰 영향을 미치는 요인으로 확인되었으며(β = .359, p < .001), 그 다음으로 상담가의 자기개방(β = .292, p < .001), 중립적인 상담 태도(β = .177, p = .004), 데이터 기반 정보 제공(β = .134, p = .023), 공감적 경청과 피드백(β = .100, p = .041) 순으로 모두 상담 만족도에 긍정적인 영향을 미친 것으로 나타났다.
AI 상담가의 페르소나 유형에 따라 상담 만족도에 차이가 있는지 검증하기 위하여 반복측정 분산분석(Repeated Measures ANOVA)을 실시하였다.[Table 21]. 분석 결과, 페르소나 유형에 따라 상담 만족도에 유의미한 차이가 있는 것으로 나타났다(F(2, 220) = 4.594, p = .011, η² = .02).
집단 간 평균 차이를 보다 구체적으로 확인하기 위해 Bonferroni 사후검정을 실시한 결과, 해결중심 객관형(P2)의 상담 만족도 평균(3.325)이 감정중심 공감형(P1)의 평균(3.183)보다 유의미하게 높은 것으로 나타났으며, 그 차이는 -.143으로 확인되었다(p = .003). 하지만 정보중심 분석형(P3)은 다른 두 유형과의 평균 차이에서 유의미한 차이를 보이지 않았다.
① 내담자의 연령내담자의 연령에 따라 상담가 페르소나 유형이 상담 만족도에 미치는 조절 효과를 검증하기 위해 반복측정 분산분석(RM-ANOVA)과 교호작용 분석을 실시하였다.[Table 22]. 분석 결과, 내담자의 연령과 페르소나 유형 간의 교호작용 효과(페르소나 × 연령)는 Roy’s Largest Root 기준에서 통계적으로 유의미하게 나타났다(F(2, 218) = 3.142, p = .045, η² = .028). 연령대별 평균을 살펴보면, 30대 집단은 세 가지 페르소나 유형 모두에서 가장 높은 상담 만족도를 보였다(M = 3.326, SD = 0.822). 특히 해결중심 객관형 상담가(P2)에 대해 가장 높은 만족도(M = 3.404, SD = 0.845)를 나타냈다. 20대 역시 동일한 유형에서 가장 높은 만족도를 보였으나, 40대는 세 유형 간 만족도 차이가 크지 않았다.
② 정신상담 횟수
내담자의 정신상담 횟수에 따라 상담가 페르소나 유형이 상담 만족도에 미치는 조절 효과를 검증하기 위해 반복측정 분산분석(RM-ANOVA)과 교호작용 분석을 실시하였다.[Table 23]. 분석 결과, 페르소나 유형과 상담 횟수 간의 교호작용 효과(페르소나 × 상담 횟수)는 Roy’s Largest Root 기준에서 통계적으로 유의미하게 나타났다(F(2, 218) = 2.657, p = .042, η² = .024). 상담 횟수별 평균을 살펴보면, 중간 수준(10회 이상 30회 미만)의 내담자가 전반적으로 가장 높은 상담 만족도를 보였으며, 특히 해결중심 객관형 상담가(P2)에 대한 만족도(M = 3.433, SD = 0.861)가 가장 높게 나타났다. 반면, 상담경험이 많은 집단(30회 이상)에서는 세 유형 모두에서 상대적으로 낮은 만족도를 보였다.
③ 정신상담 원인내담자의 정신상담 원인에 따라 상담가 페르소나 유형이 상담 만족도에 미치는 조절 효과를 검증하기 위해 반복측정 분산분석(RM-ANOVA)과 교호작용 분석을 실시하였다[Table 24]. 분석 결과, 페르소나 유형과 정신상담 원인 간의 교호작용 효과(페르소나 × 상담 원인)는 통계적으로 유의하지 않은 것으로 나타났다(F(4, 216) = 1.148, p = .335). 이는 상담 이유에 따라 페르소나 유형의 효과가 상담 만족도에 유의미한 차이를 만들지는 않았음을 의미한다.
6. 3. 분석 결과 논의
AI 상담가 요인이 상담 만족도에 미치는 영향에 대한 분석 결과는 [Figure 3]에 제시하였다. AI 상담가 요인이 내담자의 상담 만족도에 미치는 영향을 분석한 결과, 다섯 가지 요인 모두 상담 만족도에 유의미한 정(+)의 영향을 미치는 것으로 나타났다(RQ3).
특히, ‘인간다운 대화’가 가장 높은 영향을 보였으며, ‘상담가의 자기개방’, ‘중립적인 상담 태도’, ‘데이터 기반 정보 분석’, ‘공감적 경청과 피드백’ 순으로 높은 영향력을 가지는 것으로 나타났다.
가장 큰 영향을 미친 ‘인간다운 대화’는 AI 상담가가 실제 사람과 유사한 대화 태도를 보일 때, 내담자가 더 높은 몰입과 신뢰를 느끼는 데 기여한다. 이는 AI 상담가의 비인간적 한계를 자연스러운 상호작용을 통해 보완할 수 있음을 보여준다.
‘상담가의 자기개방’ 역시 상담 만족도에 긍정적인 영향을 미쳤다. 상담가의 경험 공유는 내담자와의 정서적 유대를 강화하고, 깊은 상호 이해를 유도한 것으로 해석된다.
‘중립적인 상담 태도’는 AI 상담가에 대해 내담자가 기대하는 비판단적이고 객관적인 태도와 부합하며, 이러한 특성은 신뢰 형성과 긍정적 상담 경험을 촉진한 것으로 보인다.
‘데이터 기반 정보 분석’은 AI 상담사의 강점으로, 내담자에게 신속하고 효율적인 문제 해결 기대를 제공하였다. 데이터 기반의 근거 제시는 인간 상담가와의 차별성을 부여하며, 만족도에 긍정적인 영향을 미쳤다.
한편, ‘공감적 경청과 피드백’은 상대적으로 낮은 영향을 보였다. 이는 AI의 공감 표현이 인위적이거나 가식적으로 인식되어, 오히려 내담자의 몰입을 저해할 수 있음을 시사한다.
이러한 결과는 AI 상담에서 단순한 감정 표현이나 공감 기술만으로는 충분하지 않으며, 과도한 감정 개입은 역효과를 초래할 수 있음을 의미한다. 따라서 AI 상담가에게는 인간적인 상호작용 요소와 함께, 객관성과 신속한 정보 제공이라는 AI의 특성을 조화롭게 결합하는 설계가 필요하다.
AI 상담가의 페르소나 유형은 모두 상담 만족도에 유의미한 정(+)의 영향을 미치는 것으로 나타났으며, 유형 간에도 상담 만족도에 통계적으로 유의한 차이가 확인되었다(RQ4).[Figure 4].
‘해결중심 객관형 상담가’(P2)에 대한 만족도는 ‘감정중심 공감형 상담가’(P1)보다 유의미하게 높은 것으로 나타났다. 이러한 결과는 정보 제공과 공감적 태도를 균형 있게 갖춘 ‘해결중심 객관형 상담가’가 내담자에게 가장 긍정적인 상담 경험을 제공할 수 있음을 시사한다. 반면, ‘감정중심 공감형 상담가’는 전반적인 만족도에서 가장 낮은 평가를 받아, 정서적 연결만으로는 상담 만족도를 높이는 데 한계가 있음을 보여준다. ‘정보중심 분석형 상담가’는 객관성과 분석 중심의 특성을 바탕으로 긍정적인 만족도를 보였다. 이러한 결과는 내담자와의 정서적 공감과 함께 객관적이고 명확한 정보 제공이 조화를 이루는 상담가 페르소나가 상담 만족도를 높이는 데 효과적임을 보여준다.
내담자의 특성(내담자의 연령, 정신건강 상담 횟수, 상담 원인)에 따라 페르소나 유형과 상담 만족도 간의 관계를 분석한 결과, 연령과 상담 횟수에서 유의미한 조절 효과가 나타났다(RQ5).[Figure 4].
연령에 따른는 분석 결과, 20대와 30대 모두 ‘해결중심 객관형 상담가’(P2)에 대해 가장 높은 상담 만족도를 보였다. 특히 30대는 ‘감정중심 공감형 상담가’(P1)에 대해서도 높은 만족도를 나타냈다. 반면, 40대는 ‘정보중심 분석형 상담가’(P3)에 대한 선호도가 가장 높게 나타났다. 이러한 결과는 연령대에 따라 상담가에게 기대하는 역할이나 대화 스타일이 다를 수 있음을 시사한다.
정신건강 상담 횟수의 경우, 초기 경험자(10회 미만)는 ‘해결중심 객관형 상담가’(P2)에 대해 가장 높은 상담 만족도를 보였고. 중간 수준 경험자(10회 이상 30회 미만)는 ‘감정중심 공감형 상담가’(P1)와 ‘해결중심 객관형 상담가’(P2)에 대한 상담 만족도가 높았다. 숙련된 경험자(30회 이상)는 ‘정보중심 분석형 상담가’(P3)에 대한 만족도가 높게 나타났다. 이는 상담 경험이 많은 내담자는 감정적 지지보다는 정보 중심의 상담을 선호하는 경향이 있음을 시사한다.
6. 4. 페르소나 설계 전략 도출
본 연구는 정신건강 상담에 적합한 AI 상담가의 페르소나 설계 전략을 제안하고자 하였다. 단순히 외형이나 대화 방식에 그치지 않고, 상담가의 성격, 가치관, 상담 태도 등 내면적 특성이 상담 방식에 어떻게 반영될 수 있는지를 중심으로 접근하였다. 이를 위해 ‘공감적 경청과 피드백’, ‘데이터 기반 정보 제공’, ‘중립적인 상담 태도’, ‘인간다운 대화’, ‘상담가의 자기개방’이라는 다섯 가지 핵심 AI 상담가 요인을 도출하였다. 이러한 요인은 각 상담가의 역할과 태도를 구분하는 기준이 되며, 내담자의 특성에 따라 조합과 우선순위를 달리하여 설계할 수 있다. 본 연구에서는 이를 바탕으로 세 가지 AI 상담가 페르소나 유형을 제시하였다. “감정중심 공감형 AI 상담가”는 ‘공감적 경청과 피드백’과 ‘인간다운 대화’를 핵심 및 주요 요인으로 한다. 정서적 공감과 따뜻한 위로를 중시하며, 공감적 피드백을 통해 내담자의 심리적 지지를 제공한다. 30대와 중간 수준 상담 경험자에게 높은 만족도를 보였으며, 감정적 지지를 선호하는 내담자에게 적합하다.
“해결중심 객관형 AI 상담가”는 ‘중립적인 상담 태도’와 ‘인간다운 대화’를 핵심 요인으로 하고, ‘상담가의 자기개방’을 주요 요인으로 한다. 중립적 태도와 경험 공유를 통해 신뢰를 형성하고, 유연한 대화를 통해 현실적인 조언을 제공한다. 30대와 중간 수준 경험자에게 가장 높은 만족도를 보였으며, 20대와 초기 경험자에게도 긍정적인 반응을 보였다. 객관적 조언과 실질적인 방향 제시를 원하는 내담자에게 적합하다.“정보중심 분석형 AI 상담가”는 ‘데이터 기반 정보 제공’을 핵심 요인으로, ‘중립적인 상담 태도’를 주요 요인으로 한다. 감정보다는 데이터 기반 분석과 효율적인 정보 제공을 통해 명확한 문제 해결을 돕는다. 40대와 숙련된 상담 경험자에게서 높은 만족도를 보였으며, 논리적이고 효율적인 상담을 기대하는 내담자에게 적합하다.
이러한 결과는 내담자의 연령과 상담 경험 수준에 따라 효과적인 페르소나 유형이 달라질 수 있음을 시사하며, AI 상담가 설계 시 정형화되고 일관된 모델이 아닌 내담자의 특성과 니즈를 반영한 맞춤형 전략 설계가 필요함을 강조한다. 본 연구의 AI 상담가 페르소나 설계 전략은 [Figure 5]에 시각적으로 구조화하여 제시하였다. 각 페르소나는 AI 상담가 요인을 기준으로 설계되며, 다섯 가지 요인 중 일부가 각각의 페르소나에서 핵심 혹은 주요 전략으로 작용한다. 각 요인의 상담 만족도에 대한 영향력(1~5 수준)을 시각화하여 실질적 효과성을 반영하였다. 본 도식은 페르소나별 정의, 핵심 역량, 세부 특징, 상담 목표, 적합한 내담자 등을 통합적으로 제시함으로써, AI 기반 상담 서비스 설계에 실질적으로 활용 가능한 구조를 제안하였다.
7. 연구 결론
7. 1. 결론 및 논의
본 연구는 정신건강 상담 분야에서 활용 가능한 AI 챗봇 상담가의 페르소나 유형을 설계하고, 상담 만족도에 영향을 주는 요인을 밝힘으로써 AI 챗봇 기반 상담 서비스의 실질적인 설계 방향을 제시하고자 하였다. 기존 상담 연구들이 인간 상담가의 특성에 집중했다면, 본 연구는 이러한 요인들이 AI 에이전트 환경에서 어떻게 나타나는지를 탐색하였다. 특히 인간 상담가의 특성을 설명하던 기존 상담 요인들을 AI 상담가의 맥락에 맞게 재정의하여 다섯 가지 핵심 요인을 도출했다는 점에서 의미가 있다.
연구 결과, ‘인간다운 대화’와 ‘상담가의 자기개방’이 상담 만족도에 가장 큰 영향을 미쳤다. 이는 실제 인간 상담가와의 상담처럼 상담가와의 관계 형성 및 대화의 자연스러움이 중요하게 작용했음을 보여준다. 다만 ‘인간다운 대화’ 요인은 인간 상담과 유사해 보이지만, AI 상담에서는 다르게 해석된다. 인간 상담가의 공감적 표현이 감정적 진정성을 기반으로 한다면, AI의 인간다운 대화는 자연스러운 문장 구성, 맥락의 유지, 적절한 응답 타이밍 등 사회적 존재감을 기술적으로 구현한 것으로 볼 수 있다. 이에 따라 AI 상담가의 ‘공감적 경청과 피드백’은 감정 표현의 한계로 상대적으로 낮은 영향을 보였으며, AI 상담에서는 진정성보다는 대화의 자연스러움이 더 중요하게 인식되는 경향이 있음을 시사한다. 또한 ‘중립적인 태도’와 ‘데이터 기반 정보 분석’ 역시 상담 만족도에 긍정적인 영향을 미쳤다. 이러한 특성은 인간 상담에서도 나타날 수 있으나, AI 상담가는 방대한 데이터를 학습하고 즉각적으로 정보를 처리할 수 있다는 점에서 보다 일관되고 빠른 피드백을 제공한다는 차이가 있다. 즉, 인간 상담가가 경험이나 직관을 통해 상담 내용을 해석한다면, AI 상담가는 데이터와 패턴 분석을 통해 객관적이고 명확한 정보를 제공하는 데 강점을 보인다. 특히 인간 상담가가 개인의 판단이나 감정에 영향을 받을 수 있는 반면, AI 상담가는 항상 일정한 기준으로 대화하며 비판단적인 태도를 유지할 수 있다. 이러한 특성은 내담자에게 안정감을 제공하여, 상담 전반의 만족도를 높이는 요인으로 작용한 것으로 보인다. 더불어 AI 상담가의 특성을 반영한 세 가지 AI 상담가 페르소나는 내담자의 연령과 상담 경험 수준에 따라 선호도가 다르게 나타났다. 이러한 결과는 내담자의 특성에 따라 효과적인 페르소나 유형이 달라질 수 있음을 보여주며, AI 상담가 설계 시 획일적인 모델이 아닌 개인화된 맞춤형 전략이 필요함을 강조한다. 기존 인간 상담에서는 상담가의 성향이나 방식에 따라 상담 경험이 달라질 수 있었던 반면, AI 상담가는 내담자의 특성에 맞게 사전에 설계된 페르소나를 적용함으로써 보다 일관되고 예측 가능한 상담 경험을 제공할 수 있다는 점에서 차별성이 있다. 기존 AI 챗봇 연구는 주로 정신건강 상담 맥락에서 AI의 효용성이나 치료 효과를 검증하는 데 초점을 두었다(Fitzpatrick et al., 2017; Fulmer et al., 2018; Wilks et al., 2021). 그러나 상담가로서의 페르소나를 구체적으로 다룬 연구는 매우 제한적이었다(Aggarwal et al., 2023). 대부분의 연구가 AI 챗봇의 성격적 특성을 단순히 구분하는 수준에 머물렀던 반면(Gross et al., 2021; Hwang et al., 2021), 본 연구는 AI 상담가의 핵심 요인을 바탕으로 페르소나를 설계하고, 상담 만족도와의 관계를 실험적으로 확인했다는 점에서 차별성을 지닌다. 특히, 기존 연구에서 충분히 다루지 못했던 AI 상담가 페르소나가 내담자의 특성에 따라 어떻게 다르게 작용하는지를 구체적으로 분석하였다. 이를 통해 상담 서비스 설계 과정에서 AI 상담가의 역할과 성격적 특성을 체계적으로 반영할 수 있는 페르소나 전략의 방향성을 제시했다는 점에서 의미가 있다. 이러한 결과는 향후 정신건강 상담 분야에서 AI 상담가를 효과적으로 설계하고 활용하기 위한 실질적인 기초 자료로 활용될 수 있을 것으로 기대된다.
7. 2. 시사점 및 한계점
본 연구는 정신건강 분야의 AI 상담가 요인을 도출하고 AI 상담가 페르소나 설계를 통해 실제 내담자에게 어떤 영향을 미치는지 실험을 통해 확인했다는 점에서 의의를 지닌다.
학술적 측면의 의의로는 첫째, 기존 상담 연구가 주로 인간 상담가의 특성과 효과에 초점을 맞춰왔다면, 본 연구는 AI 상담가에 대한 내담자의 반응을 실험적으로 분석했다는 점에서 차별성을 가진다.
둘째, 인간 상담가의 특성을 설명하던 상담 관련 주요 개념들을 AI 상담가에게 적합한 요인으로 재정의하고 관련 개념을 확장하였다. 특히 공감, 자기 개방, 중립성, 정보 제공 등의 요인을 상담 맥락에 맞게 구조화함으로써, AI 기반의 상담 요인 도출에 대한 이론적 방향성을 제시하였다. 실무적 측면의 시사점은 다음과 같다. 첫째, 본 연구에서 제안한 AI 상담가 요인과 AI 상담가 페르소나 유형은 정신건강 분야 상담 서비스 개발 시 실질적인 기준으로 활용될 수 있다. 특히 내담자 특성에 따라 만족도가 달라지는 경향이 확인된 만큼, 맞춤형 상담 시나리오 설계나 페르소나 선택 기준 마련을 위한 기초 자료로서의 활용 가능성을 보여준다. 둘째, 도출된 AI 상담가 요인과 AI 상담가 페르소나 유형은 정신건강 분야를 넘어 헬스케어, 교육, 조직 내 멘탈케어, 고령자 돌봄 등 다양한 영역의 상담/돌봄서비스 분야로 확장 적용이 가능하다. 특히 감정적 교감이 중요한 분야에서 신뢰할 수 있는 AI 에이전트를 설계하는 데 실용적인 참고 자료가 될 수 있다.
본 연구는 다양한 시사점을 도출하였으나, 다음과 같은 한계와 향후 보완 방향이 존재한다.첫째, 생성형 AI 기반 상담의 특성상 발화 내용의 정확성과 안전성을 완전히 통제하기 어려웠다는 한계가 있다. 생성형 AI의 할루시네이션(hallucination)이나 편향된 응답은 정신건강 상담 맥락에서 민감한 위험을 초래할 수 있다. 따라서 후속 연구에서는 상담 발화의 안전성과 적절성을 검증할 수 있는 메커니즘(전문가 평가, 자동 필터링 시스템, 대화 로그 분석 등)을 포함할 필요가 있다. 둘째, 본 연구는 단일 세션(10회 이상 턴, 약 5분 대화)을 중심으로 상담 만족도를 평가하였기 때문에 상담의 장기적·반복적 특성을 충분히 반영하지 못했다. 또한 참여자가 세 가지 페르소나 유형을 동일한 순서로 체험한 점에서 순서효과(order effect)의 가능성이 존재한다. 향후 연구에서는 무작위 배치(randomization)나 반복·장기 관찰 설계(longitudinal design)를 적용하여 보다 타당하고 일반화 가능한 결과를 확보할 필요가 있다.마지막으로, 실험 참여자가 주로 20~40대에 집중되어 있었고, 상담 경험 역시 자가 보고 방식으로 측정되었다는 점에서 표본의 대표성이 제한될 수 있다. 향후에는 다양한 연령과 상담 경험을 가진 참여자를 포함하고, 객관적인 상담 경험 데이터를 확보하는 노력이 필요하다.이러한 보완 방향을 반영한다면, 향후 연구에서는 실제 상담에 가까운 몰입형 환경을 구축하고, 다양한 내담자 특성을 반영한 설계를 통해 AI 상담가의 효과를 보다 정교하게 검증할 수 있을 것이다. 이를 통해 AI 기반 상담 서비스의 현실 적용 가능성과 윤리적 신뢰성을 동시에 강화할 수 있을 것으로 기대된다.
Acknowledgments
이 논문은 2025년 석사학위 논문을 바탕으로 재구성함.
이 논문 또는 저서는 2023년 대한민국 교육부와 한국연구재단의 인문사회분야 신진연구자지원사업의 지원을 받아 수행된 연구임(NRF-2023S1A5A8083082).
This paper was reconstructed based on the Master’s thesis in 2025
This work was supported by the Ministry of Education of the Republic of Korea and the National Research Foundation of Korea(NRF-2023S1A5A8083082)
Notes
Copyright : This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/), which permits unrestricted educational and non-commercial use, provided the original work is properly cited.
References
-
Ackerman, S. J., & Hilsenroth, M. J. (2003). A review of therapist characteristics and techniques positively impacting the therapeutic alliance. Clinical Psychology Review, 23(1), 1-33.
[https://doi.org/10.1016/s0272-7358(02)00146-0]
-
Aggarwal, A., Tam, C. C., Wu, D., Li, X., & Qiao, S. (2023). Artificial intelligence-based chatbots for promoting health behavioral changes: Systematic review. Journal of Medical Internet Research, 25, e40789.
[https://doi.org/10.2196/40789]
-
American Psychiatric Association. (1994). Diagnostic and statistical manual of mental disorders. American Psychiatric Association.
[https://doi.org/10.1176/appi.books.9780890425787]
-
An, S. J., & Koo, Y. R. (2024). A proposal for virtual human persona design strategies to alleviate middle-aged loneliness: Focusing on parasocial interaction based on human likeness and attractiveness of virtual humans. Archives of Design Research, 37(5), 385-409.
[https://doi.org/10.15187/adr.2024.11.37.5.385]
-
Barkham, M., Rees, A., Shapiro, D. A., Stiles, W. B., Agnew, R. M., Halstead, J., & Harrington, V. M. (1996). Outcomes of time-limited psychotherapy in applied settings: Replicating the Second Sheffield Psychotherapy Project. Journal of Consulting and Clinical Psychology, 64(5), 1079.
[https://doi.org/10.1037/0022-006x.64.5.1079]
-
Casu, M., Triscari, S., Battiato, S., Guarnera, L., & Caponnetto, P. (2024). AI chatbots for mental health: A scoping review of effectiveness, feasibility, and applications. Applied Sciences, 14(13), 5889.
[https://doi.org/10.3390/app14135889]
-
Cho, S. Y., & Kwon, K. I. (2011). Empathic accuracy and counseling satisfaction by counselor's experience in initial counseling: Focusing on client perception using real clinical data. The Korean Journal of Counseling and Psychotherapy, 23(2), 257-275.
[https://doi.org/10.23844/kjcp.2015.11.27.4.849]
- Choi, J. H., & Han, Y. J. (2015). Effects of clients' counseling expectations, working alliance, and counselors' developmental level on counseling satisfaction in adolescent counseling. Korean Journal of Youth Studies, 22(4), 113-132. https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART001989090.
- Cooper, A., Reimann, R., & Cronin, D. (2007). About face 3: The essentials of interaction design. Wiley. https://fall14se.wordpress.com/wp-content/uploads/2017/04/about_face_3__the_essentials_of_interaction_design.pdf.
-
D'Alfonso, S. (2020). AI in mental health. Current Opinion in Psychology, 36, 112-117.
[https://doi.org/10.1016/j.copsyc.2020.04.005]
-
Fitzpatrick, K. K., Darcy, A., & Vierhile, M. (2017). Delivering cognitive behavior therapy to young adults with symptoms of depression and anxiety using a fully automated conversational agent (Woebot): A randomized controlled trial. JMIR Mental Health, 4(2), e7785.
[https://doi.org/10.2196/mental.7785]
-
Fulmer, R., Joerin, A., Gentile, B., Lakerink, L., & Rauws, M. (2018). Using psychological artificial intelligence (Tess) to relieve symptoms of depression and anxiety: Randomized controlled trial. JMIR Mental Health, 5(4), e9782.
[https://doi.org/10.2196/preprints.9782]
-
Goldberg, D. P., & Hillier, V. F. (1979). A scaled version of the General Health Questionnaire. Psychological Medicine, 9(1), 139-145.
[https://doi.org/10.1017/s0033291700021644]
-
Gross, C., Schachner, T., Hasl, A., Kohlbrenner, D., Clarenbach, C. F., Wangenheim, F. V., & Kowatsch, T. (2021). Personalization of conversational agent-patient interaction styles for chronic disease management: Two consecutive cross-sectional questionnaire studies. Journal of Medical Internet Research, 23(5), e26643.
[https://doi.org/10.2196/26643]
-
Jang, G. H., & Seo, Y. S. (2022). The counselors' perceptions of psychological counseling chatbots. The Korean Journal of Counseling, 23(6), 17-48.
[https://doi.org/10.15703/kjc.23.6.202212.17]
- Han, E. J., & Choi, H. N. (2013). The Relationship between Countertransference Utilization Ability and the Satisfaction of Counseling : The Mediating Effects of Working Alliance. 인간이해[The Journal of Human Understanding and Counseling], 34(1), 75-91. https://www.dbpia.co.kr/pdf/cpViewer?nodeId=NODE10888693.
-
Hansen, N. B., Lambert, M. J., & Forman, E. M. (2002). The psychotherapy dose-response effect and its implications for treatment delivery services. Clinical Psychology: Science and Practice, 9(3), 329.
[https://doi.org/10.1093/clipsy.9.3.329]
- Health Insurance Review & Assessment Service. (2022). Analysis of treatment status for depression and anxiety disorders over the past five years (2017-2021). https://www.hira.or.kr/bbsDummy.do?pgmid=HIRAA020041000100&brdScnBltNo=4&brdBltNo=10627.
- Hehsun, K. E. (2024). Effect of LLM chatbot's persona types on users' intention to improve healthy diet habits(Doctoral dissertation, Seoul National University).
-
Heinz, M. V., Mackin, D. M., Trudeau, B. M., Bhattacharya, S., Wang, Y., Banta, H. A., ... & Jacobson, N. C. (2025). Randomized trial of a generative AI chatbot for mental health treatment. NEJM AI, 2(4), AIoa2400802.
[https://doi.org/10.1056/aioa2400802]
- Hwang, I. H. (2005). The effect of counselor's self-efficacy, countertransference behavior and working alliance on the satisfaction of counseling. The Korean Journal of Counseling and Psychotherapy, 17(3), 547-563.
- Hwang, Y., Shin, D., Baek, S., Suh, B., & Lee, J. (2021). Applying the persona of user's family member and the doctor to the conversational agents for healthcare. arXiv, arXiv:2109.01729.
-
Jeong, E. I. (2011). Effect analysis of group counseling for self-growth and improvement of interpersonal competence for college students. Research in Educational Methods, 23(4), 687-712.
[https://doi.org/10.17927/tkjems.2011.23.4.687]
-
Kim, C. D., Kwon, K. I., Han, Y. J., & Son, N. H. (2008). Korean counselor factors that contribute to counseling outcomes. Korean Journal of Counseling Research, 9(3), 961-986.
[https://doi.org/10.15703/kjc.9.3.200809.961]
-
Kim, D. M., Wampold, B. E., & Bolt, D. M. (2006). Therapist effects in psychotherapy: A random effects modeling of NIMH TDCRP data. Psychotherapy Research, 16(2), 161-172.
[https://doi.org/10.1080/10503300500264911]
-
Kim, D., Yeon, J., Min, G., & Shin, H.-C. (2020). The application of artificial intelligence technology in counseling and psychotherapy: Recent foreign cases. The Korean Journal of Counseling and Psychotherapy, 32(2), 821-847.
[https://doi.org/10.23844/kjcp.2020.05.32.2.821]
- Kim, H. S., Kim, J. E., Han, B., & Hwang, J. I. (2023). Remote counseling system using the form of virtual agents [가상 에이전트의 형체를 활용한 원격 상담 시스템]. Proceedings of the Korean HCI Conference, pp. 822-827.https://www.dbpia.co.kr/Journal/articleDetail?nodeId=NODE11229757.
- Kim, M. J. (2017). The multiple mediation effect of counselors' self-efficacy and working alliance on the relationship between counselors' social cognitive mindfulness and counseling outcomes(Master's thesis). Ewha Womans University.
- Kim, M. R. (2014). Study on factors affecting the level of counseling satisfaction of Wee class teenage users(Master's thesis). Graduate School of Social Welfare, Inje University, Korea.
- Kook, S. H., & Son, C. N. (2000). A validation of GHQ/QL-12 to assess the quality of life in patients with schizophrenia: Using RMSEA, ECVI, and Rasch model. Korean Journal of Clinical Psychology, 19(3), 587-602.
-
Larsen, D. L., Attkisson, C. C., Hargreaves, W. A., & Nguyen, T. D. (1979). Assessment of client/patient satisfaction: Development of a general scale. Evaluation and Program Planning, 2(3), 197-207.
[https://doi.org/10.1016/0149-7189(79)90094-6]
- Lee, G. H. (2021). A study on the creative collaboration process between AI agents and users(Master's thesis, Yonsei University).
- Lee, H. N., & Lee, J. Y. (2023). Perceptions of psychological counseling among Korean adults: Using prototype research methodology. The Korean Journal of Counseling and Psychotherapy, 35(1), 223-249.
-
Lee, H. S., & Kim, E. H. (2024). Validation study of the Korean version of the barriers to professional help-seeking scale for middle-aged men. The Korean Journal of Counseling and Psychotherapy, 36(2), 515-538.
[https://doi.org/10.23844/kjcp.2024.05.36.2.515]
-
Li, Q., Luximon, Y., & Zhang, J. (2023). The influence of anthropomorphic cues on patients' perceived anthropomorphism, social presence, trust building, and acceptance of health care conversational agents: Within-subject web-based experiment. Journal of Medical Internet Research, 25, e44479.
[https://doi.org/10.2196/44479]
- Lidwell, W., Holden, K., & Butler, J. (2010). Universal principles of design. Rockport Publishers.
-
Lim, G. W., & Kim, J. H. (2008). Counselor developmental level, use of countertransference, and counseling outcomes. Korean Journal of Counseling Research, 9(3), 987-1006.
[https://doi.org/10.15703/kjc.9.3.200809.987]
-
Lucas, G. M., Gratch, J., King, A., & Morency, L. P. (2014). It's only a computer: Virtual humans increase willingness to disclose. Computers in Human Behavior, 37, 94-100.
[https://doi.org/10.1016/j.chb.2014.04.043]
-
Ly, K. H., Ly, A. M., & Andersson, G. (2017). A fully automated conversational agent for promoting mental well-being: A pilot RCT using mixed methods. Internet Interventions, 10, 39-46.
[https://doi.org/10.1016/j.invent.2017.10.002]
-
Mohr, J. J., Gelso, C. J., & Hill, C. E. (2005). Client and counselor trainee attachment as predictors of session evaluation and countertransference behavior in first counseling sessions. Journal of Counseling Psychology, 52(3), 298.
[https://doi.org/10.1037/0022-0167.52.3.298]
-
Moilanen, J., Visuri, A., Suryanarayana, S. A., Alorwu, A., Yatani, K., & Hosio, S. (2022). Measuring the effect of mental health chatbot personality on user engagement. Proceedings of the 21st International Conference on Mobile and Ubiquitous Multimedia, 138-150.
[https://doi.org/10.1145/3568444.3568464]
-
Na, E. H., Choi, H. Y., & Kim, E. H. (2024). A study on perceptions of middle-aged people regarding face-to-face, telephone, email, chat, video, web/mobile, and virtual reality counseling. The Korean Journal of Counseling, 25(4), 45-73.
[https://doi.org/10.15703/kjc.25.4.202408.45]
- National Center for Mental Health. (2021). 2021 National Mental Health Survey Report.
- Norfolk, T., Birdi, K., & Patterson, F. (2009). Developing therapeutic rapport: A training validation study. Quality in Primary Care, 17(2), 99-106.
-
Omarov, B., Narynov, S., & Zhumanov, Z. (2023). Artificial intelligence-enabled chatbots in mental health: A systematic review. Computers, Materials & Continua, 74(3).
[https://doi.org/10.32604/cmc.2023.034655]
- Park, E. H., & Koo, B. Y. (2022). How the counselor's perception of the client problem clarity influences counselor-rated counseling satisfaction: Focusing on the mediating effects of goal specificity and counselor immersion. Social Psychological Developmental Studies, 3(2), 34-58.
-
Park, G., Chung, J., & Lee, S. (2023). Effect of AI chatbot emotional disclosure on user satisfaction and reuse intention for mental health counseling: A serial mediation model. Current Psychology, 42(32), 28663-28673.
[https://doi.org/10.1007/s12144-022-03932-z]
- Park, J. M., & Yoo, S. K. (2007). The effect of counselors' self-awareness during sessions on the counseling process. The Korean Journal of Counseling and Psychotherapy, 19(1), 31-53.
- Park, S. Y. (2011). A concept mapping study on counselor factors that contribute to perceived counseling outcomes in individual counseling. Sookmyung Women's University.
-
Pauw, L. S., Sauter, D. A., van Kleef, G. A., Lucas, G. M., Gratch, J., & Fischer, A. H. (2022). The avatar will see you now: Support from a virtual human provides socio-emotional benefits. Computers in Human Behavior, 136, 107368.
[https://doi.org/10.1016/j.chb.2022.107368]
-
Stefl, M. E., & Prosperi, D. C. (1985). Barriers to mental health service utilization. Community Mental Health Journal, 21(3), 167-178.
[https://doi.org/10.1007/bf00754732]
-
Swift, J. K., & Greenberg, R. P. (2012). Premature discontinuation in adult psychotherapy: A meta-analysis. Journal of Consulting and Clinical Psychology, 80(4), 547.
[https://doi.org/10.1037/a0028226]
-
Thornicroft, G., Brohan, E., Rose, D., Sartorius, N., Leese, M., & INDIGO Study Group. (2009). Global pattern of experienced and anticipated discrimination against people with schizophrenia: A cross-sectional survey. The Lancet, 373(9661), 408-415.
[https://doi.org/10.1016/s0140-6736(08)61817-6]
-
Torous, J., Bucci, S., Bell, I. H., Kessing, L. V., Faurholt-Jepsen, M., Whelan, P., ... & Firth, J. (2021). The growing field of digital psychiatry: Current evidence and the future of apps, social media, chatbots, and virtual reality. World Psychiatry, 20(3), 318-335.
[https://doi.org/10.1002/wps.20883]
-
Vivino, B. L., Thompson, B. J., Hill, C. E., & Ladany, N. (2009). Compassion in psychotherapy: The perspective of therapists nominated as compassionate. Psychotherapy Research, 19(2), 157-171.
[https://doi.org/10.1080/10503300802430681]
-
Wampold, B. E., & Serlin, R. C. (2000). The consequence of ignoring a nested factor on measure of effect size in analysis of variance. Psychological Methods, 5(4), 425-433.
[https://doi.org/10.1037//1082-989x.5.4.425]
-
Wilks, C. R., Gurtovenko, K., Rebmann, K., Williamson, J., Lovell, J., & Wasil, A. R. (2021). A systematic review of dialectical behavior therapy mobile apps for content and usability. Borderline Personality Disorder and Emotion Dysregulation, 8(1), 29.
[https://doi.org/10.1186/s40479-021-00167-5]
-
Yang, N., & Oh, C. (2024). A study on the learning effects and user experience according to mixed-initiative interaction of generative AI chatbots. Culture and Convergence, 46(1), 85-98.
[https://doi.org/10.33645/cnc.2024.01.46.01.85]
-
Yang, S. N., Kim, J. I., & Park, S. Y. (2016). A study on the factors influencing the use of counseling services. Journal of Korean Wellness, 11(3), 265-275.
[https://doi.org/10.21097/ksw.2016.08.11.3.265]





