창작자의 눈으로 본 생성 AI: 디지털 창작 과정에서 의도를 반영한 이미지 생성 방식 연구
초록
연구배경 생성 AI의 발전으로 디지털 창작자들은 이미지 생성 AI를 창작의 전 과정에서 활용하고 있으나, 이미지 생성 과정의 불투명성과 창작의 다양성으로 인해 결과 예측이나 수정과 같은 유연한 활용에 어려움이 있다. 본 연구는 디지털 창작 경험에 대한 심층 이해를 바탕으로 창작 과정별로 유효한 이미지 생성 방식을 탐색하고 세분화하는 것을 목적으로 한다.
연구방법 이미지 생성 AI의 한계를 이론적으로 탐구한 후, 7명의 창작자를 대상으로 사전 인터뷰를 진행하여 창작의 단계를 세분화하였으며, 더블 다이아몬드 프로세스를 기반으로 생성 AI를 활용하는 창작의 과정을 모방한 실험과 심층 인터뷰를 통해 이미지 생성 AI가 디지털 창작의 각 단계에서 효과적으로 활용하는 방법을 모색했다.
연구결과 창작자들은 주로 자신의 의도에 가까운 이미지를 원하며, 특히 창작의 초반과 중반에서 이러한 요구가 뚜렷하게 드러난다. 중반에는 이미 의도가 일정 수준으로 구체화하였기 때문에 생성 AI의 도움을 더욱 유익하게 느꼈으며, 초반과 후반은 중반과 다른 특성이 있어 더욱 세분화된 이미지 생성 방식이 필요하였다. 또한, 발산의 과정에서는 구체화가, 수렴의 과정에서는 다양화와 구체화 모두 만족도가 높았으며, 특히 '구체화' 생성 방식은 의도에 가까운 이미지를 생성하고자 하는 사용자의 요구를 충족하는 경향이 있었다. 창작자는 다양한 스타일의 이미지에서 유희성을 느끼면서도 실제 참고할 레퍼런스로는 구체화된 이미지를 선호했다.
결론 이미지 생성 AI는 디지털 창작에서 주로 창작자들의 의사결정에 활용되고 있으므로 각 창작자의 고유한 창작 과정에 맞춰 고도화된 이미지 생성 방식이 필요하다. 본 연구는 생성 AI의 이미지 생성 방식을 창작 과정의 단계별로 구체화할 수 있는 방안을 제시함으로써, 생성 AI의 이미지 생성 방식이 창작 과정의 단계별로 세분화될 필요가 있음을 시사한다. 이를 통해 창작 과정의 특성을 이해하는 방향으로 고도화된 생성 AI가 디지털 창작자의 효과적이고 풍부한 창작 경험으로 이어질 것으로 기대한다.
Abstract
Background With the advancement of generative artificial intelligence (AI), digital creators are increasingly utilizing image generation AI throughout the creative process. However, the opacity of the image generation process and the diversity of creative tasks pose challenges for flexible use, such as predicting or modifying outcomes. This study aims to explore and categorize effective image generation methods tailored to each stage of the creative process based on an in-depth understanding of digital creative experiences.
Methods After theoretically exploring the limitations of image generation AI, we conducted preliminary interviews with seven creators to categorize the stages of creation. Using the Double Diamond process, we mimicked the creative process utilizing AI through experiments and in-depth interviews to identify effective ways to employ image generation AI at each stage of digital creation.
Results Creators primarily desire images aligned with their intent, particularly in the early and middle stages of creation. The middle stage, where intent becomes clearer, benefited most from AI assistance, while the early and late stages, having different characteristics, required more nuanced image generation methods. During divergence, specificity was preferred, while during convergence, both diversification and specificity were favored. This indicates a general preference for images closely aligned with the creator’s intent, with ‘specificity’ in image generation meeting these needs most effectively. Creators enjoyed the variety of styles but preferred specific images as actual references.
Conclusions Since image generation AI is primarily used for decision-making in digital creation, advanced image generation methods tailored to each creator’s unique process are essential. This study suggests ways to refine the image generation process of AI to match the specific stages of the creative process, highlighting the necessity of such refinement. Enhanced AI that understands the characteristics of the creative process is expected to lead to more effective and enriched digital creative experiences.
Keywords:
Generative AI, AI Design, Human-AI Collaboration, Ideation, Digital Creation, 생성형 AI, 인공지능디자인, 인간-AI협업, 아이데이션, 디지털창작1. 서론
1. 1. 연구 배경 및 목적
생성 AI의 기술이 빠르게 발전하면서 시각 영역에서 이미지 생성 AI를 창작 도구로 활용하는 움직임이 늘어나고 있다. 디지털 창작자들은 아이데이션 과정부터 실제 이미지를 제작하는 과정까지 디지털 창작의 전 과정에서 생성 AI를 능동적으로 활용하고 있다. 텍스트 프롬프트만 입력해도 다양한 스타일의 높은 퀄리티 이미지를 제공하는 생성 AI의 특성으로 인해 창작자들은 창작 과정 중에서도 아이데이션 및 콘셉트 설정, 레퍼런스 수집 단계에서 생성 AI를 적극적으로 활용하고 있다. 창작자가 직접 이미지를 제작하지 않더라도 단순히 제공되는 이미지 중 더 나은 이미지를 선택하는 것만으로 창작자는 의사결정의 시간과 노력을 절약하여 더 효과적으로 원하는 결과물에 도달할 수 있다. 이처럼 생성 AI는 창작의 전반적인 과정에서 유용한 것으로 여겨지고 있지만, 생성 AI가 실제로 이미지를 생성해 내는 과정을 볼 수 없다는 구조적인 문제로 인해 창작자는 생성 AI의 이미지 결과물을 예측하거나 효과적으로 수정하기 어렵다. 또한, 창작자마다 창작 과정이 다르며, 과정별로 의도, 목적, 특성 또한 다르므로 이미지 생성 AI를 창작을 위한 창의적인 도구로 사용하는 데 어려움을 겪을 수 있다. 따라서, 창작자가 이미지 생성 AI를 유연하고 효과적으로 활용하기 위해서는 이미지의 생성 방식을 창작자의 창작 과정에 대한 이해를 바탕으로 세분화 및 구체화하여야 하며, 인풋과 아웃풋을 중심으로 하는 현재의 창작 경험에서 창작자가 직접 제어할 수 있는 창작 경험으로 나아가야 한다.
1. 2. 연구 범위 및 방법
본 연구는 디지털 창작 도구로 활용되고 있는 이미지 생성 AI의 한계를 이론적으로 탐구하고, 이를 바탕으로 이미지 생성 AI를 디지털 창작의 과정별로 세분화하여 각 과정별로 생성 AI가 활용될 수 있는 방안을 탐색하는 데 중점을 두었다. 디지털 창작은 다양한 시각적 표현을 탐색하는 작가적인 창작과 특정 디자인 목표를 달성하는 것을 목표로 하는 목적 지향적인 창작으로 분류할 수 있다. 본 연구는 그 중 그래픽 디자인을 중심으로 특정한 목적을 가진 결과물을 제작하는 창작에 초점을 맞추었다. 이를 위해 그래픽 디자인 관련 전공인 7명의 디지털 창작자를 대상으로 사전 인터뷰를 하여 디지털 창작 경험을 창작의 단계별 특성에 따라 분류하였으며, 더블 다이아몬드 프로세스를 기반으로 실제 디지털 창작 과정을 모방한 실험을 진행하여 이미지 생성 AI의 창작의 단계별 활용 가능성을 검증하고자 하였다. 또한, 창작자에게 각 창작의 과정별로 생성 AI가 제공하는 이미지들에 대한 심층 인터뷰를 진행하여 이미지 생성 AI가 각 창작의 과정에서 세부적으로 기여할 수 있는 특성들을 분석하였다. 이러한 방법을 통해 이미지 생성 AI의 특성을 이해하고 디지털 창작 과정을 깊이 있게 탐구하여 창작자에게 고도화된 디지털 창작 경험을 제공하는 생성 AI 활용 방안을 모색하였다.
2. 이론적 배경
2. 1. 디지털 창작 보조 도구의 발전
디지털 콘텐츠 산업은 전 세계적으로 주목받는 신산업 분야로 인식되고 있으며(Bae, 2021), 기술의 발전으로 인해 디지털 창작자가 증가하면서 그들을 지원하기 위한 창작 도구도 발전하고 있다. 디지털 작업은 반복적인 과정이 많으므로 창작자를 보조하는 도구는 작업 과정을 자동화하여 불필요한 노동 시간을 줄이기 위한 방향으로 발전해 왔다. Adobe Photoshop의 자동 보정, Adobe의 라이브러리, Figma의 플러그인은 디지털 창작 과정을 돕는 자동화 기능의 예시다. 이처럼 기술은 디지털 창작자의 생산성을 높이는 도구로 사용됐다.
2. 2. 디지털 창작 도구로서의 이미지 생성 AI
2000년대 머신러닝 분야에서 딥 러닝이 급부상하면서 AI는 더 복잡하고 사실적인 콘텐츠를 생성할 수 있게 되었고, 이는 생성 AI에 혁명을 가져왔다. 2012년 Ilya Sutskever와 Geoffrey Hinton이 생성적 적대 신경망(GAN)을 개발하여 사실적인 이미지를 생성하는 데 사용할 수 있게 되었으며, 이에 따라 생성 AI는 특히 이미지 생성 분야에서 큰 발전을 이루었다(Chonkko, 2023). 이전에는 AI가 인간의 창의력을 재현할 수 없다고 여겨졌지만, 2022년 제이슨 앨런의 ‘스페이스 오페라 극장’ 작품이 콜로라도 주립박람회 미술대회 디지털 아트 부문에서 1등을 차지하며 AI가 예술이나 디자인 등 창의적인 영역에서도 극적인 발전을 이루었음을 전 세계적으로 알리게 되었다. 이를 계기로 이미지 생성 AI의 개발이 AI 커뮤니티를 중심으로 확산하였으며, 미드저니, DALL-E, 스테이블 디퓨전 등의 생성 AI 도구가 개발 및 발전되면서 이미지 생성 AI는 단순한 자동화 기능뿐만 아니라 창의적인 작품을 스스로 생성할 수 있는 도구로 여겨지기 시작했다(Kwon, 2024). 생성 AI를 작업의 보조 도구로 활용할 수 있는 서비스와 툴이 고도화됨에 따라, 최근 생성 AI 서비스는 이미지를 생성하는 기술 외에도 창작자가 이미지를 더 직관적으로 수정할 수 있는 브러시 툴, 의도에 가까운 이미지를 생성할 수 있는 레퍼런스 추가 기능, 그리고 이미지의 생성 범위나 생성 정도를 조절할 수 있는 세부 조절 기능 등을 제공하고 있다. 생성 AI에 친숙하지 않은 창작자들에게도 기술의 접근성이 높아짐에 따라 누구나 간단한 조작만으로 이미지 생성 AI로 품질 높은 예술 작품을 생성할 수 있게 되었으며, 이에 미술의 범용화가 진행되고 있다. 현재 미드저니를 사용하는 사용자 중 30%는 프로페셔널한 목적으로 사용하고 있으며, 특히 그래픽 아티스트들은 아이디어나 콘셉트 개발을 목적으로 미드저니를 활용하여 다양한 이미지를 손쉽게 얻고 있다(Lee, 2023).
AI 예술 창작 도구들은 다양한 형태의 시각 예술을 만들어 낼 수 있으며(Chung, 2022), 높은 표현력과 디테일한 이미지를 제공하여 창작자에게 도움을 준다. 또한, 일부 이미지는 창작자의 생각 이상의 것을 제안해 주기도 하여 창의적이라는 평가를 받고 있다. 생성 AI는 간단한 키워드를 입력하여 이미지를 생성하고, 생성한 이미지를 기반으로 창작자의 의도에 맞게 변형할 수 있기 때문에 창작자가 직접 이미지를 제작하지 않더라도 단순히 더 마음에 들거나 나아 보이는 이미지를 ‘선택’함으로써 의도하는 결과물을 얻는 과정을 간소화하고 시간을 절약할 수 있다. 생성 AI의 텍스트 프롬프트를 입력하고 결과물을 선별하는 과정은 창작자가 직접 이미지를 제작하고 시행착오를 겪으며 시각적인 요소를 실험하여 발전시켜야 했던 기존의 창작 프로세스를 창작자의 생각과 선택만으로 작품의 방향성을 발전할 수 있게 해주었다. 이러한 생성 AI의 특성은 특히 창작자의 의사결정 단계에 도움이 되며, 콘셉트 보드나 무드보드를 제작하는 등의 창작 과정에서도 활용될 수 있다. 생성 AI는 창작자가 다양한 실험과 시도를 할 수 있도록 도움을 주며, 창작자가 영감을 얻기 위해 다른 작품이나 사례를 찾아보는 것처럼 창의적인 시각 자료를 제공할 수 있어 다양한 창의성을 시도할 수 있는 도구로서의 가능성을 가지고 있다(Park, 2023).
2. 3. 디지털 창작에서 이미지 생성 AI의 한계
생성 AI는 하나의 방향성을 찾으면 그로부터 확장이 쉽다는 장점이 있어 비용 효율성이 높다고 인식되고 있다. 그러나 창작자가 원하는 방향성을 찾는 것 자체가 쉽지 않고, 아직은 이 과정에서 생성 AI의 도움이 상대적으로 제한적이기 때문에 결과적으로 생성 AI를 사용하여 원하는 이미지를 효율적으로 얻는 것은 어려운 실정이다. 또한 디자이너들은 다양한 스타일을 제공하는 AI 창작 도구에 긍정적이지만 결과 이미지를 예측하기 어렵다는 점에서 한계를 지적했다(Kang & Heo, 2023). 이는 딥 러닝 방식을 사용하는 생성 AI가 ‘End-to-End’ 구조로 되어 있기 때문이다. ‘End-to-End’ 구조는 사용자가 입력과 출력만 볼 수 있고 AI가 결과물을 생성하는 중간 과정(Black Box)을 알 수 없는 구조로, AI의 내부적인 처리 과정을 사용자에게 설명할 수 없으므로 창작자는 이미지 생성의 과정을 이해하기 어려운 상황에 직면하고 있다(Kim, 2023). 이러한 구조로 인해 생성 AI는 아날로그 방식의 창작에 비해 매우 높은 생산성과 비전문가들에게 높은 접근성을 제공하지만, 결과물을 예측하기 어렵고 창작자가 자신의 의도대로 이미지를 수정하기 어렵다는 단점이 있다. 생성 AI의 자동성이 강화될수록 창작자는 이미지 생산을 통제하지 못하고 단순 소비자로 전락하고 만다(Park, 2021). 이와 같은 AI의 한계를 해결하기 위해 최근 AI는 자신의 판단 근거를 사용자에게 제공하여 광범위하고도 자세한 설명을 통해 인공지능의 행위와 판단을 사람이 이해하는 형태로 설명할 수 있는 ‘설명가능한 AI(eXplainable AI, XAI)’로 나아가고 있다(ITWorld, 2019).
창작자는 생성 AI가 창작에 도움이 된다는 대중적인 인식에 따라 생성 AI를 창작의 전 과정에 활용할 수 있을 것으로 기대하지만, 창작의 각 과정은 의도, 목적, 특징이 모두 다르므로 실제 디지털 창작 과정에서 과정별 Black Box로 인한 어려움을 겪을 수 있다. 따라서 생성 AI를 활용한 디지털 창작 경험은 창작의 과정별로 다른 페인 포인트와 니즈를 구체화하고, 이에 대한 심도 있는 이해를 통해 생성 AI의 Black Box를 최대한 사용자가 볼 수 있고 컨트롤할 수 있는 영역으로 만드는 것이 중요하며, 이를 통해 생성 AI는 사용자가 제어할 수 있는 ‘Controlled Generation’ 창작 경험으로 나아가야 한다. 이를 위해 디지털 창작자의 창작 경험을 세분화하여 각 과정의 특성과 니즈를 파악하고, 각 과정별로 창작자에게 효과적인 AI의 이미지 생성 방식이 무엇인지에 관한 연구가 필요하다.
3. 실험 설계 및 진행
3. 1. 실험 설계
본 연구는 그래픽 디자인 작업에 익숙한 디지털 창작자를 대상으로 한 심층 인터뷰를 통해 실제 디지털 창작 경험을 깊이 있게 이해하고, 생성 AI를 활용하여 창작을 진행하는 실험을 통해 창작의 과정별로 효과적인 생성 이미지 방식을 알아보는 것을 목적으로 한다. 실험은 실험 소개, 사전 인터뷰, 본 실험, 본 인터뷰 순으로 설계하였으며 이를 <Figure 1>로 정리하였다. 사전 인터뷰와 본 인터뷰에서는 디지털 창작 과정의 페인 포인트와 인공지능에 대한 인식을 조사하여 인공지능이 기존 디지털 창작 과정에서 반복적으로 경험했던 페인 포인트를 해소할 기회를 탐색하고자 하였다. 또한, 실제로 창작에 생성 AI를 활용하는 본 실험에서는 사용자에게 인공지능이 생성한 이미지의 세부 요소에 대한 의견을 질문함으로써 창작 과정별로 인공지능이 창작자의 의도에 가까운 결과물을 제공하기 위해 고려해야 할 조건을 정리하고자 하였다.
실험자는 3년 이상 그래픽 디자인 작업을 중심으로 디지털 창작을 해온 경험이 있는 시각 디자인 전공 대학생으로 인터뷰이의 프로파일은 <Table 1>과 같다. 창작자마다 창작의 유형과 스타일이 다르다는 점을 고려하여 다양한 작업 스타일을 가진 사용자를 모집하였다<Figure 2>.
창작의 과정은 창작자마다 상이하고 개인화되어 있지만, 2005년 영국의 Design Council의 리서치에 의해 정리된 개념으로 디자인씽킹에 활용되는 ‘더블 다이아몬드 디자인 프로세스 모델(Double Diamond Design Process Model)’에 따르면, 창작은 발산과 수렴의 반복을 통해 이루어진다(Lee & Choi, 2011). 본 연구에서 7명의 창작자를 대상으로 진행한 사용자 조사에 따르면, 창작의 과정은 창작자의 작업 스타일, 작업 형식, 목적에 따라 세부적으로는 차이가 있지만, 일반적으로 ‘아이데이션 → 콘셉트 키워드 도출 → 레퍼런스 서치 → 스케치 → 디지털 작업’의 순서를 따르며, 이는 더블 다이아몬드 프로세스의 발산-수렴-발산-수렴 과정과 유사하다<Table 2>.
사용자 조사를 통해 파악한 일반적인 창작의 프로세스를 바탕으로 디지털 창작의 과정별 특징과 각 과정에서 디지털 창작자가 느끼는 페인 포인트 및 니즈를 확인하기 위해 실제 디지털 창작의 과정을 모방하여 본 실험을 구현하였으며 이를 <Figure 3>으로 정리하였다. 본 실험은 이미지 생성 AI의 도움을 받아 ‘재즈 페스티벌 포스터’를 디자인하는 시나리오로, 창작 과정은 ‘더블 다이아몬드’ 프로세스의 구조를 차용하여 ‘1차 발산, 1차 수렴, 2차 발산, 2차 수렴’ 순으로 진행되었다. 디자인씽킹에서 활용하는 더블 다이아몬드 디자인 모델은 첫 번째 다이아몬드에서 문제를 구체화하고, 두 번째 다이아몬드에서 문제의 해결책을 찾는 과정으로 구성되어 있으나, 본 실험에서는 창작자가 원하는 이미지를 그래픽으로 완성하는 과정을 위해, 첫 번째 다이아몬드에서는 창작자의 아이디어를 이미지로 구체화하는 단계를, 두 번째 다이아몬드에서는 이미지의 완성도를 향상하는 단계로 모델을 변경하여 활용하였다.
3. 2. 디지털 창작 과정에 대한 이해
디지털 창작자의 실제 창작 과정을 깊이 있게 이해하고, 창작 과정별 특징과 구체적인 창작자의 페인 포인트를 파악하기 위해 본 실험에 들어가기 전 사전 인터뷰를 미리 진행했으며, 질문 항목은 다음과 같다<Table 3>. 1:1 심층 인터뷰 방식으로 진행한 사전 인터뷰를 통해 실험 참가자가 디지털 창작자로서 평소에 창작 과정별로 어떠한 경험이 있는지 조사했으며 이는 본 실험의 변수 설계에 반영하였다. 실험 이후에는 창작 과정에서 이미지 생성 AI를 활용하는 것에 대한 사용자의 인식을 조사하였다.
실험을 통해 발견한 각 창작 과정별 특징은 다음과 같다<Table 4>. 첫째, 창작자는 아이데이션 및 콘셉트 설정 단계에서 작업의 스타일에 대해 고민하지만 스스로 판단하기 어렵고, 초반에 모호한 아이디어와 잦은 피봇으로 많은 시간과 자원을 소모한다(P6). 둘째, 레퍼런스 탐색 및 수집 단계에서 창작자는 처음 검색을 시작하는 순간부터(P1) 원하는 방향성의 이미지를 찾는 과정(P1, P4, P6, P7), 그리고 레퍼런스를 찾은 이후까지도 어려움을 겪으며(P3), 이에 따라 불필요한 시간이 소모된다. 이 과정에서 사용자들은 원하는 레퍼런스를 빠르게 찾기 위해 레퍼런스의 성격이나 특징을 스스로 조절하고 싶어 한다는 니즈를 발견할 수 있었다(P7). 셋째, 러프 스케치 및 디지털 작업 단계에서는 창작자가 레퍼런스를 보더라도 실제 창작을 하는 과정에서 구현의 어려움이 있음을 확인하였고(P5), 이를 <Table 6>으로 정리했다. 이처럼 사용자 조사 결과, 창작의 과정별로 창작자가 다른 페인 포인트를 겪고 있음을 확인할 수 있었으며, 현재 창작 과정별로 다른 특성을 고려하지 못한 생성 AI의 이미지 생성 및 수정 방식이 더 세분화되어야 할 필요가 있음을 확인했다.
결국 창작자가 창작의 전 과정에서 갖는 일관된 니즈는 ‘자신의 의도에 가까운’ 이미지를 얻는 것이었다. 그러나 ‘의도에 가깝다’라는 의미는 여러 구체적인 목적을 포괄하는 상태로 사용되고 있었는데, 창작자가 레퍼런스를 검색하는 유형을 통해 의도에 가깝다는 의미가 두 가지로 나뉘는 것을 알 수 있었다<Table 5>. 첫째, 사용자는 레퍼런스를 통해 생각지 못한 이미지를 보고 자신이 더 원하는 이미지를 알게 된다. 둘째, 사용자는 레퍼런스를 통해 자신도 정의 내리지 못하는 모호한 요소들을 구체화한다. 이러한 인사이트를 통해 이미지 생성 및 수정의 방식을 각각 ‘다양화’와 ‘구체화’로 세분화하였다.
3. 3. 실험 진행
‘다양화’는 콘셉트 키워드를 중심으로 자연어 프롬프트만 변주하여 핵심 콘셉트를 유지하되 스타일을 변화한 이미지를 생성하는 방법이다. 이 방법은 콘셉트 키워드를 기반으로 하므로 전체적인 콘셉트를 유지하면서 창작의 초반, 중반, 후반에 모두 다양한 스타일을 제공한다. 반면, ‘구체화’는 레퍼런스 이미지를 중심으로 하므로 콘셉트 키워드에 따라 프롬프트가 변화하더라도 이미지들의 시각적인 유사성은 유지된다. 시각 언어를 기반으로 하는 구체화는 레퍼런스 이미지의 느낌을 유지하면서 미세한 표현법과 구도에 차이를 주어 창작자가 원하는 느낌을 더 구체적으로 얻을 수 있다<Figure 4>. 다양화와 구체화는 모두 콘셉트 키워드를 기반으로 시작되기 때문에 이미지 생성 초반에는 시각적으로 큰 차이가 없지만 창작의 과정이 진행됨에 따라 두 생성 방식의 차이가 시각적으로 명확해진다<Figure 5>.
실험 참여자는 AI의 도움을 받아 포스터를 창작하는 실험을 <Figure 6>의 프로세스로 진행하였으며, 창작의 과정별로 다양화와 구체화 이미지 중 어떤 생성 방식이 창작의 의사결정에 더 도움이 되는지 판단하였다<Table 5>. 이러한 과정을 거치면서 초반에는 유사한 구도와 사물로 포스터를 스케치했던 창작자들이 AI 이미지를 통한 선택의 단계를 거친 후 각자가 의도한 이미지를 구체화하였으며, 이러한 부분들이 시각적인 형태로 최종 스케치에 반영된 것을 확인할 수 있었다<Figure 7>.
4. 실험 결과
4. 1. 이미지 생성 AI를 활용한 디지털 창작 과정별 사용자 인식
창작자가 디지털 창작 과정별로 생성 AI 이미지가 기여했다고 느낀 점은 <Table 6>과 같다. 창작자는 디지털 창작 과정 중 중반에서 특히 생성 AI로부터 받은 도움이 유익하다고 느꼈다. 이는 방향성이 잡히지 않은 초반과 이미 뚜렷한 방향성이 잡힌 후반과 달리 중반 단계에서는 창작자가 의도하는 방향성이 일정 수준으로 잡혀 있으며, 그 안에서 다양한 옵션을 확인할 수 있다는 점에서 유용하다고 생각하기 때문이다.
이러한 창작에서의 경험은 실제 창작에서 생성 AI를 활용하고 싶은 창작 과정이 언제인지에 대한 답변에서도 유의미하게 유지되었다. 이는 생성 AI의 특성들이 창작의 중반 과정에서는 대체로 긍정적으로 작용하나, 초반과 후반은 중반과는 다른 특성이 있기 때문에 생성 AI의 이미지 생성 방식이 더 세분화되어야 한다는 점을 의미한다<Table 7>.
4. 2. 다양화/구체화의 창작 과정별 특징과 사용자 인식
창작자는 전반적인 창작 과정에서 꾸준히 자신의 ‘의도에 가까운’ 이미지를 제공받고 싶어 하며, 특히 창작의 초반과 중반에서 이러한 요구가 강하게 나타난다. 또한, 창작자는 창작의 초반과 중반에서 AI로부터 다양한 스타일의 이미지를 제안받을 때 작품의 방향성에 영향을 받으며, 이는 아직 구체적인 방향성이 잡히지 않은 초반에 더 큰 만족감을 준다. 디테일한 시각적 요소는 창작의 후반으로 갈수록 사용자가 더 많이 참고하는 요소이며, 창작자가 후반에서 생성 AI의 결과물이 창작물의 주제를 충실하게 담아내고 있는지 확인하는 패턴을 발견할 수 있었다. 또한, 창작자들은 발산의 과정에서 다양화보다는 구체화에서 더 큰 만족감을 얻었으며, 수렴의 과정에서는 다양화와 구체화 모두에서 만족도를 얻었다. 이는 발산의 과정에서는 다양한 스타일의 이미지를 선호하고 수렴의 과정에서는 구체화된 이미지를 선호할 것이라는 예측과는 달리, 창작자는 발산의 과정에서 자신의 의도를 시각적으로 잘 구현한 이미지를 선호하며, 수렴의 과정에서는 의도했던 이미지가 아니더라도 예상치 못한 이미지에 유의미한 영향을 받기도 한다는 것을 의미한다<Table 8>.
실험 결과, 창작자가 창작의 과정별로 뚜렷하게 선호하는 특정한 경향성이 두드러지는 것은 아니었지만, 창작자는 발산과 수렴의 과정에서 전체적으로 자신의 의도와 가까운 이미지를 선호한다고 답했으며, ‘의도에 가까운’ 이미지로 주로 언급된 이미지 생성 방식은 ‘구체화’였다. 다양화된 이미지를 보고 의도에 가깝다고 답한 창작자는 거의 없었으며, 구체화된 이미지를 보고 의도에 가깝다고 답한 창작자는 과반수를 넘는 60%였다. 구체화 생성 방식이 항상 사용자의 의도에 가까운 이미지를 생성하는 것은 아니지만, 다양화 생성 방식보다는 사용자에게 ‘의도에 가까운 이미지를 생성한다’라는 인식을 준다는 것을 확인할 수 있다.
“제가 원하는 스타일이 나온 이후부터는 구체화가 더 도움이 되었어요(P2).”“후반부에 확실히 제가 원하는 스타일과 가까운 이미지들을 제공해주어 더 유효하다고 느꼈습니다. 커다란 스타일 변화보다는 미세한 표현법이나 구도에서 도움이 되었어요(P3).”“의도한대로 잘 나온 이미지들 안에서 생각지 못한 약간의 변주를 주는 느낌이 만족스럽습니다(P6).”
창작자는 이처럼 전반적으로 구체화된 이미지를 선호하지만, 다양한 이미지에서 레퍼런스를 선택하기도 하는데, 적은 확률이지만 어느 순간 우연히 다양한 스타일의 이미지에서 생각지 못한 마음에 드는 이미지를 접하게 되었을 때, 전체 콘셉트를 변경하기도 하였다. 창작자가 의도와 다른 생성 AI의 이미지에 만족하는 경우로는 창작자의 취향이 반영된 이미지, 생각지 못한 표현법 제안, 그리고 평소 작업 스타일과 정반대여서 신선한 느낌을 주는 경우가 있었다. 다양화에서 창작자는 다양한 스타일에 유희성을 느끼고 만족감을 얻었는데도 참고할 레퍼런스로는 구도가 가장 안정적으로 느껴지는 구체화 이미지를 선택하기도 하였는데, 이는 생성 AI의 유희성이 창작의 구체적인 의사결정에 크게 반영되지 못하는 요소일 수 있음을 의미한다<Table 9>.
4. 3. 다양화/구체화에서 사용자가 선호하는 시각 요소
생성 AI 이미지에서 창작자가 얻는 시각 정보로 언급한 항목은 ‘색감, 느낌, 무드, 색다른 스타일, 색의 조화, 다양한 스타일, 주제 표현, 구성, 구도, 구성의 밸런스, 구도의 다양성, 완성도, 연출, 주목도, 표현 방식, 표현 요소, 텍스쳐, 대비, 사물, 포인트 요소’ 등이며, 이러한 시각 요소들은 다양화와 구체화에서 각각 다른 강점과 특성을 갖는다. 창작자는 다양화 이미지에서 전체적인 느낌에 주로 긍정적인 영향을 받았으며, 구체화 이미지에서는 구성과 디테일한 표현 요소에 집중하는 경향을 보였다<Table 10>.
5. 결론 및 제언
5. 1. 연구의 결론 및 의의
AI 기술의 빠른 발전으로 이미지 생성 AI는 디지털 창작자의 주요 도구로 자리 잡았다. 그러나 생성 과정의 불투명성(블랙박스)과 창작자마다 다른 창작 과정으로 인해 창작자는 생성 AI를 자신의 의도대로 통제하기 어려운 상황에 직면하고 있다. 이에 본 연구는 생성 AI가 디지털 창작의 과정별로 창작자의 의도를 더 효과적으로 반영할 방법을 심화하여 탐구하였다. 연구 결과, 창작자는 특히 창작의 중반 단계에서 AI의 도움이 유익하다고 느꼈으며, 전반적인 창작 과정에서 ‘의도에 가까운’ 이미지를 꾸준히 제공받고자 하는 요구가 강하게 나타났다. 발산 단계에서는 구체화된 이미지를 선호하고, 수렴 단계에서는 예상치 못한 이미지에도 긍정적인 영향을 받았다. 이는 창작자가 발산 과정에서도 다양한 이미지보다는 자신의 의도를 시각적으로 잘 구현한 이미지를 선호함을 의미한다. 또한, 창작자는 다양한 스타일의 이미지에서 유희성을 느끼면서도 실제 참고할 레퍼런스로는 구도가 안정적인 구체화 이미지를 선택하는 경향을 보였다. 생성 AI가 제공하는 시각 정보는 색감, 무드, 스타일, 구성 등 다양한 요소로 구성되며, 다양화와 구체화에서 각각 다른 강점과 특성을 보였다. 창작자는 생성 AI의 시각 요소 중 다양화된 이미지에서 전체적인 느낌에 긍정적인 영향을 받았으며, 구체화된 이미지에서는 구성과 디테일한 표현 요소에 집중하는 경향을 보였다. 본 연구는 이러한 연구 결과를 통해 생성 AI의 이미지 생성 방식이 창작 과정의 단계별로 어떻게 구체화하여야 하는지를 제시함으로써, 이미지 생성 방식을 고도화할 수 있는 방향을 제안한다. 이는 창작자에게 더 맞춤화된 도구를 제공하는 데 기여할 수 있을 것이다.
5. 2. 연구의 한계 및 제언
본 연구는 다양한 창작 스타일을 가진 인터뷰이의 분석을 통해 다양한 분포의 데이터를 제공한다. 그러나, 실험에 참여한 창작자의 모수가 7명이므로, 연구 결과를 객관적으로 일반화하기엔 어려움이 있다. 또한, 실험에서 창작의 도구로 미드저니 툴을 활용했지만, 실제 생성 AI를 활용한 창작은 다양한 툴을 함께 사용하여 각 생성 AI 툴의 단점을 보완하는 방향으로 진행되고 있음을 고려해야 한다. 마지막으로 실험에서 더블 다이아몬드 프로세스를 기반으로 창작의 과정을 모방했지만, 실제 창작자가 디지털 작업을 하는 과정과 환경에 차이가 있다는 점을 유의해야 한다. 이에 실험 참여자의 모수를 늘려 입체적인 창작의 특성을 고려하고 실제 창작의 환경과 과정을 현실성 높게 반영하는 후속 연구를 통해 외적 타당성을 높일 필요가 있다. 이러한 연구는 생성 AI의 활용 방법을 더욱 고도화함으로써 디지털 창작자의 효과적이고 풍부한 창작 경험으로 이어질 것으로 기대한다.
Notes
Copyright : This is an Open Access article distributed under the terms of the Creative Commons Attribution Non-Commercial License (http://creativecommons.org/licenses/by-nc/3.0/), which permits unrestricted educational and non-commercial use, provided the original work is properly cited.
References
- Bae, S. (2021). A Study on the Trend of Digital Content Industry. Industial Promotion Research, 6(2), 1-10.
- Chonkko. (2023, March). [인공지능] 이것만 알자 : (1)생성 AI의 역사와 개념 [[Artificial Intelligence] Let's know this: (1) History and concept of generative AI]. Retrieved from https://futures-studies.tistory.com/.
- Chung, J. (2022). Case study of AI art generator using artificial intelligence. trans-, 13, 117-140.
- Kwon, D (2024). Analysis of Prompt Elements and Use Cases in Image-Generating AI: Focusing on Midjourney, Stable Diffusion, Firefly, DALL·E. Journal of Digital Contents Society, 25(2), 341-354. [https://doi.org/10.9728/dcs.2024.25.2.341]
- ITWorld. (2019, April). 인공지능의 세대 교체 "설명가능한 AI" [Transition of AI Generations: Explainable AI]. Retrieved from https://www.itworld.co.kr/techlibrary/115650.
- Kang, J., & Heo, J. (2023). Designers' Perception and Usage Intention of Style Transfer Technology as an AI Contents Generator Tool. Industrial Design (ID), 17(1), 51-62. [https://doi.org/10.37254/ids.2023.03.63.05.51]
- Kim, Y. (2023). AI invention and sufficiency of disclosure. Journal of Industrial Property, 74, 1-35. [https://doi.org/10.36669/ip.2023.74.1]
- Lee, H. (2023, January). [[KISTI Science Scent] 'AI Painter', an image creation AI that is causing a stir in the art world]. Retrieved from https://www.etnews.com/.
- Lee, L., & Choi, M. (2011). A Study of Double Diamond Design Process Stylized in Korean Form. JOURNAL OF THE KOREAN SOCIETY DESIGN CULTURE, 17(2), 411-423.
- Park, H. (2023). A Case Study On Application Of Text To Image Generator AI DALL·E. The Treatise on The Plastic Media, 26(1), 102-110. [https://doi.org/10.35280/KOTPM.2023.26.1.11]
- Park, P. (2021). AI-based Image Generation Algorithm and Photography. The Journal of Aesthetics and Science of Art, 62, 198-222. [https://doi.org/10.17527/JASA.62.0.08]