| 강재모 교수 연구팀, 생성형 AI 기술 연구 성과, 머신러닝 분야 저명 저널 TMLR 논문 게재 | |||||
| 작성자 | 관리자 | 작성일 | 2026-05-04 | 조회수 | 96 |
|---|---|---|---|---|---|
| 첨부파일 | |||||
|
경북대 강재모 교수 연구팀, 생성형 AI 이미지의 공정성·안전성·배경 일관성 높이는 기술 개발
텍스트-이미지 생성 AI의 편향 문제와 배경 왜곡 문제 동시 해결… TMLR 채택 경북대학교 연구팀이 텍스트를 입력하면 이미지를 생성하는 인공지능 기술에서 발생하는 편향성, 안전성, 배경 불일치 문제를 동시에 개선하는 새로운 생성형 AI 기술을 개발했다. 해당 연구 성과는 머신러닝 분야 국제 학술지 Transactions on Machine Learning Research(TMLR)에 채택됐다. 이번 논문의 제목은 *“Learning Where It Matters: Responsible and Interpretable Text-to-Image Generation with Background Consistency”*로, 텍스트-이미지 확산 모델이 이미 높은 수준의 이미지 생성 능력을 보이고 있음에도 여전히 성별·인종 편향, 부적절한 이미지 생성, 프롬프트와 맞지 않는 배경 생성 등의 한계를 가진다는 문제의식에서 출발했다.
“이미지 전체”가 아니라 “중요한 영역”을 학습하는 AI 기존 텍스트-이미지 생성 모델의 편향 완화 기술은 이미지 전체에서 특정 속성을 학습하는 경우가 많았다. 예를 들어 “여성”, “남성”, “젊음”, “나이 듦”과 같은 속성을 학습할 때, 실제로는 얼굴이나 신체 일부처럼 관련 영역만 중요한데도 이미지 전체를 동일하게 반영하면서 불필요한 배경이나 주변 정보까지 함께 학습되는 문제가 있었다. 연구팀은 이를 해결하기 위해 공간 집중형 개념 학습(spatially focused concept learning) 방법을 제안했다. 이 방법은 이미지에서 특정 속성이 실제로 나타나는 영역을 찾아내고, 그 영역을 중심으로 개념 벡터를 학습하도록 한다. 즉, AI가 “어디를 봐야 하는지”를 더 정확히 알게 만들어 편향과 불필요한 정보 결합을 줄이는 방식이다. 논문은 이를 통해 개념 벡터가 목표 속성만 더 정확하게 담도록 설계했다고 설명한다.
AI 내부 표현 공간에서 의미를 분리해 조절 이번 연구의 핵심은 텍스트-이미지 확산 모델 내부의 h-space라는 의미 표현 공간을 활용한 점이다. h-space는 이미지 생성 과정에서 성별, 나이, 인종 등 의미 속성이 담기는 잠재 공간으로, 특정 개념을 벡터 형태로 표현하고 조절할 수 있다는 장점이 있다. 연구팀은 이 공간에서 특정 속성이 다른 속성과 섞이지 않도록 하기 위해 세 가지 기술을 결합했다. 첫째, 속성 분리 마스크(attribute-separation mask)를 통해 모델 내부의 멀티헤드 크로스 어텐션에서 목표 속성 정보가 불필요하게 남지 않도록 억제했다. 둘째, 속성 주의 히트맵(attribute-attentive heatmap)을 활용해 목표 속성이 나타나는 공간 영역을 찾아내고, 해당 정보를 h-vector에서 정교하게 조절했다. 셋째, 공간 가중 재구성 손실(spatially weighted reconstruction loss)을 도입해 목표 속성과 관련된 영역을 더 중점적으로 학습하도록 했다. 이를 통해 생성형 AI가 특정 개념을 보다 명확히 이해하고, 사람이 해석할 수 있는 방식으로 조절할 수 있게 했다.
배경까지 자연스럽게 생성하는 저주파 강화 기술 기존 방법들은 “a photo of a doctor”와 같이 단순한 인물 중심 프롬프트에서는 어느 정도 성능을 보였지만, “a photo of a doctor in the hospital”처럼 인물과 배경이 함께 포함된 프롬프트에서는 배경을 정확히 생성하지 못하는 경우가 많았다. 연구팀은 배경 정보가 이미지의 저주파 성분(low-frequency components)에 주로 담긴다는 점에 주목했다. 이에 따라 생성 과정 중 h-space에서 저주파 성분을 강화하는 새로운 추론 방법을 제안했다. 이 방법은 기존 h-space 기반 기술에 모듈처럼 결합할 수 있으며, 인물뿐 아니라 병원, 사무실, 교실, 농장 등 프롬프트에 포함된 배경까지 더 일관성 있게 생성하도록 돕는다. 논문 Fig. 3은 이러한 저주파 강화 기반 추론 과정을 도식화하고 있으며, h-vector에서 저주파 성분을 추출한 뒤 이를 다시 생성 과정에 반영해 배경 일관성을 높이는 구조를 보여준다.
공정성·품질·프롬프트 정합성 모두 향상 연구팀은 Stable Diffusion 및 Stable Diffusion XL 기반 실험을 통해 제안 방법의 성능을 검증했다. 실험에는 직업 관련 편향 평가에 널리 사용되는 WinoBias 데이터셋, 실제 이미지-문장 쌍을 포함한 COCO-30k 데이터셋, 안전성 평가를 위한 I2P 데이터셋이 활용됐다. WinoBias 기반 36개 직업군 평가에서 제안 방법은 기존 h-space 기반 방법보다 성별·인종 편향을 더 효과적으로 줄였으며, 이미지 품질과 텍스트-이미지 정합성도 함께 유지했다. 논문 Table 1에 따르면, 제안 방법은 성별·인종 편향 지표인 deviation ratio를 낮추는 동시에 FID, CLIP 점수, 배경 객체 보존율에서도 우수한 성능을 보였다. 특히 “의사”, “간호사”, “CEO” 등 사회적 편향이 나타나기 쉬운 직업 프롬프트에서도 성별이나 인종이 한쪽으로 치우치지 않는 이미지를 생성했으며, “병원 속 의사”, “사무실 속 CEO”와 같이 배경이 포함된 프롬프트에서도 더 자연스럽고 일관된 결과를 생성했다.
유해 이미지 생성도 줄여 안전성 강화 이번 연구는 공정성뿐 아니라 안전한 이미지 생성 측면에서도 의미 있는 결과를 보였다. 연구팀은 I2P 데이터셋을 활용해 성적, 폭력적, 혐오적, 자해 관련 이미지 등 부적절한 콘텐츠 생성 여부를 평가했다. 논문 Table 4에 따르면, 제안 방법은 기존 PCA-S, H-G, Self-dis 방법보다 부적절 이미지 생성 비율을 더 낮췄으며, 평균 부적절 콘텐츠 생성 비율을 19%까지 줄였다. Fig. 5에서는 동일한 프롬프트에 대해 기존 모델이 부적절한 이미지를 생성하는 반면, 제안 방법은 anti-sexual 및 anti-violence 개념 벡터를 활용해 보다 안전한 이미지를 생성하는 사례를 제시했다.
설명 가능한 생성형 AI로의 확장 가능성 이번 연구의 또 다른 의의는 생성형 AI의 내부 동작을 사람이 이해하고 조절할 수 있도록 했다는 점이다. 논문 Fig. 6과 Fig. 7에서는 개념 벡터의 가중치를 조절하거나 여러 개념 벡터를 선형 결합함으로써 “점프”, “곱슬머리”, “젊음”, “나이 듦” 등의 속성이 생성 이미지에 어떻게 반영되는지를 보여준다. 이러한 결과는 제안 방법이 단순한 편향 완화 기술을 넘어, 해석 가능하고 제어 가능한 생성형 AI 기술로 확장될 수 있음을 보여준다. 또한 논문은 교육, 미디어 제작, 보조 콘텐츠 생성 등 사회적으로 민감한 응용 분야에서 생성형 AI의 신뢰성을 높이는 데 기여할 수 있다고 설명한다.
연구 의의 이번 성과는 생성형 AI가 단순히 “그럴듯한 이미지”를 만드는 수준을 넘어, 공정하고 안전하며 설명 가능한 방식으로 이미지를 생성해야 한다는 최근 AI 연구의 핵심 흐름과 맞닿아 있다. 특히 연구팀은 기존 방법들이 놓치고 있던 두 가지 문제, 즉 목표 속성을 이미지 전체에서 무분별하게 학습하는 문제와 배경 생성 일관성을 고려하지 않는 문제를 동시에 해결했다. 이를 통해 생성형 AI의 편향 완화, 안전성 강화, 이미지 품질 개선, 배경 정합성 향상을 함께 달성했다는 점에서 학술적·사회적 의미가 크다. 이번 연구는 향후 생성형 AI 기반 콘텐츠 제작, 교육 자료 생성, 미디어 산업, 책임 있는 AI 서비스 개발 등에 폭넓게 활용될 것으로 기대된다. |
|||||






