멀티 에이전트 시스템의 사회적 동조 현상 완화를 위한 메타인지 기반 어댑터 프레임워크 연구
A Meta-Cognitive Adapter for Mitigating Social Conformity in Large Language Model-Based Multi-Agent System

초록

최근 대규모 언어모델을 기반으로 한 멀티에이전트 시스템 연구에서는 사회적 동조 현상이 중요한 한계로 지적되고 있다. 이러한 현상은 응답의 다양성을 약화시키고, 개별 에이전트가 독립적으로 사고하고 추론할 수 있는 능력을 저해한다. 본 연구는 이러한 동조 편향을 완화하기 위해, 외부에서 추정한 동조 수준에 따라 LLM 내부 표현을 조절하는 메타인지 어댑터 프레임워크를 제안한다. 프레임워크는 두 가지 구성 요소를 중심으로 설계되었다. 첫째, 외부 동조 예측기는 문장 수준 임베딩을 기반으로 독립적 응답과 사회적 노출 이후 응답 간의 정렬 정도를 추정하며, 둘째, 내부 조건부 어댑터는 트랜스포머 모델의 마지막 레이어에 결합되어 예측된 동조성 점수에 따라 은닉 표현을 조정함으로써 과도한 의견 정렬을 억제한다. 실험을 통해, 어댑터가 적용된 모델은 응답의 의미적 자연스러움을 유지하면서도, 다른 에이전트의 의견을 무비판적으로 따르는 경향이 현저히 감소하는 것으로 나타났다. 이는 모델 전체를 재학습하지 않고도, 메타인지적 자기 조절 메커니즘을 통해 멀티에이전트 토론 환경에서의 동조 편향을 효과적으로 완화하고, 보다 자율적이고 독립적인 추론을 유도할 수 있음을 보여준다.

키워드

사회적 동조성멀티에이전트 토론대규모 언어 모델메타인지 어댑터Social ConformityMulti-agent debateLarge Language ModelMeta-cognitive Adapter
제목
멀티 에이전트 시스템의 사회적 동조 현상 완화를 위한 메타인지 기반 어댑터 프레임워크 연구
제목 (타언어)
A Meta-Cognitive Adapter for Mitigating Social Conformity in Large Language Model-Based Multi-Agent System
저자
유선희권경민오하영
발행일
2026-05
유형
Y
저널명
한국정보통신학회논문지
30
5
페이지
747 ~ 754