뉴스 브리핑
Home 뉴스 브리핑
매일 중국에서 발행하는 언론사의 최신 뉴스를 요약·번역하여 제공합니다.
뉴스브리핑
中 알리바바, 사람 감정 읽는 AI 모델 공개
2025-03-14
자료인용안내
자료를 인용, 보도하시는 경우, 출처를 반드시 “CSF(중국전문가포럼)”로 명시해 주시기 바랍니다.
□ 알리바바가 개발한 R1-Omni 모델은 음성과 영상 정보를 통합 분석하여 기존 모델보다 높은 감정인식 정확도를 달성함.
◦ 알리바바의 음성·영상 정보 통합적 이해를 통한 감정인식 기술
- 알리바바(Alibaba)의 퉁이실험실(通义实验室)에서 개발한 R1-Omni 모델은 음성과 영상 정보를 충분히 이해하고 인물의 감정을 판단할 수 있음. 이는 RLVR(검증 가능한 보상을 통한 강화 학습) 방법을 통해 다양한 모달 정보와 특정 감정 간의 대응 관계를 명확히 제시하며, 기존 모델보다 더 일관되고 정확하며 설명 가능한 추론 과정을 제공함.
- R1-Omni은 시각 및 청각 정보가 감정 인식 과정에 어떻게 기여하는지 더 명확히 이해하고, 특정 감정 판단에 어떤 모달리티 정보가 핵심적 역할을 했는지 구체적으로 보여줌. 테스트 결과, 동일 분포 테스트 세트에서 원래 기준 모델보다 평균 35% 이상 향상된 성능을 보임.
◦ R1-Omni 모델의 훈련 방법론과 향후 발전 방향
- 모델 훈련은 콜드스타트(Cold Start) 단계와 RLVR 단계로 구성됨. 콜드스타트 단계에서는 580개 영상 데이터를 활용해 다중 모달 감정 인식 작업에서의 추론 능력을 초기 확보함. RLVR 단계에서는 정확도 보상과 형식 보상을 결합한 메커니즘을 통해 정확한 예측과 구조화된 출력을 동시에 장려함.
- 현재 R1-Omni은 자막 인식 부정확성, 환각 현상, 음성 신호(억양, 어조) 활용도 부족 등의 한계가 존재함. 연구진은 향후 연구 방향으로 기본 모델 능력 강화, 추론 출력의 환각 현상 감소, 음성 신호 활용도 제고, 추론 깊이와 감성지능 향상에 집중하고 있음.
원문링크
이전글 | 中 상장기업 파산회생 제도 개선 시급...회생투자자 188% 수익률 논란 | 2025-03-14 |
---|---|---|
다음글 | 中 Z세대의 영양제 소비 증가...유산균 시장 폭발적 성장 | 2025-03-14 |