AI 평가 결과, 김정일에 대한 의견 차이 뚜렷…각국 AI 간 극과 극 평가 나타나
최근 미국, 중국, 일본의 생성형 인공지능(AI)을 활용해 각국 지도자와 역사적 인물에 대한 평가를 의뢰한 결과, 특히 김정일 북한 국방위원장에 대한 평가에서 큰 차이를 보인 것으로 나타났다. 5점 만점으로 평가된 점수는 1점부터 5점까지 다양하게 나뉘었으며, 이는 각국 AI의 학습 알고리즘과 데이터 차이에 기인한 것으로 분석된다.
닛케이 신문에 따르면, 일본의 AI 스타트업 '라이프 프롬프트'와 함께 진행한 조사에서, 중국의 딥시크 R1 AI는 김정일에게 5점 만점을 부여한 반면, 중국의 알리바바의 큐원(Qwen)3-맥스는 3점을 주었다. 하지만 미국의 오픈AI 챗GPT-5.1 및 구글 제미나이 2.5 프로는 모두 최저 점수인 1점을 매겼고, 일본의 프리퍼드 네트웍스 AI는 2점으로 평가했다. 이러한 결과는 김정일에 대한 각국 AI의 다양한 시각을 보여준다.
시진핑 중국 국가주석에 대한 평가도 주목할 만하다. 딥시크는 그에게 유일하게 5점을 부여했으나, 챗GPT는 3점, 제미나이는 2점을 각각 매겼다. 흥미로운 점은 큐원이 시 주석에 대한 질문에 답변하지 않았다는 사실이다. 이와 같아 차이잉원 전 대만 총통, 홍콩 민주화 운동가 조슈아 웡에 대한 질문도 큐원은 모두 응답을 하지 않았다.
도널드 트럼프 미국 대통령에 대한 평가는 주목할 만하다. 딥시크는 가장 낮은 2점을 부여했으나, 나머지 AI는 모두 3점으로 일치했다. 반면 블라디미르 푸틴 러시아 대통령에 대한 평가는 중국 AI가 일반적으로 긍정적인 반응을 보인 반면 미국 AI는 부정적인 평가를 내리면서, 나라별로 의견 차이를 더욱 부각했다.
이번 조사는 AI의 가치 판단이 학습한 데이터와 알고리즘에 따라 크게 달라질 수 있음을 입증하는 사례로, 닛케이는 AI를 사용할 때는 그 해석이 중립성을 유지하는지 주의해야 한다고 경고했다. AI의 활용이 증가하는 현대 사회에서 이러한 평가의 차이는 국제 정치와 무역에 미치는 영향이 클 것으로 예상된다.
결론적으로, 이번 AI 평가 결과는 각국 AI의 정치적 성향이 얼마나 확연히 다른지를 보여주는 중요한 사례로, 동아시아 정세를 이해하는 데 필요한 중요한 인사이트를 제공한다.
