구글 AI 모드 1위, 그러나 드러난 AI의 한계...비판적 사고의 중요성 강조
구글 로고 (사진= 로이터 연합뉴스)
주요 인공지능(AI) 모델을 대상으로 한 검색 정확도 테스트에서 구글의 'AI 모드'가 가장 높은 점수를 받으며 1위를 차지했다. 오픈AI의 최신 모델인 GPT-5 기반 챗GPT는 2위에 머물렀다. 이번 테스트는 AI가 복잡한 질문에 얼마나 정확하고 신뢰성 높은 답을 제공하는지 평가하기 위해 진행됐다.
워싱턴포스트(WP)는 지난 27일(현지시간) 미국 공공·대학 도서관 사서들과 함께 총 9개의 주요 AI 검색 도구를 대상으로 심도 있는 테스트를 진행했다고 보도했다. 테스트 대상에는 구글의 AI 모드와 AI 오버뷰를 비롯해 챗GPT(GPT-5, GPT-4 터보), 클로드(앤스로픽), 메타 AI, 그록(xAI), 퍼플렉시티, 빙 코파일럿(마이크로소프트)이 포함됐다. 모든 도구는 7~8월 기준 무료 기본 버전으로만 평가가 이뤄졌다.
총 30개의 까다로운 질문을 던져 얻은 900건의 답변을 점수화한 결과, 구글 AI 모드가 100점 만점에 60.2점으로 1위를 차지했다. 이는 웹을 깊이 탐색해 여러 출처를 종합하는 AI 모드의 강점이 반영된 결과로 풀이된다. 2위는 55.1점을 받은 GPT-5 기반 챗GPT가 차지했고, 퍼플렉시티가 51.3점으로 그 뒤를 이었다. 반면, 일론 머스크의 그록3는 40.1점으로 8위에 그쳤으며, 메타 AI는 33.7점으로 가장 낮은 점수를 얻었다.
---
퀴즈·최신 사건 부문 강세, 분야별로는 희비 갈려
이번 테스트는 퀴즈, 전문 자료 검색, 최근 사건, 내재된 편향(편견), 이미지 인식 등 5가지 분야에 걸쳐 진행됐다. 종합 점수와 별개로 각 부문에서는 AI 모델별로 희비가 엇갈렸다. 구글 AI 모드는 퀴즈와 최신 사건 부문에서 가장 정확하고 우수한 답변을 제공하며 강세를 보였다. 특히 최신 정보에 대한 검색 능력에서 다른 모델을 압도했다.
전문 출처를 검색하고 요약하는 능력에서는 빙 코파일럿이 가장 높은 점수를 받았다. 이미지 인식 부문에서는 퍼플렉시티가 최우수 모델로 꼽혔으며, 편향되지 않은 균형 잡힌 답변을 제공하는 데에는 GPT-4 터보가 가장 좋은 평가를 받았다. 한편, 전반적인 성능 개선을 보이며 2위를 차지한 GPT-5는 일부 영역에서는 오히려 GPT-4보다 낮은 점수를 받기도 해 모델별 편차를 드러냈다.
AI의 한계와 비판적 사고의 중요성
WP는 이번 테스트가 AI의 약점을 의도적으로 파고들었지만, 일상적인 질문에서도 AI가 여전히 제대로 답하지 못하는 경우가 많다는 사실이 드러났다고 분석했다. 특히 AI는 정보의 최신성이나 출처의 신뢰성을 판별하는 데 어려움을 겪는 것으로 나타났다. 때로는 잘못된 정보를 마치 사실인 양 자신 있게 내놓는 경향도 문제점으로 지적됐다.
WP는 "결국 AI가 내놓은 답변을 그대로 믿기보다는 사서처럼 출처를 확인하고, 최신성을 검증하며, 비판적으로 사고하는 능력이 여전히 중요하다는 교훈을 강조했다"고 전했다. AI는 인간의 사고를 돕는 도구일 뿐, 최종적인 판단은 여전히 인간의 몫이라는 의미다.
– 저작권자 ⓒ 국일일보, 무단전재•재배포 금지, AI 학습 및 활용 금지 –

이우창
기자
-
장동혁의 '단독회동' 승부수, 정국 주도권 향한 다목적 포석
-
결국 '재난사태' 선포된 강릉… 저수율 15.7% 역대 최저
-
트럼프 '관세 전쟁'에 사법부 제동… "대통령 권한 남용"
-
해수부 부산 이전, 지방선거 최대 '뇌관'으로 부상
-
노란봉투법, 국민 10명 중 6명 "찬성"…그러나 이념·세대 따라 '극명한 시각차'
-
김정은, 中 전승절 참석으로 다자외교 '첫발'
-
해외 직구 'K-브랜드' 주의보…4개 중 3개가 '짝퉁'
-
트럼프, '고전주의 건축' 의무화·공무원 교섭권 박탈... 논란의 행정명령 서명
-
정치가 과학을 해임하다: 美 CDC 초유의 사태
-
특검, 김건희 구속 기소 강행…'헌정사 초유'의 날
-
AI 기술에 드리운 '젠더 편향'의 그림자
챗GPT와 같은 생성형 인공지능(AI) 서비스 이용에서 남녀 간 사용률 차이가 두드러지고 있다는 연구 결과가 발표되었다. 남성은 여성에 비해 생성형 AI를 더 빈번하게 활용하며, 이는 특정 업무나 목표에 특화된 AI 도구를 사용할 때도 마찬가지였다. 이러한 뚜렷한 성별 간극은 AI 기술 자체의 발전에 편향을 가져올 수 있다는 전문가들의 우려를 낳고 있다.
-
채상병 사건 핵심 관계자, 황유성 전 방첩사령관 특검 출석
이명현 순직해병 특별검사팀이 채상병 사망 사건 수사 외압·은폐 의혹과 관련해 황유성 전 국군방첩사령관을 불러 조사했다. 황 전 사령관은 사건 당시 군 정보기관인 방첩사령부를 이끈 인물로, 이번 조사는 사건의 핵심적인 사실관계를 규명하는 데 중요한 역할을 할 것으로 예상된다. 황 전 사령관은 오늘(30일) 오전 9시 25분경 서울 서초구에 위치한 특검
-
김호중 이감으로 재조명… '소망교도소'의 모든 것
최근 음주운전 뺑소니 혐의로 복역 중인 가수 김호중이 민영교도소인 소망교도소로 이감되면서, 김호중의 이감은 많은 이들에게 낯선 개념이었던 민영교도소에 대한 대중의 궁금증을 불러일으켰고, 이로 인해 국내 유일의 민영교도소인 소망교도소가 설립 15년 만에 다시 주목받았다. 아시아 최초의 민영교도소, '소망교도소'의 탄생 소망교도소는 2010년 12월 경기도
-
전력 생산하고도 못 파는 소규모 사업자들, 정부가 연내 437㎿ 규모 접속 지원
산업통상자원부는 29일 '2025년 제2차 전력계통 혁신 포럼'을 열어 전력망 접속에 어려움을 겪는 소규모 발전 사업자를 위해 올해 안에 437㎿ 규모의 접속을 추진하기로 했다. 이날 포럼에는 산업통상자원부를 비롯해 국가기술표준원, 한국전력공사 등 관계 기관이 참석해 소규모 재생에너지 사업자들의 접속 지연 문제 해소 방안에 대해 심도 깊게 논의했다. 현재
-
이시원 전 비서관, 특검 재소환…'VIP 격노' 회의 진술 조태용 전 실장 겨눴다
이시원 전 대통령실 공직기강비서관이 채수근 상병 사망 사건 초동 조사 기록 회수 관여 혐의(직권남용)로 특별검사팀의 두 번째 피의자 조사에 출석한다. 특검팀은 새로 확보한 진술을 토대로 당시 상황을 교차 검증하는 데 주력하고 있다. 이 전 비서관은 29일 오후 1시 서울 서초동에 위치한 특검팀 사무실에 출석할 예정이다. 지난달 31일 첫 조사에 이은 두
-
당신이 믿는 AI는 몇 점? WP, 9개 AI 검색 도구 신뢰성 평가
주요 인공지능(AI) 모델을 대상으로 한 검색 정확도 테스트에서 구글의 'AI 모드'가 가장 높은 점수를 받으며 1위를 차지했다. 오픈AI의 최신 모델인 GPT-5 기반 챗GPT는 2위에 머물렀다. 이번 테스트는 AI가 복잡한 질문에 얼마나 정확하고 신뢰성 높은 답을 제공하는지 평가하기 위해 진행됐다. 워싱턴포스트(WP)는 지난 27일(현지시간) 미국
-
"트럼프 죽여라"... 미 성당 총격범의 증오
증오 문장 등이 적힌 美 미네소타 총격범의 총기와 탄창. (사진= 유튜브 이미지 캡처 로이터 연합뉴스)27일(현지시간) 미국 미네소타주 미니애폴리스의 한 가톨릭 학교 성당에서 어린이 2명을 포함한 다수의 사상자를 낸 총격범의 총기에서 도널드 트럼프 전 대통령을 향한 증오가 담긴 글귀가 발견돼 충격을 주고 있다.크리스티 놈 미 국토안보부 장관은 이날 자신의
-
한미회담 여론, 세대·이념 따라 '극과 극'으로 갈렸다
이재명 대통령과 도널드 트럼프 미국 대통령이 25일(현지시간) 미국 워싱턴DC 백악관에서 정상회담을 하고 있다. (사진= 워싱턴 연합뉴스)이재명 대통령과 도널드 트럼프 미국 대통령 간의 한미 정상회담에 대해 우리 국민 절반 이상이 긍정적으로 평가한다는 여론조사 결과가 27일 발표됐다. 특히 40대와 50대에서 높은 지지를 보인 반면, 20대에서는 부정적 시
-
젊은 당뇨 대란, 10대·20대 건강에 켜진 '적신호'
1형 및 2형 당뇨병 유병률 변화 및 성차간 위험도 과거 중장년층의 전유물로 여겨졌던 당뇨병이 이제 국내 30세 미만 청년층의 건강을 위협하는 중대한 공중 보건 과제로 부상했다. 지난 13년간 관련 환자가 가파르게 증가하는 추세 속에서, 특히 소득 수준이 낮은 취약 계층의 발병률이 현저히 높게 나타나 소득에 따른 건강 불평등 문제가 심각한 수준임이
-
'윤석열 구치소 CCTV' 판도라 상자 열리나…법사위, 현장검증 의결
26일 서울 여의도 국회에서 열린 법제사법위원회 전체회의에서 추미애 위원장이 발언하고 있다. (사진= 연합뉴스) 국회 법제사법위원회가 9월 1일 윤석열 전 대통령이 수감된 서울구치소를 방문해 구치소 내 폐쇄회로(CC)TV 영상을 직접 확인하기로 했다. 윤 전 대통령의 수감 생활 중 특혜 의혹과 특별검사팀의 체포