구글 AI 모드 1위, 그러나 드러난 AI의 한계...비판적 사고의 중요성 강조
구글 로고 (사진= 로이터 연합뉴스)
주요 인공지능(AI) 모델을 대상으로 한 검색 정확도 테스트에서 구글의 'AI 모드'가 가장 높은 점수를 받으며 1위를 차지했다. 오픈AI의 최신 모델인 GPT-5 기반 챗GPT는 2위에 머물렀다. 이번 테스트는 AI가 복잡한 질문에 얼마나 정확하고 신뢰성 높은 답을 제공하는지 평가하기 위해 진행됐다.
워싱턴포스트(WP)는 지난 27일(현지시간) 미국 공공·대학 도서관 사서들과 함께 총 9개의 주요 AI 검색 도구를 대상으로 심도 있는 테스트를 진행했다고 보도했다. 테스트 대상에는 구글의 AI 모드와 AI 오버뷰를 비롯해 챗GPT(GPT-5, GPT-4 터보), 클로드(앤스로픽), 메타 AI, 그록(xAI), 퍼플렉시티, 빙 코파일럿(마이크로소프트)이 포함됐다. 모든 도구는 7~8월 기준 무료 기본 버전으로만 평가가 이뤄졌다.
총 30개의 까다로운 질문을 던져 얻은 900건의 답변을 점수화한 결과, 구글 AI 모드가 100점 만점에 60.2점으로 1위를 차지했다. 이는 웹을 깊이 탐색해 여러 출처를 종합하는 AI 모드의 강점이 반영된 결과로 풀이된다. 2위는 55.1점을 받은 GPT-5 기반 챗GPT가 차지했고, 퍼플렉시티가 51.3점으로 그 뒤를 이었다. 반면, 일론 머스크의 그록3는 40.1점으로 8위에 그쳤으며, 메타 AI는 33.7점으로 가장 낮은 점수를 얻었다.
---
퀴즈·최신 사건 부문 강세, 분야별로는 희비 갈려
이번 테스트는 퀴즈, 전문 자료 검색, 최근 사건, 내재된 편향(편견), 이미지 인식 등 5가지 분야에 걸쳐 진행됐다. 종합 점수와 별개로 각 부문에서는 AI 모델별로 희비가 엇갈렸다. 구글 AI 모드는 퀴즈와 최신 사건 부문에서 가장 정확하고 우수한 답변을 제공하며 강세를 보였다. 특히 최신 정보에 대한 검색 능력에서 다른 모델을 압도했다.
전문 출처를 검색하고 요약하는 능력에서는 빙 코파일럿이 가장 높은 점수를 받았다. 이미지 인식 부문에서는 퍼플렉시티가 최우수 모델로 꼽혔으며, 편향되지 않은 균형 잡힌 답변을 제공하는 데에는 GPT-4 터보가 가장 좋은 평가를 받았다. 한편, 전반적인 성능 개선을 보이며 2위를 차지한 GPT-5는 일부 영역에서는 오히려 GPT-4보다 낮은 점수를 받기도 해 모델별 편차를 드러냈다.
AI의 한계와 비판적 사고의 중요성
WP는 이번 테스트가 AI의 약점을 의도적으로 파고들었지만, 일상적인 질문에서도 AI가 여전히 제대로 답하지 못하는 경우가 많다는 사실이 드러났다고 분석했다. 특히 AI는 정보의 최신성이나 출처의 신뢰성을 판별하는 데 어려움을 겪는 것으로 나타났다. 때로는 잘못된 정보를 마치 사실인 양 자신 있게 내놓는 경향도 문제점으로 지적됐다.
WP는 "결국 AI가 내놓은 답변을 그대로 믿기보다는 사서처럼 출처를 확인하고, 최신성을 검증하며, 비판적으로 사고하는 능력이 여전히 중요하다는 교훈을 강조했다"고 전했다. AI는 인간의 사고를 돕는 도구일 뿐, 최종적인 판단은 여전히 인간의 몫이라는 의미다.
– 저작권자 ⓒ 국일일보, 무단전재•재배포 금지, AI 학습 및 활용 금지 –
이우창
기자
-
이재명 대통령 "4·19 정신으로 내란의 밤 물리쳐"…민주 수호 의지 강조
-
'인간 세계기록 7분 앞당겼다'... 中 휴머노이드, 21km 50분대 주파
-
민주당 48% vs 국힘 19%... 지방선거 앞두고 '정권 안정론' 우세
-
일본 ‘군사대국화’ 가속에 중국 강력 반발… "재군사화 멈춰라"
-
"위기를 기회로" 이 대통령, 'K-산업 제조 주권' 강화 전략 천명
-
평화는 32시간뿐… 러시아 700발 공습에 무너진 아파트, 아이까지 숨져
-
중동발 석유화학 수급 불안에 ‘매점매석 금지’ 칼 뽑아든 정부
-
'트럼프 위협' 정면돌파 선택한 캐나다…카니, 다수당 확보로 대미 항전 태세
-
전국 법관들 "사법 3법 입법 강행 유감... 재판 독립 침해 우려"
-
대만, 중국 ‘양안 교류’에 파상공세… “민의 왜곡한 국공 간 정치 밀약”
-
'중동 혼란·미중 회담' 틈새 노린 北… 신포 잠수함 기지서 무력시위
북한이 19일 오전 6시 10분경 함경남도 신포 일대에서 동해상으로 단거리 탄도미사일 수 발을 발사했다. 합동참모본부에 따르면 해당 미사일의 비행거리는 약 140km로 포착됐다. 한미 당국은 미사일의 제원을 정밀 분석 중이다. 발사 지점인 신포가 북한의 주요 잠수함 기지라는 점을 고려할 때 잠수함발사탄도미사일(SLBM)일 가능성이 제기된다. 신포는 북한이
-
'까르띠에 시계' 수수 공방... 전재수·한동훈, 선거법 위반 '맞고소'
전재수 더불어민주당 부산시장 후보와 한동훈 국민의힘 전 대표가 '명품 시계 수수 의혹'을 놓고 정면충돌했다. 두 사람은 17일 서로를 공직선거법 위반 등의 혐의로 맞고소하며 법적 공방에 돌입했다. 전 의원은 이날 자신의 사회관계망서비스(SNS)를 통해 "법 기술자는 결국 법 기술로 무너진다"는 제목의 글을 게시하며, 한 전 대표를 공직선거법상 허위사실
-
교통비 환급액 '두 배'로 늘어난다... 정부, 고유가 민생 대책 전격 시행
정부가 고유가 상황 속 국민의 대중교통 이용 부담을 경감하고 활성화를 도모하고자 교통비 환급 서비스인 ‘모두의카드(정액제 K-패스)’의 환급 기준을 완화하고, 출퇴근 시간대 환급률을 대폭 인상했다. 국토교통부 대도시권광역교통위원회(이하 대광위)는 2026년도 추가경정예산안의 국회 통과에 따라, 이달부터 오는 9월까지 6개월간 모두의카드의 환급 기준액을
-
권영빈 특검보, 이화영·방용철 과거 변호 전력…이해충돌 논란 확산
쌍방울 대북송금 사건 조작 기소 의혹을 담당하는 2차 종합 특별검사팀의 권영빈 특검보가 과거 이화영 전 경기도 평화부지사의 변호를 맡았던 것으로 확인됐다. 권 특검보가 검찰 수사의 문제점을 파헤치는 수사팀장을 맡으면서, 법조계 일각에서는 이해충돌 및 수사 공정성 논란이 제기되고 있다. 14일 법조계에 따르면 권 특검보는 2012년부터 2014년 사이 이
-
"또 뚫린 부평IC"…죽음의 역주행, 구조적 결함인가
경인고속도로 부평나들목(IC) 일대에서 역주행으로 인한 사망사고가 잇따라 발생하면서 도로 구조 개선과 안전 대책 마련을 요구하는 목소리가 높다. 지난 9일 오전 1시 38분께 경인고속도로 부평IC 램프 구간에서 50대 A씨가 몰던 차량이 역주행으로 본선에 진입하다 직진 차량과 충돌했다. 1차 충돌 후 사고 수습을 위해 하차한 A씨가 후행 차량에 치이는
-
"월 수수료 60만 원"… 증시 변동성 틈탄 유튜버 불법 영업 기승
금융감독원은 유료 종목 추천 및 자동 주식매매 프로그램 판매 등 불법행위 정황이 포착된 유튜브 채널 5곳을 적발해 엄중 대응에 나설 방침이라고 12일 밝혔다. 금감원은 최근 중동 지정학적 리스크 등으로 인한 증시 변동성을 악용해 일부 ‘핀플루언서(금융+인플루언서)’가 부적절한 투자 정보를 제공하거나 불공정거래를 주도한다는 우려가 제기됨에 따라 '모니터링
-
"깨끗한 등기부의 함정"… 사회초년생 울린 '동시 진행' 전세사기
신축 오피스텔 '깡통전세' 수법으로 사회초년생의 임대 보증금 수십억 원을 가로챈 일당이 경찰에 붙잡혔다. 서울경찰청 광역수사단 광역범죄수사대는 건축주, 분양브로커, 바지 임대인, 공인중개사 등 수도권 일대에서 전세 사기를 벌인 일당 49명을 송치했다고 10일 밝혔다. 이 중 전세 계약서를 월세 계약서로 위조한 바지 임대인 A씨는 구속 상태로 검찰에
-
북한, 하루 두 차례 탄도미사일 기습 도발... '발사 실패' 만회 시도인듯
북한이 8일 오전과 오후에 걸쳐 동해상으로 탄도미사일을 잇달아 발사했다. 전날 평양 일대에서 시도한 초대형 방사포 발사 실패를 만회하기 위한 의도로 풀이된다. 합동참모본부에 따르면 북한은 이날 오전 8시 50분경 강원도 원산 일대에서 단거리 탄도미사일(SRBM) 수 발을 발사했다. 이어 약 5시간 30분 뒤인 오후 2시 20분에도 동일 지역에서 탄도미사일
-
임신 중 비타민D 결핍, 자녀 알레르기 체질 만든다
임신 중 비타민D 결핍이 자녀의 아동기 면역 체계 형성에 결정적 결함으로 작용해 알레르기 질환 위험을 높인다는 국가 차원의 추적 조사 결과가 나왔다. 질병관리청 국립보건연구원은 호흡기알레르기질환 출생코호트 아동을 대상으로 진행한 추적 조사 결과를 5일 발표했다. 이번 연구는 국립중앙의료원 홍수종 교수 연구팀이 수행했다. 연구팀은 코호트에 참여한 3~9세
-
인천시, 수송용 수소 안정 공급 총력…“시민 이용 불편 최소화”
인천시는 최근 중동 정세 불안과 관련해 지역 내 수송용 수소 수급 상황을 긴급 점검한 결과, 현재까지 공급과 가격 모두 안정적인 상태를 유지하고 있다고 3일 밝혔다. 시는 이날 시청에서 국내 최대 액화수소플랜트 운영사인 SK이노베이션 E&S와 국내 최다 수소충전소 운영사인 SK플러그하이버스 등 주요 수급 기업 관계자 20여 명이 참석한 가운데 점검 회의를
국일일보 © 국일일보 All rights reserved.
국일일보의 모든 콘텐츠(기사 등)는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.
RSS




