구글 AI 모드 1위, 그러나 드러난 AI의 한계...비판적 사고의 중요성 강조
구글 로고 (사진= 로이터 연합뉴스)
주요 인공지능(AI) 모델을 대상으로 한 검색 정확도 테스트에서 구글의 'AI 모드'가 가장 높은 점수를 받으며 1위를 차지했다. 오픈AI의 최신 모델인 GPT-5 기반 챗GPT는 2위에 머물렀다. 이번 테스트는 AI가 복잡한 질문에 얼마나 정확하고 신뢰성 높은 답을 제공하는지 평가하기 위해 진행됐다.
워싱턴포스트(WP)는 지난 27일(현지시간) 미국 공공·대학 도서관 사서들과 함께 총 9개의 주요 AI 검색 도구를 대상으로 심도 있는 테스트를 진행했다고 보도했다. 테스트 대상에는 구글의 AI 모드와 AI 오버뷰를 비롯해 챗GPT(GPT-5, GPT-4 터보), 클로드(앤스로픽), 메타 AI, 그록(xAI), 퍼플렉시티, 빙 코파일럿(마이크로소프트)이 포함됐다. 모든 도구는 7~8월 기준 무료 기본 버전으로만 평가가 이뤄졌다.
총 30개의 까다로운 질문을 던져 얻은 900건의 답변을 점수화한 결과, 구글 AI 모드가 100점 만점에 60.2점으로 1위를 차지했다. 이는 웹을 깊이 탐색해 여러 출처를 종합하는 AI 모드의 강점이 반영된 결과로 풀이된다. 2위는 55.1점을 받은 GPT-5 기반 챗GPT가 차지했고, 퍼플렉시티가 51.3점으로 그 뒤를 이었다. 반면, 일론 머스크의 그록3는 40.1점으로 8위에 그쳤으며, 메타 AI는 33.7점으로 가장 낮은 점수를 얻었다.
---
퀴즈·최신 사건 부문 강세, 분야별로는 희비 갈려
이번 테스트는 퀴즈, 전문 자료 검색, 최근 사건, 내재된 편향(편견), 이미지 인식 등 5가지 분야에 걸쳐 진행됐다. 종합 점수와 별개로 각 부문에서는 AI 모델별로 희비가 엇갈렸다. 구글 AI 모드는 퀴즈와 최신 사건 부문에서 가장 정확하고 우수한 답변을 제공하며 강세를 보였다. 특히 최신 정보에 대한 검색 능력에서 다른 모델을 압도했다.
전문 출처를 검색하고 요약하는 능력에서는 빙 코파일럿이 가장 높은 점수를 받았다. 이미지 인식 부문에서는 퍼플렉시티가 최우수 모델로 꼽혔으며, 편향되지 않은 균형 잡힌 답변을 제공하는 데에는 GPT-4 터보가 가장 좋은 평가를 받았다. 한편, 전반적인 성능 개선을 보이며 2위를 차지한 GPT-5는 일부 영역에서는 오히려 GPT-4보다 낮은 점수를 받기도 해 모델별 편차를 드러냈다.
AI의 한계와 비판적 사고의 중요성
WP는 이번 테스트가 AI의 약점을 의도적으로 파고들었지만, 일상적인 질문에서도 AI가 여전히 제대로 답하지 못하는 경우가 많다는 사실이 드러났다고 분석했다. 특히 AI는 정보의 최신성이나 출처의 신뢰성을 판별하는 데 어려움을 겪는 것으로 나타났다. 때로는 잘못된 정보를 마치 사실인 양 자신 있게 내놓는 경향도 문제점으로 지적됐다.
WP는 "결국 AI가 내놓은 답변을 그대로 믿기보다는 사서처럼 출처를 확인하고, 최신성을 검증하며, 비판적으로 사고하는 능력이 여전히 중요하다는 교훈을 강조했다"고 전했다. AI는 인간의 사고를 돕는 도구일 뿐, 최종적인 판단은 여전히 인간의 몫이라는 의미다.
– 저작권자 ⓒ 국일일보, 무단전재•재배포 금지, AI 학습 및 활용 금지 –
이우창
기자
-
이재명 대통령 "지선 민심 겸허히 수용… 여야 정당 불문 협력할 것"
-
37년 흘러도 철저한 통제…베이징 공안, 톈안먼 유족 참배 막고 도청까지
-
국내 디지털플랫폼 영토 161조 돌파... '네이버·카카오·쿠팡이 일상 지배했다'
-
美 루비오 "이란, 사상 최초 핵 협상 동의... 군사 압박 통했다"
-
전·현직 대통령 '대리전' 치달은 6·3 지선… 정책 선거는 결국 실종됐다
-
"이란 반격 정밀했다"…중동 내 사드·조기경보통제기 등 미군 시설 20곳 피격
-
한-아프리카 외교장관회의 개막, "2029 정상회의 개최 논의 착수"
-
"2000년 닷컴 버블 재림인가" vs "HBM이 만든 신세계다"…AI 거품론 격돌
-
'욱일기·초계기 갈등' 딛고 다시 마주하는 한일 군함…내달 7일 SAREX 실시
-
"신군국주의" vs "적반하장"…중·일, 샹그릴라 대화서 정면충돌
-
특검, 윤석열 전 대통령 6일 포토라인 세운다…“국민 알 권리 우선”
윤석열 전 대통령이 오는 6일 피의자 신분으로 특검 포토라인에 선다. 권창영 종합특검팀은 1일 국민의 알 권리 차원에서 윤 전 대통령의 출석 과정을 전면 공개하겠다고 밝혔다. 대통령 측도 특검의 공개 소환 방침을 최종 수용한 상태다. 윤 전 대통령은 소환 당일 서울구치소에서 법무부 차량으로 이송돼 사복 차림과 포승줄에 묶인 채 특검 청사로 입장하게 되며,
-
"소풍도 수학여행도 눈치보기 끝"... 꽁꽁 얼어붙은 학교 현장, '교사 보호망' 가동한다
내년 상반기부터는 수학여행을 비롯한 현장체험학습에서 안전사고가 발생하더라도 고의나 중과실이 없다면 인솔 교사에게 법적 책임을 묻지 않는다. 이와 함께 사고 발생 시 즉시 전담변호사를 지정해 법률 상담부터 소송 대응까지 교육청이 전 과정을 일괄 지원하기로 했다. 교육부는 28일 이 같은 내용을 골자로 한 '현장체험학습 지원 방안'을 발표했다. 이번 방안에
-
제목: 북, 'AI 탑재' 신형 순항미사일 시험발사... "수도권 정밀타격 노리나"
北, 탄도·순항미사일, 방사포 섞어서 시험발사…김정은 참관(종합) 김정은 "현 정세는 부단한 군사력 갱신 재촉…강력한 포병무력 건설" 북한이 전술 탄도미사일과 방사포를 동시에 발사할 수 있는 신형 경량 발사체계와 인공지능(AI) 정밀 유도 기능이 도입된 다연장 전술 순항미사일 체계의 시험발사를 단행했다. 이 무기체계들이 군사분계선(MDL) 인근 최전방에
-
'공소청 변신' 앞둔 대검의 승부수…'전건송치'로 수사종결권 재조정 돌입하나
대검찰청이 국무총리 산하 검찰개혁추진단에 검찰 제도 개편과 관련해 '수사·기소 분리' 원칙을 지키기 위해서는 '전건(全件)송치 제도'를 복원해야 한다는 공식 의견을 제출했다. 26일 법조계에 따르면 대검은 최근 법무부를 통해 검찰개혁추진단에 "수사·기소 분리라는 검찰 제도 개편 원칙을 감안하면 전건송치 제도가 필요하다"는 취지의 의견서를 전달했다. 이는
-
홈플러스 본체 매물로 나왔지만…유통가 냉담한 반응에 회생 '산 넘어 산'
'벼랑 끝' 홈플러스가 잔존사업 매각이라는 마지막 카드를 꺼내 들었다. 핵심 우량 자산인 기업형 슈퍼마켓(SSM) 홈플러스 익스프레스를 매각하기로 한 데 이어, 본사와 대형마트, 온라인몰을 아우르는 잔존사업 부문 전체를 매각하는 최종 승부수를 띄웠다. 지난 1년 동안 회생 절차를 밟아온 홈플러스는 최근 임직원 급여와 상품 납품대금 지급에 차질을 빚는 등
-
분열의 시대에 던진 '포용과 공감'… 칸의 선택은 문주의 '피오르드'였다
루마니아의 거장 크리스티안 문주 감독의 영화 '피오르드'가 제79회 칸 국제영화제 황금종려상의 영예를 안은 가운데, 기대를 모았던 나홍진 감독의 '호프'는 아쉽게도 고배를 마셨다. '피오르드'는 23일(현지시간) 프랑스 칸 뤼미에르 대극장에서 열린 폐막식에서 최고상인 황금종려상 수상작으로 호명됐다. 크리스티안 문주 감독은 수상 소감에서 오늘날 사회의
-
무작정 굶는 다이어트, 불면증 초래… 여성 숙면 비결은 '에너지 균형'
여성의 숙면이 하루 섭취하는 열량과 신체 활동으로 소비하는 열량의 균형에 큰 영향을 받는다는 연구 결과가 나왔다. 에너지 섭취와 소비의 균형을 알맞게 유지한 여성은 극단적으로 식단을 제한하여 에너지가 부족한 여성에 비해 수면 부족을 겪을 위험이 29% 낮은 것으로 나타났다. 서울대병원 가정의학과 박민선 교수와 서울시보라매병원 가정의학과 서민정 교수 공동
-
"담합 신고하면 인생 역전"…공정위, 불공정거래 포상금 상한선 없애고 과징금 10% 준다
정부가 담합 등 불공정 거래 행위 내부 신고자에 대한 포상금 상한액을 없애고, 포상금 지급 요율을 과징금의 최대 10%로 일원화하는 등 파격적인 대우에 나선다. 공정거래위원회는 21일 이 같은 내용을 골자로 한 '공정거래법 등 위반행위 신고자에 대한 포상금 지급에 관한 규정' 개정안을 마련해 다음 달 10일까지 행정예고한다고 밝혔다. 은밀한 기업 간
-
'국정 동력' 노리는 민주 vs '정권 견제' 벼르는 국힘… 6·3 선거전 점화
여야는 6·3 지방선거 및 국회의원 재·보궐 선거 공식 선거운동 개막을 하루 앞둔 20일, 총력전 태세를 갖추고 승리를 다짐했다. 집권 여당인 더불어민주당은 이재명 정부 출범 후 첫 전국 단위 선거인 만큼 '내란 심판'과 '민생 경제'를 전면에 내세워 국정 동력 확보를 호소할 방침이다. 반면 국민의힘은 여당의 입법·행정 권력에 이은 지방 권력마저 독점할
-
인천시, 국내 최초 '양자기술 공공실증' 시동… 마약 감시 패러다임 바꾼다
인천시가 공공안전 분야에 양자기술을 접목한 '하수 내 마약류 감시 시스템' 구축에 나선다. 국내 최초로 시도되는 시민 체감형 양자기술 실증사업이다. 인천시는 '양자 기술 도입·전환(QX) 기반 시민체감 공공안전 실증사업'의 주관기업으로 (주)지큐티코리아를 선정하고 본격적인 실증에 착수했다고 밝혔다. 인천시와 인천테크노파크가 공동 추진하는 이번 사업은 지역
국일일보 © 국일일보 All rights reserved.
국일일보의 모든 콘텐츠(기사 등)는 저작권법의 보호를 받은바, 무단 전재, 복사, 배포 등을 금합니다.
RSS




