✅ 일론 머스크가 새 AI 모델 ‘그록 3’을 공개했어요.
✅ 성능 테스트 결과, 경쟁 모델보다 높은 평가를 받았어요.
✅ AI 에이전트 ‘딥서치’도 공개돼 치열한 경쟁이 예상돼요.
최신상 AI ‘그록 3’이 왔어요
한국 시간으로 지난 18일 오후 1시쯤, 일론 머스크 테슬라 CEO는 자신이 이끄는 인공지능(AI) 기업 xAI에서 개발한 새 AI 모델 ‘그록 3’을 소셜미디어 엑스(X)에서 생방송을 통해 공개했어요.🎊 머스크는 이날 공개에 앞서 “(그록 3은) 지구에서 가장 똑똑한 AI이다. 어떤 챗봇보다도 뛰어난 성능을 보인다.”라며 본인의 엑스 계정을 통해 🌏전 세계에 자랑했는데요.
그록3은 xAI가 구축한 세계 최대 AI 슈퍼컴퓨터인 콜로서스(Colossus)를 사용해 개발됐어요. 엔비디아의 최신 H100 그래픽처리장치(GPU)가 무려 20만 개나 탑재된 콜로서스 슈퍼컴퓨터로 총 2억 시간을 훈련시켰다고 하고요. 그록 3은 자체 오류 수정과 강화 학습 등을 통해 그록 2보다 정교한 결과를 제공하고 논리적 추론, 연산 능력, 적응력이 대폭 향상됐다고 해요.
성능이 얼마나 좋을까?
그렇다면 그록 3의 성능은 머스크의 말처럼 지구 최강일까요? 결론부터 말하면, 틀린 말은 아닌 것 같아요. xAI는 그록 3의 성능 테스크 결과를 공유했는데요. Chatbot Arena의 성능 비교 차트에 따르면, 그록 3은 경쟁 모델들을 상대로 가장 높은 점수를 기록해 🥇1위를 차지했어요. 이번 테스트는 익명의 AI 모델들을 사용자가 직접 비교하고 평가하는 방식으로 진행됐는데요. 이번 결과는 그록 3이 실사용 환경에서 오픈AI의 ‘GPT-4o’, 구글의 ‘제미나이 2.0’보다 더 나은 성능을 발휘했다는 걸 반증하고 있어요.

또한 xAI에 따르면, 그록 3은 수학(AIME 2024), 과학(GPQA), 코딩(LCB Oct-Feb)을 통해 논리적 추론 및 문제 해결 능력을 평가하는 Benchmarks 테스트에서도 ‘GPT-4o’, ‘제미나이 2.0’, 엔트로픽의 ‘클로드 3.5 소네트’, 딥시크의 ‘V3’ 같은 경쟁 모델보다 높은 성과를 보여 전 항목에서 1위를 했다고 전했어요. 다만, 이번 비교 군에는 GPT의 가장 고급 추론 모델인 ‘GPT-o3’은 들어있지 않았기 때문에 그록3이 챗GPT의 모든 모델을 압도했다고 볼 순 없다는 의견도 있어요.
AI 에이전트 ‘딥서치’도 공개
이번 그록3 공개 행사에서는 ‘딥서치(DeepSearch)’라는 새 AI 에이전트도 공개됐는데요. 오픈AI가 출시한 ‘딥 리서치’와 유사한 도구로, 질문받은 주제를 웹페이지와 엑스 등에서 오랜 시간 검색한 뒤, 광범위한 내용을 빠르게 정리해 사용자에게 필요한 정보를 제공한대요. 딥서치 기능은 그록 3에 탑재되며 일주일 뒤에는 🔊음성 모드도 추가될 예정인데요. 일론 머스크는 앞으로 2년 안에 그록 AI를 🚀스페이스X 로켓에 탑재할 거라고 말해 큰 기대감을 나타내고 있어요. 또한, 그록 3의 최신 버전이 완전히 출시되면 이전 버전의 오픈 소스를 공개할 거라고 예고해 ‘딥시크’의 오픈 소스 전략에 맞불을 놓기도 했어요.
그록 3은 엑스의 프리미엄 플러스 요금제 구독자들에게 우선 공개 예정인데요. 이후에는 월 30달러 또는 연 300달러로 이용할 수 있다고 하니까, 정식 출시되면 저도 한 번 꼭 써봐야겠네요.