Qubic이 AI 벤치마크에서 Grok보다 성능이 좋은가?
Qubic은 자체 Neuraxon 2.0 아키텍처가 ARC-AGI-3 벤치마크에서 0.13%를 기록했으며, Grok 4.2 beta는 0.10%라고 주장합니다.
ARC-AGI-3은 인공지능 일반 지능(AGI)을 측정하는 가장 어렵고 권위 있는 벤치마크 중 하나입니다.
전통적인 벤치마크와 달리 AI가 데이터를 기억해 '속임수'를 부릴 수 있는 반면, ARC-AGI는 훈련 중 보지 못한 새로운 과제에 대해 추론하는 능력을 테스트합니다.
버전 3(ARC-AGI-3)은 인터랙티브하기 때문에 더욱 어렵습니다. AI는 환경을 탐색하고 스스로 규칙을 이해하며 적응하고 인간처럼 문제를 해결해야 합니다.
인간 점수 ≈ 100 %
재미 삼아 상위 점수 리스트를 조금 보여드리겠습니다:
Anthropic Opus 4.8 : ~1.5%
Gemini 3.1 Pro : ~0.4%
GPT-5.5 : ~0.4%
Neuraxon 2.0 (Qubic): 0.13%
Grok 4.20 : 0.1%
잘 이해하지 못하는 분들을 위해, 두 명의 박사가 우리 뇌의 작동 방식을 모방한 AI를 개발하고 있으며, 이후 Qubic 네트워크에 배포할 예정입니다. 현재 AI는 방대한 데이터베이스에 불과하며 자체적으로 추론하지 못합니다. 우리는 스스로 추론하는 AI, 즉 AGI를 원합니다. 이 분야에서 Qubic은 수천억 달러 규모의 기업들과 경쟁하고 있습니다.
다시 말씀드리지만, 급한 사람에게 Qubic은 맞지 않습니다. 현재는 오히려 인플레이션이 심합니다. 하지만 기술이 성공한다면 시장은 준비가 안 되어 있을 것입니다. 우리는 기술에 대해 이야기하고 있으므로 아무도 확신할 수 없습니다. 내일 아침에 아시아에서 온 새로운 프로젝트가 그들이 시도하는 일을 성공했다는 소식을 들을 수도 있습니다. 투자에 있어 사람들은 감정을 자제하고 사랑에 빠지지 말아야 한다는 점을 강조하고 싶습니다. 저는 가격이 아니라 기술에 대해 이야기하고 있습니다.
