기업용 인공지능(AI) 시장이 빠르게 진화하고 있는 가운데, 세일즈포스(Salesforce)가 공개한 새로운 벤치마크 시스템이 업계의 주목을 받고 있다. ‘MCP-유니버스(MCP-Universe)’로 명명된 이번 공개 벤치마크는 실제 환경에서 AI에이전트와 언어모델이 어떻게 상호작용하는지를 테스트하기 위해 설계됐다. 초기 테스트 결과, GPT-5는 가장 높은 성능을 보였지만 전체 과제의 절반 이상을 완벽히 해결하지 못하는 등 한계도 여실히 드러났다.
세일즈포스 AI 리서치팀은 모델 컨텍스트 프로토콜(Model Context Protocol, MCP)을 기반으로 실제 업무 도구와 상호작용하는 방식의 현실적인 평가 지표가 필요하다고 결론짓고, MCP-유니버스를… 더보기
답글 남기기