장기 추론 AI 에이전트를 위한 MCP 서버 오버헤드 최적화: 2026년 성능 및 토큰 효율 가이드