「2026年の推論税」：DevOps戦略をGPUサーバーレスとFP8量子化へ転換すべき理由