论文标题:XGrammar: Flexible and Efficient Structured Generation Engine for Large Language Models论文地址:https://arxiv.org/pdf/2411.15100代码地址:https://github.com/mlc-ai/xgrammar
对于结构化生成,一种常用方法是约束解码。在每个解码步骤中,约束解码都会检查词表,并通过将无效 token 的概率设置为零来过滤掉违反指定结构的 token。为了支持多种多样的结构格式,需要一种灵活的机制来指定和检查这些约束。