django模板系统-源码分析-1

## django模板简单实例 ---------------------- 简单的hellowold 示例。 undefined **- Template: 模板类，通过render方法求值** **- Context：环境类，保存上下文环境，变量到值的映射** **- variable：通过{{ }}引用变量** ## django.template.Lexer --------------------------- django模板系统就是实现了一个小型的解释型语言，其中Template是编译器实例，Context是环境变量。源码中的其他几个类的作用。 **- Lexer：词法分析类，将模板原始字符串转换成token** **- Parser: 语法分析类，将给定的token转换成node，并生成抽象语法树** django模板系统中的Lexer比较简单，并不是完全的将所有原始字符串都转成token，它只负责处理4种标识转成4种token。至于每个token内字符串的解析稍后分析，Lexer解析成的4种token分别是: **- TOKEN_TEXT = 0 文本类型，模板里面的字面字符串** **- TOKEN_VAR = 1 变量类型，用{{ }}包围的字符串** **- TOKEN_BLOCK = 2 块类型，以{% %\}包围的字符串** **- TOKEN_COMMENT = 3 注释类型，以\{\# \#\}包围的字符串** Lexer会将原始字符串通过正则表达式解析为token，但不包括标识。如下所示。 undefined 简单匹配每个标识的开头和结尾。通过这里可以看到，如果一个语言语法中有块的结尾标识，解析起来是比较方便的。 undefined 因为Token类默认只有`__str__`方法，这里用`map`方法调用以显示token内的字符串。目前的调用路径为`Tempalte -> Lexer() => lexer -> lexer.tokensize => tokens`（->代表调用，=>代表返回值）。 ## django.base.Parser -------------------------- django模板的Parser负责解析Lexer生成的tokens生成语法树。Parser类在初始化函数中首先做的是加载内置库builtins，将django自带的一些tag极其filter加载进来，类似于初始化运行时环境。另外全局变量builtins在import时完成。具体如下 undefined Parser的逻辑分为几个部分：第一部分，Parser将给定的tokens解析为对应的语法node。node大概分为3种： **- TextNode: 存储text，模板原始字符的字面值，字符串** **- VariableNode：存储作为变量的字符，也可能是一个类似a.b.c的表达式** **- complied_result： block node中表达式的编译结果** #### TextNode TextNode比较简单，就是存储字面值，并且在render调用的时候返回该字面值。 ### VariableNode VariableNode比较复杂，本身存储的是一个叫做`FilterExpression`的实例，这个实例中存储的才是TOKEN\_VAR类型的token的内容（字符串）。简单的存储（依赖）关系是`token.contents -> FilterExpression -> VariableNode`。而这个`FilterExpression`就是处理VariableNode中的字符串，通过resolve求值。调用关系`Parser.parse -> Parser.compile_filter(token.contents) => filter_expression -> VariableNode(filter_expression) -> VariableNode.render -> filter_expression.resolve`。 ### complied_result complied\_result更为复杂，本身是一个叫做`complied_func(self,token)`的结果，其中`self`是Parser实例本身，token是TOKEN\_BLOCK类型的token。简单的调用关系`parser.parse -> token.contents.split()[0] => command -> parser.tags[command] => compiled_func => compiled_result`。BLOCK\_TOKEN存储的字符串的第一个单词（例如 if，with）作为key查找实际的处理函数complied\_func，调用compiled\_func会返回一个compiled\_result。这里可以猜到compiled\_result实际也是一个类node实例，通过resolve求值。 **每个node实现resolve求值方法，也就是具体BLOCK的语法逻辑。`template.render -> nodelist.render -> 遍历for node in nodelist --> node.render --> filter_expression.resolve(用户定义的方法，例如do_if) => string -> join(strings)返回字符串` ** 第二部分, Parser创建一个NodeList实例。nodelist作为语法树的载体，Parser.crate\_nodelist -> NodeList()。 ### NodeList nodelist继承于list存储同一个语法域（作用域？）的node。`render`方法会遍历当前的node，调用node.render返回一个完整的求值后的字符串。调用关系`nodelist.render -> for node in nodelist --> node.render => string -> 组合成一个字符串`。 ## django.template.Template ---------------------------------------- Template是整个django模板系统的入口函数，等同于一个解释器类interpreter。Template通过调用compile\_string返回nodelist语法树，通过render方法求值。调用关系`Template -> compile_string -> lexer => tokens -> parser => nodelist；Tempaltee.render -> nodelist.render最终求值`。 ## django.context.Context ---------------------------------------- Context是堆栈式的环境类，存储全局环境和上下文环境。Context内的dicts变量按照顺序存储每个作用域的环境变量的集合，这个集合是ContextDict的实例。Context.dicts的第一个元素dicts[0]就是一些内置变量集合{'True': True, 'False': False, 'None': None}。 **put Context的put方法存入当前ContextDict的实例，该实例存储了当前作用域定义的变量值。如 {% with 1 as a %}；** **pop Context的pop方法弹出最深作用域中变量值集合的ContextDict的实例；** **get Context的get方法获取给定变量的值。** undefined ### 几个不同Context类的关系和区别 BaseContext是几个类的基类，几个类的继承关系如下。 undefined Context类中的render\_context属性为RenderContext的实例，该属性会作为解析模板的上下文环境实例。增加render\_context作为模板中设置的变量的上下文环境，以免出现冲突。也就是说，Context.dicts保存django设置的模板环境变量，Context.render\_context保存模板中用户设置的变量。 RenderContext类中的`get`方法不会遍历dicts属性中的所有context实例，只会查找当前作用域（dicts中最后一个上下文环境实例）。 RequestContext类继承Context类，增加一个request参数，会调用所有的processors对request进行处理。 ## 模板中变量（TOKEN_VAR）的求值 ----------------------- TOKEN\_TEXT的求值方法比较简单，直接返回字面值就好。接下来探讨下模板中变量的求值，即以双大括号包围的变量的求值。 django模板中双大括号包围的字符首先经Lexer转为TOKEN\_VAR类型的token，然后传入Parser解析为VariableNode，然后通过调用其resolve方法求值。简单的求值顺序`variable|default:"Default value"|date:"Y-m-d"' -> Lexer => Token(TOKEN_VAR) -> Parser => VariableNode => VariableNode.resolve`求值。下面是源码中的示例。 undefined 前面说过Parser将TOKEN\_VAR类型token中的字符串token.contents传入FilterExpression，再将这个表达式传入VariableNode。当字符串转入FilterExpression后，就会被解析为两种值。一种是数字，所以在变量表达式双大括号中写数字是语法允许的；另一种是Variable实例，该实例负责在环境context中求变量本身的值。同时FilterExpression还将字符串中的filter以及参数提取出来，例如上面这个例子中的两个过滤器。求值时，FilterExpression会将Variable得到的变量值再依次传入filter中计算。过程为`Parser.compiler_filter(token.contents) => filter_expression -> VariableNode解析出variable实例以及filters；VariableNode.render -> FilterExpression.resolve -> Variable.resolve => 值 -> 依次将值带入各个filter求解最后的值`。可以简单叙述各类的功能。 **- VariableNode 负责提供方法，对外提供一个render方法。很类似适配器模式** **- FilterExpression 负责解析原始字符串（变量表达式），创建Variable实例以及filters，提供resolve方法** **- Variable 负责解析变量，在上下文环境中求值** ## 模板中块(TOKEN_BLOCK)的求值 --------------------------- Django模板系统中的BLOCK可以提供多种功能，逻辑判断（if）、循环（for）、赋值（with）等等。类比上面处理变量的过程，BLOCK的处理过程类似，唯一不同的是具体返回的node和解析BLOCK表达式交由用户定制，每个具体的node的调用通过表达的第一个单词区分，`command=token.contens.split()[0] -> compile_func=parser.tags[command] -> compile_func(parser, token)`，这个compile\_func返回的是一个用户自定义的node。而每个BLOCK剩余表达式的解析也由用户定义函数实现（类似FilterExpression），通过compile\_func调用。简单总结的说，用户自定义的node实现了BLOCK的逻辑部分；自定义的解析函数实现了parser部分。