You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

7.5 KiB

[TOC]


任务描述

本关任务:编写IRBuilder.cpp文件实现低级中间代码生成器为SysYF语言程序生成兼容的LLVM IR代码。

相关知识

实验框架

本实训项目提供用C++语言编写的SysYF IR 应用编程库,用于构建 LLVM IR的子集。为了简化你的实验本实训的实验框架代码已完成了SysYF源程序到 C++ 上的抽象语法树的转换。

Scope

IRBuilder.h中,还定义了一个用于存储作用域的类Scope。它的作用是在遍历语法树时,辅助管理不同作用域中的变量。它提供了以下接口:

// 进入一个新的作用域
void enter();
// 退出一个作用域
void exit();
// 往当前作用域插入新的名字->值映射
bool push(std::string name, Ptr<Value> val);
// 根据名字以及是否为函数的bool值寻找到对应值
// isfunc 为 true 时为寻找函数,否则为寻找其他变量对应的值
Ptr<Value> find(std::string name, bool isfunc);
// 判断当前是否在全局作用域内
bool in_global();

你需要根据语义合理调用enterexit,并且在变量声明和使用时正确调用pushfind。在类SysYFIRBuilder中,有一个Scope类型的成员变量scope,它在初始化时已经将特殊函数加入了作用域中。因此,你在进行名字查找时不需要顾虑是否需要对特殊函数进行特殊操作。

shared_ptr

为了防止内存泄漏,助教将框架中的裸指针换成了智能指针,相关的类型定义在include/internal_types中,其中以下的类型转换方法:

using std::static_pointer_cast;
using std::dynamic_pointer_cast;
using std::const_pointer_cast;

static_pointer_cast和dynamic_pointer_cast用于智能指针的类型转换隐式完成了拆包、类型转换、重新包装和内存控制块维护const_pointer_cast在转换时去除const属性含义和使用方法类似于static_cast、dynamic_cast和const_cast

std::vector<std::shared_ptr<Duck>> ducks;
ducks.push_back(std::static_pointer_cast<Duck>(std::make_shared<EdibleDuck>()));
shared_from_this

这是助教在更新代码框架时涉及的部分在实验中并不会用到有兴趣的同学了解即可。由于改成了智能指针我们在使用create方法创建IR中的Value对象时需要在初始化的时候生成它的智能指针并返回我们使用了include/internal_macros.h中的宏来定义使用了智能指针后新的初始化过程先创建该对象的智能指针然后对该智能指针调用init方法而在init的过程中可能会用到它自身的智能指针比如src/SysYFIR\BasicBlock.cpp中的parent_->add_basic_block(dynamic_pointer_cast<BasicBlock>(shared_from_this()));这时需要用shared_from_this原因参考cpp smart pointer

当然如果你企图直接使用构造函数而不用create方法的话你会很惊讶地发现你做不到因为助教已经很贴心地将构造函数设为private或者protected了所以不用担心不小心的使用而之所以不在构造函数中使用原因参考shared_from_this说明1shared_from_this说明2

本关具体任务

  1. 你需要在src/SysYFIRBuilder文件夹中调用SysYF IR应用编程接口填写IRBuilder.cpp文件,以实现 LLVM IR 的自动生成。注意以下几点:
    • a. 创建include/SysYFIR中的对象时只能通过create方法而不能直接使用构造函数(原因参考shared_from_this),如下:
      auto fun = Function::create(fun_type, node.name, module);
      
      而不是:
      auto fun = new Function(fun_type, node.name, module);
      
    • b. 尽量不要使用裸指针而是使用shared_ptr和相关的类型转换方法include/internal_types定义的类型和方法
  2. report.md内回答思考题
  3. contribution.md内由组长填写各组员的贡献比

编译、运行与验证

编译运行 SysYFCompiler

mkdir build
cd build
cmake ..
make

请注意你会发现CMakeLists.txt中的CMAKE_CXX_FLAGS多了很多参数我们介绍其中一部分(参考gcc warning options)

  • -Wextra打印一些额外的warning信息
  • -Wno-unused不警告未使用的变量框架中一些函数有一些不用的参数
  • -Wshadow如果一个局部变量隐藏掉了其他的变量、参数等报告warning
  • -Werror将所有的warning都视为error也就是说如果你觉得你的warning并不对程序正确性有影响你可以把-Werror删除。

编译后会产生 SysYFCompiler 程序它能将SysYF源程序sy文件输出为LLVM IR。
当需要对 sy 文件测试时,可以这样使用:

SysYFCompiler test.sy -emit-ir -o test.ll

得到对应的ll文件。

自动测试

本实训项目提供了自动评测脚本, 在Student/task3/目录下执行python3 test.py, 即可得到评测信息

思考题

请在report/report.md中详细回答下述思考题。

3-1. 在scope内单独处理func的好处有哪些。

选做

本实训项目提供了选做内容, 若你能完成选做部分, 将会有额外加分(仅针对本次实验的团队代码得分, 并且分数不能超过该部分得分上限)。

选做部分验收方式为线下验收,你需要在线下检查时提供对应代码通过助教给出的选做部分测试样例,并且讲解你的代码。

选做部分说明如下:(每个班只展示一部分)

  • H班:
    • 多维数组
  • 网安班:
    • 多维数组
    • 将一维数组指针作为参数
    • 逻辑运算(&&, ||, !), 重点考察短路计算

多维数组

目前给出的SysYF IR应用编程接口并不支持多维数组的实现因此你需要修改接口以实现多维数组的声明、初始化和使用你可以修改的内容为文件夹include/SysYFIRinclude/SysYFIRBuildersrc/SysYFIRsrc/SysYFIRBuilder内的所有内容

多维数组在目前的接口基础上,一般有两种做法:

  • 直接实现,可以参考 clang 生成的 LLVM IR修改当前接口使其支持多维的数组类型
  • 展平,把高维数组当成一维数组存储,修改当前接口使其能保存一些必要信息

在初始化多维数组时,与一维数组不同的是,存在对齐问题,这里假设多维数组的初始化为完全对齐(在每个大括号处均对齐),以下两种初始化是等价的:
int a[5][2] = {1,{2,3},{4},{5,6,7}}
int a[5][2] = {{1,0},{2,3},{4,0},{5,6},{7,0}}

数组指针参数 & 逻辑运算

目前给出的SysYF IR接口支持数组指针参数和逻辑运算的短路计算因此你不需要修改接口。
注意pointerarray的区别以及文法中&&||的优先级。

备注

测试样例除了位于版本库中的公开测例外,还包含不开放的隐藏测例。

平台上第三关的评测只判断公开测例是否完全通过, 第三关的分数由助教线下检查后,根据公开测例和隐藏测例的通过情况确定, 因此请自行设计合法测例测试你们的代码,确保你们的代码考虑了足够多情况以通过尽可能多的隐藏测例。

请将你编写的测例代码上传到Student/task3/test_stu/