|
|
|
|
# RISCV 移植记录
|
|
|
|
|
|
|
|
|
|
## 开发环境
|
|
|
|
|
|
|
|
|
|
* [riscv-rust/rust](https://github.com/riscv-rust/rust):使用[官方发布的二进制版本+源码](https://github.com/riscv-rust/rust/releases/tag/riscv-rust-1.26.0-1-dev)
|
|
|
|
|
* [riscv-gnu-toolchain](https://github.com/riscv/riscv-gnu-toolchain):使用OS2018腾讯云中使用的预编译版本
|
|
|
|
|
|
|
|
|
|
具体配置过程详见[Dockerfile](../riscv-env/Dockerfile)
|
|
|
|
|
|
|
|
|
|
## Rust-RISCV
|
|
|
|
|
|
|
|
|
|
### 目标指令集:RISCV32IM
|
|
|
|
|
|
|
|
|
|
target: riscv32im_unknown_none
|
|
|
|
|
|
|
|
|
|
由于工具链二进制版本尚未内置此target,因此需提供配置文件:`riscv32-blog_os.json`。
|
|
|
|
|
|
|
|
|
|
理想情况下,目标指令集应为RISCV32G,即使用全部扩展。但考虑到要把它跑在我们自己实现的CPU上,指令集应该尽量精简,即最好是RISCV32I。此外:
|
|
|
|
|
|
|
|
|
|
* 为什么用乘除指令扩展?
|
|
|
|
|
|
|
|
|
|
Rust核心库中fmt模块会使用乘除运算,若不使用乘除指令,则会依赖LLVM提供的内置函数进行软计算,导致链接错误。这一问题理论上可以通过在xargo中设置依赖compiler-builtin解决。但如此操作后,仍有一个函数`__mulsi3`缺失(32×32)。经查,compiler-builtin中实现了类似的`__muldi3`函数(64×64),所以理论上可以用它手动实现前者。但如此操作后,还是不对,实验表明`__muldi3`本身也是不正确的。
|
|
|
|
|
|
|
|
|
|
总之,没有成功配置不使用M扩展的编译环境,不过日后解决这一问题并不困难。
|
|
|
|
|
|
|
|
|
|
### 原子操作支持
|
|
|
|
|
|
|
|
|
|
配置文件中与原子操作相关的有两处:
|
|
|
|
|
|
|
|
|
|
* `feature`中`+a`:使用A指令扩展
|
|
|
|
|
* `max-atomic-width`:决定能否使用core中的atomic模块,设为0不可以,设为32可以
|
|
|
|
|
|
|
|
|
|
二者是否相关,还不能确定。
|
|
|
|
|
|
|
|
|
|
* 一方面,`riscv-rust/rust`官方配置中,二者是相关的。
|
|
|
|
|
* 另一方面,即使不使用A指令扩展,设置`max-atomic-width=32`,也可以编译通过。经检查生成的代码中包含了fence指令。这说明RISCV32I也可以用实现基本同步操作(?)
|
|
|
|
|
|
|
|
|
|
然而由于LLVM后端对RISCV原子操作支持不完善,无论是否`+a`,当使用Mutex时,它会调用core中的`atomic_compare_exchange`函数,LLVM会发生错误。
|
|
|
|
|
|
|
|
|
|
鉴于更改上层实现(替换Mutex)工程难度较大,我尝试直接修改core代码,将上述问题函数手动实现。
|
|
|
|
|
|
|
|
|
|
思路是在关中断环境下,用多条指令完成目标功能。这对于单核环境应该是正确的。
|
|
|
|
|
|
|
|
|
|
我做了个[补丁](../src/arch/riscv32/atomic.patch),在进入docker环境后,可运行`make patch-core`应用补丁,确保clean后,再build。
|
|
|
|
|
|
|
|
|
|
### LLVM Bug
|
|
|
|
|
|
|
|
|
|
当使用`(u8,u8)`类型时,会触发LLVM Error:
|
|
|
|
|
|
|
|
|
|
```
|
|
|
|
|
llvm::MVT llvm::EVT::getSimpleVT() const: Assertion `isSimple() && "Expected a SimpleValueType!"' failed.
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
在开发过程中,有两个地方遇到了这个错误,一是`log`库,二是`memory::cow`模块。后者修改为`(u16,u16)`就解决了问题,前者在Github上fork了一版,换了一种实现。
|
|
|
|
|
|
|
|
|
|
## BootLoader
|
|
|
|
|
|
|
|
|
|
参考[bbl-ucore](https://github.com/ring00/bbl-ucore)及后续的[ucore_os_lab for RISCV32](https://github.com/chyyuu/ucore_os_lab/tree/riscv32-priv-1.10),使用[bbl](https://github.com/riscv/riscv-pk.git)作为BootLoader。
|
|
|
|
|
|
|
|
|
|
然而官方版本和bbl-ucore中的fork版本都无法正常编译,使用的是[ucore_os_lab中的修改版本](https://github.com/chyyuu/ucore_os_lab/tree/riscv32-priv-1.10/riscv-pk)。
|
|
|
|
|
|
|
|
|
|
bbl-ucore使用RISCV1.9的bbl,ucore_os_lab使用RISCV1.10的bbl。后者相比前者,去掉了对内核的内存映射,因此需保证虚实地址一致。
|
|
|
|
|
|
|
|
|
|
注:事实上ucore_os_lab中的虚实地址并不一致,且没有内存映射,但依然能够运行,应该是由于编译器生成的所有跳转都使用相对偏移。而Rust编译器会生成绝对地址跳转,因此若虚实不一致会导致非法访存。
|
|
|
|
|
|
|
|
|
|
## Trap
|
|
|
|
|
|
|
|
|
|
参考资料:
|
|
|
|
|
|
|
|
|
|
* [bbl-ucore lab1文档](https://ring00.github.io/bbl-ucore/#/lab1)
|
|
|
|
|
* [RISCV官方slice](https://riscv.org/wp-content/uploads/2016/07/Tue0900_RISCV-20160712-InterruptsV2.pdf)
|
|
|
|
|
|
|
|
|
|
### Trap
|
|
|
|
|
|
|
|
|
|
* 中断帧:32个整数寄存器 + 4个S-Mode状态寄存器
|
|
|
|
|
* 开启中断:
|
|
|
|
|
* stvec:设置中断处理函数地址
|
|
|
|
|
* sstatus:SIE bit 开启中断
|
|
|
|
|
|
|
|
|
|
### Timer
|
|
|
|
|
|
|
|
|
|
* 开启时钟中断:
|
|
|
|
|
|
|
|
|
|
* sie:STIE bit 开启时钟中断
|
|
|
|
|
* sbi::set_timer:设置下次中断时间
|
|
|
|
|
|
|
|
|
|
* 读取时间:
|
|
|
|
|
|
|
|
|
|
* mtime:可读出当前时间(低32bit)
|
|
|
|
|
|
|
|
|
|
* mtimeh:当前时间(高32bit),仅RV32有效
|
|
|
|
|
|
|
|
|
|
因此RV32下要读取完整时间u64,需循环读取判等,因为指令之间可能被中断,要保证原子性。详见`get_cycle()`。
|
|
|
|
|
|
|
|
|
|
* 触发中断:
|
|
|
|
|
|
|
|
|
|
* mtimecmp(h):下次触发时钟中断的时间
|
|
|
|
|
|
|
|
|
|
当time>=timecmp时,触发中断
|
|
|
|
|
|
|
|
|
|
可通过sbi::set_timer设置
|
|
|
|
|
|
|
|
|
|
## Memory
|
|
|
|
|
|
|
|
|
|
### 自映射
|
|
|
|
|
|
|
|
|
|
原x86_64版本使用页表自映射完成修改页表本身的操作。但**RISCV下的页表规范阻碍了自映射的实现**。原因是RISCV页表项中的flags,明确表示它指向的是数据页(VRW),还是下层页表(V)。假如把一个二级页表项,当做一级页表项来解读,就会触发异常。而这是自映射机制中必须的操作。
|
|
|
|
|
|
|
|
|
|
为了绕开这个问题,就要求**在访问一级页表虚地址期间,将它所对应的二级页表项flags置为VRW**。此外,为了访问二级页表本身,还需要再加一个自映射的二级页表项,其flags为VRW。
|
|
|
|
|
|
|
|
|
|
制作一个自映射的二级页表过程示意如下:
|
|
|
|
|
|
|
|
|
|
```rust
|
|
|
|
|
fn set_recursive(self: &mut PageTable, recursive_index: usize, frame: Frame) {
|
|
|
|
|
type EF = PageTableFlags;
|
|
|
|
|
self[recursive_index].set(frame.clone(), EF::VALID);
|
|
|
|
|
self[recursive_index + 1].set(frame.clone(), EF::VALID | EF::READABLE | EF::WRITABLE);
|
|
|
|
|
}
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
在自映射页表生效后,可用地址:
|
|
|
|
|
|
|
|
|
|
* (R, R+1, 0) 访问二级页表
|
|
|
|
|
* (R, P2, 0) 访问一级页表
|
|
|
|
|
|
|
|
|
|
*注:地址格式为(P2, P1, Offset),R为自映射下标*
|
|
|
|
|
|
|
|
|
|
一个值得注意的现象是:在编辑完一级页表、并将其对应的二级页表项flags恢复为V之后,一级页表虚地址还是可以照常访问的,这应该是TLB缓存未失效的缘故。
|
|
|
|
|
|
|
|
|
|
### 获取内存信息
|
|
|
|
|
|
|
|
|
|
原x86_64版本使用GRUB进行boot,可通过Multiboot2获取内核段和可用空间的信息。RISCV下bbl无法提供这些信息,只能在linker script中定义各段的起始位置符号,然后在Rust中extern导入。
|
|
|
|
|
|
|
|
|
|
为了将来适配自己造的CPU(8M RAM),暂时规定内存划分如下:
|
|
|
|
|
|
|
|
|
|
* 0x80000000 - 0x80020000:BootLoader
|
|
|
|
|
* 0x80020000 - 0x80100000:Kernel
|
|
|
|
|
* 0x80100000 - 0x80200000:Kernel heap
|
|
|
|
|
* 0x80200000 - 0x80800000:对应物理空间用于用户程序
|
|
|
|
|
|