能否再让数据引脚增加一倍,8 根数据线岂不是速度更快,那就了解下 FSMC 吧,直接 16 根数据信号线,速度自然变得更快了,但使用 SPI FLash,不就是图一个线少嘛。
为了方便描述,我们将使用 QSPI 接口连接的 SPI Flash 称之为 QSPI Flash。一般来说,在与 QSPI Flash 通信时,并不是全程都是四根数据信号线传输数据,当同一时间只有一根数据线在传输数据的模式可称为单线模式,两根数据线可称为双线模式,四根数据线可称为四线模式。
通信过程
在使用 QSPI 与 QSPI Flash 通信的过程中,可分为五个阶段:
指令阶段
传输方向为 Host 发送给 QSPI Flash,目的是告诉 QSPI Flash 接下来要做什么事情,其长度只能为 8 bit。
地址阶段
传输方向为 Host 发送给 QSPI Flash,目的是告诉 QSPI Flash 要从哪个地址开始读或写数据,其长度可能为 8 bit,16 bit,24 bit 和 32 bit。
交替字节阶段:
传输方向为 Host 发送给 QSPI Flash,具体用法需参考所使用的 QSPI Flash 手册,传输方向由 Host 发送给 QSPI Flash,其长度可能为 8 bit,16 bit,24 bit 和 32 bit。
空指令周期阶段
给 QSPI Flash 缓冲时间准备数据,等待 n 个 SCK 周期,n 取值范围 0 ~ 31,具体值需参考所使用 QSPI Flash 手册。这段时间 Host 只产生特定数量的 SCK 时钟,不从数据信号线中读取或发送任何内容。
数据阶段
读数据或写数据,长度不定,由主机决定发送或接收多少数据。
在与 QSPI Flash 通信时,其通信过程如图 4 所示:
CS(NSS)信号线拉低,表示 QSPI Flash 器件被微控制器选中,然后发送一个字节大小的指令,紧接着发送地址,然后是交替字节,空指令周期,最后是数据,任意两个阶段之间都是紧挨着的。
一般来说,每次与 QSPI Flash 通信都至少包含指令阶段,其余的阶段都是可选的,例如读写 QSPI Flash 的寄存器值,只需要指令阶段和数据阶段;写使能和写失能,只需要指令阶段;读写数据,需要指令,地址,数据阶段,可能还有空指令周期阶段。
但有一种情况下,可能会省略掉指令阶段,部分 QSPI Flash 支持仅在第一次读数据的时候,需要指令阶段,下一次读数据的时候,直接由地址阶段开始,无需指令阶段。
一般 QSPI Flash 还支持一种叫做 QPI 模式的通信方式,当 QSPI Flash 进入 QPI 模式后,所有的阶段都只能使用四线模式通信,包括指令阶段,通过这种方式,能够极大减少指令阶段和地址阶段花费的 SCK 时钟数。
通信实例
图 5 是一款型号为 FM25Q16A QSPI Flash 的 Fast Read Quad Output 的传输波形示意图:
从图中可以看到,四线快读数据的过程中分为四个步骤:
指令阶段
Host 发送了一个 8 bit 长度的指令 0x6B,使用单线模式。
地址阶段
一段 24bit 长度的地址,使用单线模式。
空指令周期
8 bit 的空指令周期。
数据阶段
以四线模式连续读取存储在 QSPI Flash 指定位置的数据。
可以发现,除了数据阶段,其它阶段均以单线模式工作,数据阶段则是四线模式,每两个时钟读取一个字节的数据。当读取一个四字节数据时,总共花费了 48 个 SCK 时钟。
通过内存地址访问 QSPI Flash
前文中了解了如何通过 QSPI 接口访问 QSPI Flash,但如果每次通信都要配置 QSPI 外设的寄存器,再通过 QSPI 的数据寄存器获取数据的话,则无法让微控制器直接执行存储在 QSPI Flash 中的程序(XIP)。
因此,可以将 QSPI Flash 映射到一段指定的内存地址空间内,例如,指定到 0x90000000 ~ 0x9FFFFFFF 这段 256MB 大小的空间内,当 CPU 访问 0x90000008 这段地址时,QSPI 模块将会读取 QSPI Flash 中 0x00000008 的数据,如果 CPU 继续访问 0x9000000C 的数据时,QSPI 模块将会读取 QSPI Flash 中 0x0000000C 的数据。对 CPU 而言,访问存储在 QSPI Flash 中的数据,就只是访问某一段地址空间的数据。这种读数据的方式称为 QSPI 的直接读模式,如图 6 所示。
值得注意的是,32 位的 CPU 一般会连续读取 4 字节的数据,当 CPU 读取 0x90000008 这段地址时,实际读取了 0x90000008 ~ 0x9000000B 四个字节的数据,但 QSPI 不会每读取一字节数据,就发起一次指令阶段+地址阶段+数据阶段的过程,而是以指令阶段+地址阶段+数据阶段读一字节,再读一字节,再读一字节……的方式读数据,当后面 CPU 继续访问 0x0000000C 时,就会跳过指令阶段和地址阶段,直接继续数据阶段再读一字节,再读一字节……直到微控制器访问了一个不连续的地址时,QSPI 才会重新发起指令阶段和地址阶段。
因为地址连续的访问 QSPI Flash,QSPI 无需再次发起指令和地址阶段,所以其访问速度会比地址不连续的访问速度要快。
计算机程序有一个特点,叫做时间局限性和空间局限性:
时间局限性
最近被访问的单元,很可能在不久的将来还要被访问。
空间局限性
最近被访问的单元,很可能它附近的单元也即将被访问。
基于上述的特点,一般支持 QSPI 扩展 Flash 的微控制器会使用 CACHE 来暂存 QSPI Flash 中的内容,当 CPU 再次访问 QSPI Flash 前一段时间曾访问过的地址时,实际上访问的是暂存在 CACHE 中的数据,以此来减少访问 QSPI Flash 所花费的时间,加快程序执行的速度。在实际使用 QSPI Flash 存储应用程序的时候,效果可能不比片内 Flash 差多少。
直接读模式能够读取 QSPI Flash 中的数据,但 QSPI Flash 中的程序不是一直不变的,不管程序员调试代码,还是 OTA 升级,都需要读数据之外的操作,这时候,如果还使用直接读模式访问 QSPI Flash 的话,就显得不太合适了:直接模式下,我们只需要配置一次 QSPI 访问 QSPI Flash 各阶段的配置,就能不断读取 QSPI Flash 中的数据,虽然方便,但缺少一定的自由度,例如无法实现写操作等过程。
因此,QSPI 还提供了间接模式,间接模式下,需要指定每一次数据传输过程的每一个细节:如指令阶段的参数是什么,地址阶段的具体地址值是多少等,虽然复杂,但给了我们充分通过 QSPI 访问 QSPI Flash 的方法,例如,当我们希望写修改 QSPI Flash 中的数据时,就可以使用间接写模式,将数据阶段的传输方向由 QSPI Flash 到 Host 转变为 Host 到 QSPI Flash,而在直接模式下,数据阶段只能是由 QSPI Flash 到 Host。
总结
在本章中,介绍了 SPI,DSPI,QSPI的区别,访问 QSPI Flash 的过程,以及微控制器如何通过 QSPI 的直接读模式访问 QSPI Flash。
微控制器通过 QSPI 的直接读模式访问 QSPI Flash,为直接执行存储在 QSPI Flash 中的应用程序提供了可能,这也是 2nd Bootloader 的目的所在。
原作者:灵动MM32