STM32

李慎梓

8年用户 1506经验值

私信关注

[问答]

STM32H755双核单片机的使用疑问求解？

我再使用STM32H755单片机时候，想用M7内核和M4内核，分时操作串口，可以这样使用吗？
还有就是全局变量可以同时被两个核操作嘛？

回帖（1）

李萍

2025-11-12 17:43:08

针对 STM32H755 双核单片机的问题，我来详细解答一下：

1. 分时操作串口 (M7 和 M4)

答案：可以，但需要非常谨慎的设计和同步机制，通常不推荐核心之间直接“分时”操作同一个物理串口外设。更推荐的设计是：

外设所有权绑定： STM32H755 的绝大部分外设（包括串口 USART/UART）在硬件设计上是绑定到特定内核的（CM7 或 CM4）。这意味着：
- 某个串口（例如 USART1）在某个时刻只能被其绑定的内核（比如 CM7）配置和控制（初始化、发送、接收中断处理等）。
- 另一个内核（CM4）不能直接访问和控制绑定到 CM7 的串口（USART1）的寄存器。尝试直接访问可能会导致总线错误、数据冲突或不可预测的行为。

推荐的设计模式：
- 模式一：外设专有化（最佳实践）： 这是最简单、最安全的方式。将不同的串口分配给不同的内核专用。例如，让 CM7 控制 USART1 和 USART2，让 CM4 控制 USART3 和 UART4。两个内核各自独立操作自己的串口，互不干扰，无需复杂同步。强烈推荐这种做法。
- 模式二：单一所有者 + 消息传递（如果必须共享）： 如果某个特定串口必须被两个核心分时使用（这种情况应尽量避免）：
  - 确定一个所有者： 选择一个内核（例如 CM7）作为该串口的唯一拥有者。只有这个内核负责直接操作串口寄存器（初始化、发送、接收中断服务程序）。
  - 消息传递： 当另一个内核（CM4）需要发送数据时：
    1. CM4 将需要发送的数据放入一个共享内存区域的缓冲区中。
    2. CM4 通过核间通信机制（IPC）通知 CM7：“有数据在共享缓冲区 X 等待发送”。
    3. CM7 在自己的主循环或专用任务中，检测到这个通知（或轮询共享标志），然后从共享缓冲区 X 中取出数据，通过它拥有的串口发送出去。
    4. 对于接收：CM7 在串口接收中断中，将收到的数据放入另一个共享内存区域的缓冲区 Y，并通过 IPC 通知 CM4：“有新数据在缓冲区 Y”。
    5. CM4 在自己的主循环或专用任务中，检测到这个通知（或轮询共享标志），然后从共享缓冲区 Y 中取出数据进行处理。
  - 关键点：
    - 共享缓冲区的访问必须通过互斥锁或原子操作保证数据一致性（见下文全局变量部分）。
    - IPC 机制是实现高效通知的核心。STM32H7 提供了高效的硬件机制：
      - HSEM (Hardware Semaphore)： 最常用的硬件互斥锁，用于保护共享资源（如缓冲区）的访问。也可用于简单的信号通知（但不如通知高效）。
      - IPCC (Inter-Processor Communication Controller)： 专为双核通知设计的硬件模块。一个内核可以设置一个 IPCC 通道的标志位，直接触发另一个内核的中断（或通知其可轮询状态），从而实现非常快速的低延迟通知。这是实现高效通知的首选硬件机制。
    - 绝对避免： 让 CM4 直接去设置 CM7 控制的串口的控制寄存器或发送数据寄存器。这不仅违反硬件设计，还极易导致冲突和系统崩溃。

总结分时操作串口： 技术上可以通过单一所有者+消息传递+IPC实现模拟的“分时”，但引入了显著的复杂性和同步开销。强烈建议将不同的物理串口分配给不同的内核独立使用。 如果应用逻辑要求一个串口服务于两个内核的业务，采用消息传递模式是安全的做法。

2. 全局变量同时被两个核操作

答案：可以访问同一个物理内存位置的变量，但必须使用同步机制来保证操作的原子性和数据一致性！否则一定会引发难以调试的数据竞争和损坏问题。

共享内存： M7 和 M4 核共享整个内存空间（包括 DTCM, SRAM1, SRAM2, SRAM3, SRAM4, Backup SRAM, AXI SRAM 等）。这意味着一个在地址 0x24000000 定义的全局变量，两个核的代码都能通过它们的总线访问到这块物理内存。

危险 - 数据竞争： 如果两个核同时（或者即使不是绝对同时，但在一个核的读写操作未完成时另一个核就介入）对一个普通的全局变量（例如 int counter;）进行写操作（或者一个写一个读），最终的结果是不确定的。变量可能只反映了其中一个核的修改，或者变成一个混合的错误值。这种错误被称为 数据竞争，是多核/多线程编程中最常见也最难调试的问题之一。

关键挑战 - 缓存一致性 (Cache Coherency)：
- M7 和 M4 都有自己独立的缓存（D-Cache）。
- 当 M7 修改了某个全局变量，这个修改可能只存在于 M7 的 D-Cache 中，还没有写回到主内存（SRAM）。
- 此时如果 M4 去读取这个变量，它看到的可能是自己缓存里（已经过时的）旧值，或者是刚从主内存（也是旧值）读到的数据，看不到 M7 的最新修改。
- 反之亦然。这就是缓存不一致问题。STM32H7 双核没有硬件自动维护的全局缓存一致性（例如像一些高端应用处理器那样）。

解决办法：
- 1. 使用硬件互斥锁 (HSEM - Hardware Semaphore)： 这是最常用、最推荐的机制。
  - 在访问任何共享的全局变量（或共享数据结构、共享缓冲区）之前，当前核必须先成功获取（Take）一个 HSEM 信号量（可以看作是针对该资源的锁）。
  - 成功获取后，该核可以安全地读写共享变量（因为锁确保了同一时刻只有一个核能持有该锁）。
  - 操作完成后，必须及时释放（Release）该 HSEM 信号量。
  - HSEM 操作是硬件实现的，保证了原子性（获取和释放操作本身不会被中断或干扰）。
- 2. 使用原子指令： C 语言标准 (C11/C++) 提供了 _Atomic 类型限定符和 atomic_ 前缀的函数 (atomic_load, atomic_store, atomic_fetch_add, atomic_exchange 等)。编译器会将这些操作转换为特殊的、能在单条指令或不可中断指令序列内完成的机器指令。
  - 适用场景： 非常适合对单个基本数据类型（int, uint32_t, bool 等）进行简单的读、写、递增、递减、比较并交换等操作。
  - 限制： 对于复杂的数据结构（结构体、数组、链表），原子指令本身无法保护整个结构的访问，通常还是需要配合锁（如 HSEM）来保护整个结构的修改。
- 3. 显式管理缓存： 由于没有硬件一致性，开发者必须在必要时手动管理缓存：
  - 写入后 (M7 写, M4 读)： 在 M7 修改完共享数据并释放 HSEM 之前，必须调用 SCB_CleanDCache_by_Addr()（或类似函数）清理 (Clean) M7 D-Cache 中该数据所在缓存行，确保修改写回主存(SRAM)。在 M4 读取该数据之前（获取 HSEM 之后），可能需要调用 SCB_InvalidateDCache_by_Addr() 无效 (Invalidate) M4 D-Cache 中相应的缓存行，强制它从主存重新加载最新数据。
  - 写入后 (M4 写, M7 读)： 同理，M4 写完释放 HSEM 前需要 Clean 它的 D-Cache。M7 在获取 HSEM 后读取前可能需要 Invalidate 它的 D-Cache。
  - 关键点： 缓存行对齐（通常32字节）和正确使用 Clean/Invalidate 范围对于性能和正确性非常重要。错误的缓存管理是双核调试的噩梦。强烈建议将共享变量放在非缓存 (Non-Cacheable) 或写通 (Write-Through) 的内存区域来简化问题，但这会牺牲性能。 使用 MPU 配置内存区域属性。
- 4. 关中断： 在单核内，关中断可以保护变量不被中断服务程序破坏。但这完全无法保护该变量不被另一个核访问！ 关中断对双核间的数据竞争无效。不要依赖它来解决双核共享问题。

volatile 的作用： volatile 关键字告诉编译器不要对该变量做激进的优化（例如假设它的值不会变而缓存到寄存器，或者移除看似冗余的读取）。它是必需的（防止编译器优化导致看不到其他核的修改），但绝对不够（它不解决原子性问题和缓存一致性问题，不能替代锁或原子指令）。共享变量必须同时使用 volatile 和适当的同步机制（HSEM/原子指令）及缓存管理。

总结全局变量共享：

技术上可行： 两个核可以访问同一物理内存位置的变量。

极度危险： 如果没有同步，必然导致数据竞争和错误。

必须同步： 使用 HSEM 互斥锁 是保护共享数据结构（包括简单变量）最通用、最推荐的核心机制。

原子指令： 适用于保护对单个基本数据类型（int, bool, ptr）的简单操作（读、写、增减）。

必须管理缓存： 手动调用 SCB_CleanDCache_by_Addr 和 SCB_InvalidateDCache_by_Addr （或配置 MPU 使用非缓存/写通属性）来解决缓存一致性问题。

volatile 必要但不充分： 必须声明共享变量为 volatile, 但仅此远远不够。

给您的开发建议：

串口分配： 优先将不同的物理串口外设分配给 M7 和 M4 独立使用。 这是最简洁、最高效、最稳定的方案。

如果必须逻辑共享串口：
- 明确一个内核作为物理串口所有者。
- 使用共享内存缓冲区（带 HSEM 保护）传递要发送/已接收的数据。
- 使用 IPCC 进行高效的通知（“有数据待发送”、“有新数据收到”）。

共享全局变量：
- 始终谨慎识别哪些变量是真正需要共享的。 尽量减少共享数据。
- 对共享资源的访问（读/写），必须通过 HSEM 获取锁。
- 使用原子指令处理简单的共享标志或计数器。
- 声明共享变量为 volatile。
- 精心设计缓存管理策略：
  - 在写入核释放锁前，Clean 其 D-Cache。
  - 在读取核获取锁后，Invalidate 其 D-Cache。
  - 考虑使用 MPU 将共享内存区域配置为 Write-Through 或 Non-Cacheable (牺牲性能换简化)。对于关键且访问不频繁的控制标志或状态字，这种方法很实用。
- 仔细测试多核交互逻辑。 数据竞争和缓存问题往往在特定时序下才显现，测试要充分。

工程配置：
- 确保 M4 的固件被正确加载到其运行内存区域（通常从 Flash 加载到 SRAM4 或 SRAM3）。
- 正确配置双核启动顺序（通常 CM7 先启动，初始化系统后释放 CM4 复位）。
- 正确配置 MPU (Memory Protection Unit) 在两个核上，设置好内存区域的访问权限和缓存策略（特别是共享区域）。

结论：
双核 STM32H755 功能强大，但也带来了并发编程的复杂性。分时操作同一个物理串口需通过消息传递和IPC模拟，不直接操作。共享全局变量必须严格使用同步机制（HSEM/原子指令）和显式的缓存管理。透彻理解 HSEM、IPCC 和缓存管理（Clean/Invalidate）是成功开发双核应用的关键。 仔细规划资源和数据流，优先隔离，尽量减少核间紧密共享，能显著提高系统的稳定性和可维护性。

针对 STM32H755 双核单片机的问题，我来详细解答一下：

1. 分时操作串口 (M7 和 M4)

答案：可以，但需要非常谨慎的设计和同步机制，通常不推荐核心之间直接“分时”操作同一个物理串口外设。更推荐的设计是：

外设所有权绑定： STM32H755 的绝大部分外设（包括串口 USART/UART）在硬件设计上是绑定到特定内核的（CM7 或 CM4）。这意味着：
- 某个串口（例如 USART1）在某个时刻只能被其绑定的内核（比如 CM7）配置和控制（初始化、发送、接收中断处理等）。
- 另一个内核（CM4）不能直接访问和控制绑定到 CM7 的串口（USART1）的寄存器。尝试直接访问可能会导致总线错误、数据冲突或不可预测的行为。

推荐的设计模式：
- 模式一：外设专有化（最佳实践）： 这是最简单、最安全的方式。将不同的串口分配给不同的内核专用。例如，让 CM7 控制 USART1 和 USART2，让 CM4 控制 USART3 和 UART4。两个内核各自独立操作自己的串口，互不干扰，无需复杂同步。强烈推荐这种做法。
- 模式二：单一所有者 + 消息传递（如果必须共享）： 如果某个特定串口必须被两个核心分时使用（这种情况应尽量避免）：
  - 确定一个所有者： 选择一个内核（例如 CM7）作为该串口的唯一拥有者。只有这个内核负责直接操作串口寄存器（初始化、发送、接收中断服务程序）。
  - 消息传递： 当另一个内核（CM4）需要发送数据时：
    1. CM4 将需要发送的数据放入一个共享内存区域的缓冲区中。
    2. CM4 通过核间通信机制（IPC）通知 CM7：“有数据在共享缓冲区 X 等待发送”。
    3. CM7 在自己的主循环或专用任务中，检测到这个通知（或轮询共享标志），然后从共享缓冲区 X 中取出数据，通过它拥有的串口发送出去。
    4. 对于接收：CM7 在串口接收中断中，将收到的数据放入另一个共享内存区域的缓冲区 Y，并通过 IPC 通知 CM4：“有新数据在缓冲区 Y”。
    5. CM4 在自己的主循环或专用任务中，检测到这个通知（或轮询共享标志），然后从共享缓冲区 Y 中取出数据进行处理。
  - 关键点：
    - 共享缓冲区的访问必须通过互斥锁或原子操作保证数据一致性（见下文全局变量部分）。
    - IPC 机制是实现高效通知的核心。STM32H7 提供了高效的硬件机制：
      - HSEM (Hardware Semaphore)： 最常用的硬件互斥锁，用于保护共享资源（如缓冲区）的访问。也可用于简单的信号通知（但不如通知高效）。
      - IPCC (Inter-Processor Communication Controller)： 专为双核通知设计的硬件模块。一个内核可以设置一个 IPCC 通道的标志位，直接触发另一个内核的中断（或通知其可轮询状态），从而实现非常快速的低延迟通知。这是实现高效通知的首选硬件机制。
    - 绝对避免： 让 CM4 直接去设置 CM7 控制的串口的控制寄存器或发送数据寄存器。这不仅违反硬件设计，还极易导致冲突和系统崩溃。

2. 全局变量同时被两个核操作

共享内存： M7 和 M4 核共享整个内存空间（包括 DTCM, SRAM1, SRAM2, SRAM3, SRAM4, Backup SRAM, AXI SRAM 等）。这意味着一个在地址 0x24000000 定义的全局变量，两个核的代码都能通过它们的总线访问到这块物理内存。

危险 - 数据竞争： 如果两个核同时（或者即使不是绝对同时，但在一个核的读写操作未完成时另一个核就介入）对一个普通的全局变量（例如 int counter;）进行写操作（或者一个写一个读），最终的结果是不确定的。变量可能只反映了其中一个核的修改，或者变成一个混合的错误值。这种错误被称为 数据竞争，是多核/多线程编程中最常见也最难调试的问题之一。

关键挑战 - 缓存一致性 (Cache Coherency)：
- M7 和 M4 都有自己独立的缓存（D-Cache）。
- 当 M7 修改了某个全局变量，这个修改可能只存在于 M7 的 D-Cache 中，还没有写回到主内存（SRAM）。
- 此时如果 M4 去读取这个变量，它看到的可能是自己缓存里（已经过时的）旧值，或者是刚从主内存（也是旧值）读到的数据，看不到 M7 的最新修改。
- 反之亦然。这就是缓存不一致问题。STM32H7 双核没有硬件自动维护的全局缓存一致性（例如像一些高端应用处理器那样）。

解决办法：
- 1. 使用硬件互斥锁 (HSEM - Hardware Semaphore)： 这是最常用、最推荐的机制。
  - 在访问任何共享的全局变量（或共享数据结构、共享缓冲区）之前，当前核必须先成功获取（Take）一个 HSEM 信号量（可以看作是针对该资源的锁）。
  - 成功获取后，该核可以安全地读写共享变量（因为锁确保了同一时刻只有一个核能持有该锁）。
  - 操作完成后，必须及时释放（Release）该 HSEM 信号量。
  - HSEM 操作是硬件实现的，保证了原子性（获取和释放操作本身不会被中断或干扰）。
- 2. 使用原子指令： C 语言标准 (C11/C++) 提供了 _Atomic 类型限定符和 atomic_ 前缀的函数 (atomic_load, atomic_store, atomic_fetch_add, atomic_exchange 等)。编译器会将这些操作转换为特殊的、能在单条指令或不可中断指令序列内完成的机器指令。
  - 适用场景： 非常适合对单个基本数据类型（int, uint32_t, bool 等）进行简单的读、写、递增、递减、比较并交换等操作。
  - 限制： 对于复杂的数据结构（结构体、数组、链表），原子指令本身无法保护整个结构的访问，通常还是需要配合锁（如 HSEM）来保护整个结构的修改。
- 3. 显式管理缓存： 由于没有硬件一致性，开发者必须在必要时手动管理缓存：
  - 写入后 (M7 写, M4 读)： 在 M7 修改完共享数据并释放 HSEM 之前，必须调用 SCB_CleanDCache_by_Addr()（或类似函数）清理 (Clean) M7 D-Cache 中该数据所在缓存行，确保修改写回主存(SRAM)。在 M4 读取该数据之前（获取 HSEM 之后），可能需要调用 SCB_InvalidateDCache_by_Addr() 无效 (Invalidate) M4 D-Cache 中相应的缓存行，强制它从主存重新加载最新数据。
  - 写入后 (M4 写, M7 读)： 同理，M4 写完释放 HSEM 前需要 Clean 它的 D-Cache。M7 在获取 HSEM 后读取前可能需要 Invalidate 它的 D-Cache。
  - 关键点： 缓存行对齐（通常32字节）和正确使用 Clean/Invalidate 范围对于性能和正确性非常重要。错误的缓存管理是双核调试的噩梦。强烈建议将共享变量放在非缓存 (Non-Cacheable) 或写通 (Write-Through) 的内存区域来简化问题，但这会牺牲性能。 使用 MPU 配置内存区域属性。
- 4. 关中断： 在单核内，关中断可以保护变量不被中断服务程序破坏。但这完全无法保护该变量不被另一个核访问！ 关中断对双核间的数据竞争无效。不要依赖它来解决双核共享问题。

volatile 的作用： volatile 关键字告诉编译器不要对该变量做激进的优化（例如假设它的值不会变而缓存到寄存器，或者移除看似冗余的读取）。它是必需的（防止编译器优化导致看不到其他核的修改），但绝对不够（它不解决原子性问题和缓存一致性问题，不能替代锁或原子指令）。共享变量必须同时使用 volatile 和适当的同步机制（HSEM/原子指令）及缓存管理。

总结全局变量共享：

技术上可行： 两个核可以访问同一物理内存位置的变量。

极度危险： 如果没有同步，必然导致数据竞争和错误。

必须同步： 使用 HSEM 互斥锁 是保护共享数据结构（包括简单变量）最通用、最推荐的核心机制。

原子指令： 适用于保护对单个基本数据类型（int, bool, ptr）的简单操作（读、写、增减）。

必须管理缓存： 手动调用 SCB_CleanDCache_by_Addr 和 SCB_InvalidateDCache_by_Addr （或配置 MPU 使用非缓存/写通属性）来解决缓存一致性问题。

volatile 必要但不充分： 必须声明共享变量为 volatile, 但仅此远远不够。

给您的开发建议：

串口分配： 优先将不同的物理串口外设分配给 M7 和 M4 独立使用。 这是最简洁、最高效、最稳定的方案。

如果必须逻辑共享串口：
- 明确一个内核作为物理串口所有者。
- 使用共享内存缓冲区（带 HSEM 保护）传递要发送/已接收的数据。
- 使用 IPCC 进行高效的通知（“有数据待发送”、“有新数据收到”）。

共享全局变量：
- 始终谨慎识别哪些变量是真正需要共享的。 尽量减少共享数据。
- 对共享资源的访问（读/写），必须通过 HSEM 获取锁。
- 使用原子指令处理简单的共享标志或计数器。
- 声明共享变量为 volatile。
- 精心设计缓存管理策略：
  - 在写入核释放锁前，Clean 其 D-Cache。
  - 在读取核获取锁后，Invalidate 其 D-Cache。
  - 考虑使用 MPU 将共享内存区域配置为 Write-Through 或 Non-Cacheable (牺牲性能换简化)。对于关键且访问不频繁的控制标志或状态字，这种方法很实用。
- 仔细测试多核交互逻辑。 数据竞争和缓存问题往往在特定时序下才显现，测试要充分。

工程配置：
- 确保 M4 的固件被正确加载到其运行内存区域（通常从 Flash 加载到 SRAM4 或 SRAM3）。
- 正确配置双核启动顺序（通常 CM7 先启动，初始化系统后释放 CM4 复位）。
- 正确配置 MPU (Memory Protection Unit) 在两个核上，设置好内存区域的访问权限和缓存策略（特别是共享区域）。

更多回帖

李慎梓

STM32H755双核单片机的使用疑问求解？

回帖（1）

李萍

1. 分时操作串口 (M7 和 M4)

2. 全局变量同时被两个核操作

1. 分时操作串口 (M7 和 M4)

2. 全局变量同时被两个核操作

相关问答

请问哪里有带以太网PRP协议的STM32H755板呢？

STM32CubeIDE如何导入/导出多核项目？

如何在STM32H755控制器的两个内核之间共享一些信息呢？

STM32CubeIDE没有为STM32H755/745 Nucleo板正确初始化GPIO怎么解决？

双核STM32H7项目上的STM32CubeIDE文件索引问题如何处理？

STM32H747I-DISCO为啥需要双核？

STM32H747双核如何用JLINK调试？

请问可以使用STM32H745双核引导加载程序访问FLASH空间吗？

lpc54110能不能用st-link调试？

谁有STM32H7双核的时间表呢

20万+工程师都在用，免费PCB检查工具