Note
此文件的目的是为让中文读者更容易阅读和理解,而不是作为一个分支。 因此, 如果您对此文件有任何意见或更新,请先尝试更新原始英文文件。 如果您发现本文档与原始文件有任何不同或者有翻译问题,请发建议或者补丁给 该文件的译者,或者请求中文文档维护者和审阅者的帮助。
- Original:
- 翻译:
王亚鑫 Wang Yaxin <wang.yaxin@zte.com.cn>
网络驱动支持Netmem¶
本文档概述了网络驱动支持netmem(一种抽象内存类型)的要求,该内存类型 支持设备内存 TCP 等功能。通过支持netmem,驱动可以灵活适配不同底层内 存类型(如设备内存TCP),且无需或仅需少量修改。
Netmem的优势:
灵活性:netmem 可由不同内存类型(如
struct page
、DMA-buf)支持, 使驱动程序能够支持设备内存 TCP 等各种用例。前瞻性:支持netmem的驱动可无缝适配未来依赖此功能的新特性。
简化开发:驱动通过统一API与netmem交互,无需关注底层内存的实现差异。
驱动RX要求¶
驱动必须支持page_pool。
驱动必须支持tcp-data-split ethtool选项。
驱动必须使用page_pool netmem API处理有效载荷内存。当前netmem API 与page API一一对应。转换时需要将page API替换为netmem API,并用驱动 中的netmem_refs跟踪内存而非
struct page
*:page_pool_alloc -> page_pool_alloc_netmem
page_pool_get_dma_addr -> page_pool_get_dma_addr_netmem
page_pool_put_page -> page_pool_put_netmem
目前并非所有页 pageAPI 都有对应的 netmem 等效接口。如果你的驱动程序 依赖某个尚未实现的 netmem API,请直接实现并提交至 netdev@邮件列表, 或联系维护者及 almasrymina@google.com 协助添加该 netmem API。
驱动必须设置以下PP_FLAGS:
PP_FLAG_DMA_MAP:驱动程序无法对 netmem 执行 DMA 映射。此时驱动 程序必须将 DMA 映射操作委托给 page_pool,由其判断何时适合(或不适合) 进行 DMA 映射。
PP_FLAG_DMA_SYNC_DEV:驱动程序无法保证 netmem 的 DMA 地址一定能 完成 DMA 同步。此时驱动程序必须将 DMA 同步操作委托给 page_pool,由 其判断何时适合(或不适合)进行 DMA 同步。
PP_FLAG_ALLOW_UNREADABLE_NETMEM:仅当启用 tcp-data-split 时, 驱动程序必须显式设置此标志。
5. 驱动不得假设netmem可读或基于页。当netmem_address()
返回NULL时,表示
内存不可读。驱动需正确处理不可读的netmem,例如,当netmem_address()
返回
NULL时,避免访问内容。
理想情况下,驱动程序不应通过
netmem_is_net_iov()
等辅助函数检查底层 netmem 类型,也不应通过netmem_to_page()
或netmem_to_net_iov()
将 netmem 转换为其底层类型。在大多数情况下,系统会提供抽象这些复杂性的 netmem 或 page_pool 辅助函数(并可根据需要添加更多)。
6. 驱动程序必须使用page_pool_dma_sync_netmem_for_cpu()
代替dma_sync_single_range_for_cpu()
。
对于某些内存提供者,CPU 的 DMA 同步将由 page_pool 完成;而对于其他提供者
(特别是 dmabuf 内存提供者),CPU 的 DMA 同步由使用 dmabuf API 的用户空
间负责。驱动程序必须将整个 DMA 同步操作委托给 page_pool,以确保操作正确执行。
7. 避免在 page_pool 之上实现特定于驱动程序内存回收机制。由于 netmem 可能
不由struct page
支持,驱动程序不能保留struct page
来进行自定义回收。不过,
可为此目的通过page_pool_fragment_netmem()
或page_pool_ref_netmem()
保留
page_pool 引用,但需注意某些 netmem 类型的循环时间可能更长(例如零拷贝场景
下用户空间持有引用的情况)。
驱动TX要求¶
1. 驱动程序绝对不能直接把 netmem 的 dma_addr 传递给任何 dma-mapping API。这 是由于 netmem 的 dma_addr 可能源自 dma-buf 这类和 dma-mapping API 不兼容的 源头。
应当使用netmem_dma_unmap_page_attrs()
和netmem_dma_unmap_addr_set()
等辅助
函数来替代dma_unmap_page[_attrs]()、dma_unmap_addr_set()
。不管 dma_addr
来源如何,netmem 的这些变体都能正确处理 netmem dma_addr,在合适的时候会委托给
dma-mapping API 去处理。
目前,并非所有的 dma-mapping API 都有对应的 netmem 版本。要是你的驱动程序需要 使用某个还不存在的 netmem API,你可以自行添加并提交到 netdev@,也可以联系维护 人员或者发送邮件至 almasrymina@google.com 寻求帮助。
驱动程序应通过设置 netdev->netmem_tx = true 来表明自身支持 netmem 功能。