边摸边吃奶边做带声音,美女一级黄色视频,国产在线高清理伦片a国语

基于FPGA的GNN加速器頂層架構(gòu)

發(fā)布日期： 2021-08-27 瀏覽次數(shù)： 1,780

GNN加速器頂層架構(gòu)

此GNN加速器是為GraphSAGE算法設(shè)計(jì)的，但是它的設(shè)計(jì)也可以應(yīng)用于其他類似的GNN算法加速。其頂層架構(gòu)如下圖所示。

該架構(gòu)由以下模塊組成：

圖中的GNN內(nèi)核是算法實(shí)現(xiàn)的核心部分（詳情如下）。

RoCE-Lite是RDMA協(xié)議的輕量級版本，用于通過高速以太網(wǎng)進(jìn)行遠(yuǎn)程存儲訪問，以支持海量節(jié)點(diǎn)的圖計(jì)算。

400GE以太網(wǎng)控制器用于承載RoCE-Lite協(xié)議。

GDDR6存儲器用于存儲GNN處理過程中所需的高速訪問數(shù)據(jù)（DDR4作為備用大容量存儲器）。該存儲器用于存儲訪問頻率相對較低的數(shù)據(jù)，例如待預(yù)處理的圖形數(shù)據(jù)。

PCIeGen5 ×16 接口提供高速主機(jī)接口，用于與服務(wù)器軟件進(jìn)行數(shù)據(jù)交互。

上述所有模塊均通過具有高帶寬的NoC實(shí)現(xiàn)互連。

GNN內(nèi)核微架構(gòu)

在開始討論GNN內(nèi)核的微架構(gòu)之前，有必要先回顧一下GraphSAGE算法。其內(nèi)層循環(huán)的聚合和合并（包括卷積）占據(jù)了該算法的大部分計(jì)算和存儲訪問。通過研究，我們得出這兩個步驟的特點(diǎn)，具體如下。

表2：GNN算法中聚合和合并操作的對比（來源：https://arxiv.org/abs/1908.10834）

步驟	聚合操作	合并操作
存儲訪問方式	間接訪問，不規(guī)則	直接訪問，規(guī)則
數(shù)據(jù)重用	低	高
計(jì)算模式	動態(tài)，不規(guī)則	靜態(tài)，規(guī)則
計(jì)算量	低	高
性能瓶頸	存儲	計(jì)算

可以看出，聚合操作和合并操作在計(jì)算和存儲訪問模式上有著完全不同的需求。聚合操作涉及相鄰節(jié)點(diǎn)的采樣。然而，圖形是一種非歐幾里得數(shù)據(jù)類型——它的大小和維度是不確定且無序，矩陣稀疏，節(jié)點(diǎn)位置隨機(jī)。因此，存儲訪問是不規(guī)則的，并且難以重復(fù)利用數(shù)據(jù)。

在合并操作中，輸入數(shù)據(jù)是聚合結(jié)果（節(jié)點(diǎn)的低維表示）和權(quán)重矩陣。它的大小和維度是固定的，具有線性存儲位置。因此對存儲訪問沒有挑戰(zhàn)，但是矩陣的計(jì)算量非常大。基于上述分析，我們決定在GNN內(nèi)核加速器設(shè)計(jì)中選擇使用兩種不同的硬件結(jié)構(gòu)來分別處理聚合和合并操作（如下圖示）：

聚合器——通過單指令多數(shù)據(jù)（SIMD）處理器陣列，對圖形相鄰節(jié)點(diǎn)進(jìn)行采樣和聚合。單指令可以預(yù)定義為mean()平均值計(jì)算，或其他適用的聚合函數(shù)；多數(shù)據(jù)是指單次mean()均值計(jì)算中需要多個相鄰節(jié)點(diǎn)的特征數(shù)據(jù)作為輸入，這些數(shù)據(jù)來自子圖采樣器。SIMD處理器陣列通過調(diào)度器Agg Scheduler進(jìn)行負(fù)載平衡。子圖采樣器通過NoC從GDDR6或DDR4讀回的鄰接矩陣和節(jié)點(diǎn)特征數(shù)據(jù)h0v分別緩存在鄰接列表緩沖區(qū)（Adjacent ListBuffer）和節(jié)點(diǎn)特征緩沖區(qū)（Node Feature Buffer）。聚合的結(jié)果hkN(v)存儲在聚合緩沖區(qū)（Aggregation Buffer）中。

合并器——通過脈動矩陣PE對聚合結(jié)果進(jìn)行卷積運(yùn)算。卷積核是Wk權(quán)重矩陣。卷積結(jié)果由ReLU激活函數(shù)進(jìn)行非線性處理，同時也存儲在PartialSum Buffer中，以用于下一輪迭代。

合并結(jié)果經(jīng)過L2BN標(biāo)準(zhǔn)化處理后，即為最終的節(jié)點(diǎn)表示hkv。在一個典型的節(jié)點(diǎn)分類預(yù)測應(yīng)用中，節(jié)點(diǎn)表示hkv可以通過一個全連接層（FC）來獲取節(jié)點(diǎn)的分類標(biāo)簽。這個過程是傳統(tǒng)的機(jī)器學(xué)習(xí)處理方法之一，在GraphSAGE文獻(xiàn)資料中沒有體現(xiàn)，這個功能也沒有包含在這個架構(gòu)中。

·上一篇: 如何選擇并設(shè)計(jì)最佳RTD溫度檢測系統(tǒng)二
·下一篇: 如何在智能家居中進(jìn)行無線調(diào)試：第一部分

其他關(guān)聯(lián)資訊

工控機(jī)與計(jì)算機(jī)之間有什么區(qū)別

2021-09-01

量子計(jì)算的革命什么時候開始的

2020-01-14

高速SerDes應(yīng)用的PCB設(shè)計(jì)要點(diǎn)

2020-03-24

LED電路的組成及其性能分析

2019-06-19

電流表結(jié)構(gòu)詳解產(chǎn)生電流誤差原因分析

2022-10-08