免费A级毛片无码专区网站-成人国产精品视频一区二区-啊 日出水了 用力乖乖在线-国产黑色丝袜在线观看下-天天操美女夜夜操美女-日韩网站在线观看中文字幕-AV高清hd片XXX国产-亚洲av中文字字幕乱码综合-搬开女人下面使劲插视频

謠言檢測(cè)《Data Fusion Oriented Graph Convolution Network Model for Rumor Detection》

論文信息

論文標(biāo)題:Data Fusion Oriented Graph Convolution Network Model for Rumor Detection論文作者:Erxue Min, Yu Rong, Yatao Bian, Tingyang Xu, Peilin Zhao, Junzhou Huang,Sophia Ananiadou論文來(lái)源:2020,IEEE Transactions on Network and Service Management論文地址:download 論文代碼:download
1 Introduction本文不僅考慮了用戶的基本信息和文本內(nèi)容等靜態(tài)特征,還考慮了謠言傳播關(guān)系等動(dòng)態(tài)特征 。我們還對(duì)特征融合模塊和池化模塊進(jìn)行了優(yōu)化,使模型具有更好的性能 。
本文貢獻(xiàn):


    • Considering the real dataset from social media, we extract static features such as users’ basic information and text contents, as well as dynamic features such as rumor propagation relations, and propose the data fusion method.
    • GCN is introduced into the rumor detection task, which represents the rumor propagation mode. And we propose to select the suitable graph convolution operator to update the node vectors, and improve the feature fusion and pooling module.
    • Experiments based on Sina Weibo dataset validate the performance of the propsed GCN-based model for rumor detection.
2 Main整體框架如下:
謠言檢測(cè)《Data Fusion Oriented Graph Convolution Network Model for Rumor Detection》

文章插圖
主要包括如下四個(gè)模塊:


    1. the feature extraction module
    2. the feature fusion module
    3. the graph convolution module
    4. the pooling module
2.1 Feature Extraction Module2.1.1 Features of User Basic Information常見(jiàn)的 User basic information:
謠言檢測(cè)《Data Fusion Oriented Graph Convolution Network Model for Rumor Detection》

文章插圖
加入這些特征的原因:如 gender 為 女的情況下,是謠言的概率更高 。
特征預(yù)處理:
對(duì)于 gender 采用 One-hot 向量;
對(duì)于追隨者特征,采用的是 Min-Max normalization ,但是這對(duì)于普通用戶(如擁有 follower 小的用戶)用以造成大部分的數(shù)值為 $0$,所以本文采用 $\text{log}$ 處理,如下:
$x^{*}=\left\{\begin{array}{ll}\frac{\log x-\log x_{\min }}{\log x_{\max }-\log x_{\min }}  & x>0 \\0  & x=0\end{array}\right\} \quad\quad\quad(2)$
其中,$x$ 代表歸一化前的追隨者數(shù)量,$x^{*} $ 表示標(biāo)準(zhǔn)化值,$x_{\min }$ 和 $x_{\max }$ 表示中的最小和最大追隨者數(shù)量 。
2.1.2 User Similarity Feature考慮用戶相似性,首先構(gòu)造一個(gè) user-event matrix $M$,其中 User 有 $N_{1}$ 個(gè),event 有 $N_{2}$ 個(gè),所以 $M \in N_{1} \times N_{2}$。可以預(yù)見(jiàn)的是 $M$ 是一個(gè)稀疏矩陣,所以本文采用 SVD 分解:
$A=U \Sigma V^{T}\quad\quad\quad(3)$
其中 $A$ 為需要分解的矩陣,$U$ 為左奇異值矩陣,$\Sigma$ 為對(duì)角矩陣,對(duì)角元素為奇異值,$V$ 為右奇異值矩陣 。根據(jù)奇異值分解在推薦系統(tǒng)中的應(yīng)用思想,我們可以取前 $N$ 個(gè)奇異值,計(jì)算 $\Sigma$ 與 $U$ 之間的點(diǎn)積,得到用戶的向量表示,從而實(shí)現(xiàn)降維的目的 。最后,每個(gè)用戶都將有一個(gè) $N$ 維的向量表示 。兩個(gè)用戶向量之間的距離越近,它們共同參與的事件的數(shù)量就越多 ?;谕瑯拥乃枷耄€可以構(gòu)建 users-users 之間的矩陣,矩陣元素表示兩個(gè)用戶都參與的事件的數(shù)量 。然后使用相同的方法為用戶生成另一組向量特征,并將基于用戶-事件矩陣分解為用戶相似性特征的向量相結(jié)合 。
2.1.3 Representation of Text Content使用  $BERT_{base}$ Chinese model 提取文本表示 。
2.1.4 Feature Fusion Module直接拼接特征會(huì)導(dǎo)致訓(xùn)練不穩(wěn)定,在 Fig. 3 ,$x \in R^{N \times D_{1}}$ 和 $x^{\prime} \in R^{N \times D_{2}}$ 代表 兩個(gè)不同的特征向量, $N$ 代表節(jié)點(diǎn)的數(shù)量,$D_{1}$  和 $D_{2}$ 代表節(jié)點(diǎn)的維度 。首先將上述特征放入一個(gè)兩層 的 MLP 模塊,然后執(zhí)行 BN ,$\begin{array}{l}\mu \leftarrow \frac{1}{m} \sum\limits_{i=0}^{m} h_{i} \\\sigma^{2} \leftarrow \frac{1}{m} \sum\limits_{i=0}^{m}\left(h_{i}-\mu\right)^{2} \\\hat{h}_{l} \leftarrow \frac{h_{i}-\mu}{\sqrt{\sigma^{2}+\varepsilon}} \\w_{i} \leftarrow \gamma \hat{h}_{i}+\beta\end{array}$

經(jīng)驗(yàn)總結(jié)擴(kuò)展閱讀