CDR-model In 2024 | Part 2

2024年的CDR模型easy go

原来没有剩多少捏,蚌

想看2020到2022的可以前往CDR models From 2020 To 2022

想看2023的可以前往CDR models In 2023

想看2024(前半截)的可以前往CDR model In 2024 | Part 1

2024

MultiDRP

好空虚,感觉什么都没有捏

MCMVDRP

又是一篇典型的一看架构图就知道在干什么的东西捏

MCMVDRP

DAPM CDR

和提示词有关的,目前没有兴趣捏

XGraphCDS

将模型可解释性的,但这不是鼠鼠想关注的捏

RedCDR

不想看了捏(直接掏之前的笔记了捏)

RedCDR模型构造过程详解

RedCDR(Dual Relation Distillation for Cancer Drug Response Prediction)是一个用于癌症药物反应预测的双关系蒸馏模型。模型基于多组学数据和药物分子结构,通过并行双分支架构独立学习细胞线/药物属性信息与细胞线-药物关联信息,并使用融合模块实现知识蒸馏。以下详细说明模型的构造过程,包括核心组件、公式和关键步骤。

1. 模型总体框架

RedCDR由三个主要模块组成:属性分支(Attribute Branch)、关联分支(Association Branch)和融合模块(Fusion Module)。整体架构如图1所示:
RedCDR

  • 输入
    • 细胞线多组学数据:基因组突变($x_i^g \in \mathbb{R}^{1 \times \text{Dim}_g}$)、转录组表达($x_i^t \in \mathbb{R}^{1 \times \text{Dim}_t}$)、表观基因组甲基化($x_i^e \in \mathbb{R}^{1 \times \text{Dim}_e}$)。
    • 药物分子图:$\mathcal{G}_j = (X_j^d, A_j^d)$,其中$X_j^d \in \mathbb{R}^{N_j^d \times \text{Dim}_d}$为原子特征矩阵,$A_j^d \in \mathbb{R}^{N_j^d \times N_j^d}$为邻接矩阵。
    • 细胞线-药物响应矩阵:$R \in \mathbb{R}^{N_C \times N_D}$,$R_{ij} = 1$表示敏感响应,$R_{ij} = 0$表示抵抗响应。
  • 输出:预测响应概率$\hat{R}_{ij}^{\text{Fu}}$。
2. 属性分支(Attribute Branch)

属性分支独立学习细胞线和药物的属性表示,包括多组学编码器和药物编码器。

2.1 自适应交互多组学编码器(Adaptive Interacting Multi-omics Encoder)

此模块整合细胞线的多组学数据,考虑组学间交互和重要性权重。结构如图2:
RedCDR-multi-omics-encoder

  • 步骤1:基础多组学表示
    使用独立网络提取各组学潜在表示(统一维度$F$):
    $$
    e_i^g = f_g(x_i^g), \quad e_i^t = f_t(x_i^t), \quad e_i^e = f_e(x_i^e)
    $$
    其中$f_g(\cdot)$为1D卷积网络(适用于基因组数据),$f_t(\cdot)$和$f_e(\cdot)$为全连接网络。拼接后得到基础表示:
    $$
    h_i^b = \text{LeakyReLU}([e_i^g | e_i^t | e_i^e] W_b + b_b)
    $$
    这里$W_b \in \mathbb{R}^{3F \times F}$, $b_b \in \mathbb{R}^{1 \times F}$,$|$表示向量拼接。

  • 步骤2:组学特定表示学习
    构建多关系图,利用细胞线间相似性增强交互:

    • 计算组学$m \in {g, t, e}$的相似矩阵$S^m$:
      $$
      S_{ij}^m = k(e_i^m, e_j^m) = \frac{e_i^m \cdot e_j^{mT}}{|e_i^m| |e_j^m|}
      $$
    • 基于$S^m$构建邻接矩阵$A^m$(选择top-$k$相似细胞线)。
    • 应用多层GCN传播信息:
      $$
      H^{m,(l+1)} = \text{LeakyReLU}(\widetilde{A}^m H^{m,(l)} W_m^{(l)})
      $$
      其中$\widetilde{A}^m = (\hat{D}^m)^{-1/2} (A^m + I) (\hat{D}^m)^{-1/2}$为归一化邻接矩阵,$H^{m,(0)} = [e_i^g | e_i^t | e_i^e]$。
  • 步骤3:自适应融合
    使用点积注意力机制加权融合组学表示,以$h_i^b$作为查询,组学特定表示$[h_i^g, h_i^t, h_i^e]$作为键和值:
    $$
    h_i^c = \text{Softmax}(q_i k_i^T) v_i, \quad q_i = h_i^b, \quad k_i = v_i = [h_i^g, h_i^t, h_i^e]
    $$
    最终细胞线表示:
    $$
    h_i^{\text{At},C} = \text{ReLU}(h_i^c W_C^{\text{At}} + b_C^{\text{At}})
    $$
    其中$W_C^{\text{At}} \in \mathbb{R}^{F \times F}$, $b_C^{\text{At}} \in \mathbb{R}^{1 \times F}$。

2.2 药物编码器(Drug Encoder)

处理药物分子图以提取全局表示:

  • 应用多层GCN学习原子节点表示$H_j^d$:
    $$
    H_j^{d,(l+1)} = \text{LeakyReLU}(\widetilde{A}_j^d H_j^{d,(l)} W_d^{(l)})
    $$
    其中$\widetilde{A}_j^d$为归一化邻接矩阵。
  • 使用全局最大池化(GMP)生成药物级表示:
    $$
    h_j^{\text{At},D} = \text{GMP}(H_j^d)
    $$
3. 关联分支(Association Branch)

关联分支从细胞线-药物响应中学习表示,区分敏感和抵抗响应。

3.1 二分图构建
  • 敏感图$\mathcal{G}^s = (X^s, A^s)$和抵抗图$\mathcal{G}^r = (X^r, A^r)$:
    • 节点嵌入$X^s = X^r = [X^C | X^D] \in \mathbb{R}^{(N_C + N_D) \times F}$为随机初始化可训练向量。
    • 邻接矩阵:
      $$
      A^s = \begin{bmatrix} 0 & R^s \ (R^s)^T & 0 \end{bmatrix}, \quad A^r = \begin{bmatrix} 0 & R^r \ (R^r)^T & 0 \end{bmatrix}
      $$
      其中$R_{ij}^s = M_{ij} R_{ij}$, $R_{ij}^r = M_{ij} (1 - R_{ij})$,$M_{ij}$为指示矩阵(存在响应时为1)。
3.2 表示学习
  • 对敏感图应用多层GCN:
    $$
    H^{s,(l+1)} = \text{LeakyReLU}\left( (\hat{D}^s)^{-1/2} A^s (\hat{D}^s)^{-1/2} H^{s,(l)} W_s^{(l)} \right)
    $$
    其中$H^{s,(0)} = X^s$。拼接所有层输出:
    $$
    h_i^{S,C} = [h_i^{s,(0)} | h_i^{s,(1)} | \cdots | h_i^{s,(L)}], \quad h_j^{S,D} = [h_j^{s,(0)} | h_j^{s,(1)} | \cdots | h_j^{s,(L)}]
    $$
  • 同样方式学习抵抗图表示$h_i^{R,C}$和$h_j^{R,D}$。
  • 整合敏感和抵抗表示:
    $$
    h_i^{\text{As},C} = \text{ReLU}([h_i^{S,C} | h_i^{R,C}] W_C^{\text{As}} + b_C^{\text{As}})
    $$
    $$
    h_j^{\text{As},D} = \text{ReLU}([h_j^{S,D} | h_j^{R,D}] W_D^{\text{As}} + b_D^{\text{As}})
    $$
4. 融合模块(Fusion Module)与双关系蒸馏

融合模块整合双分支表示,并通过蒸馏机制迁移知识。

4.1 分支融合

拼接属性分支和关联分支的表示:
$$
h_i^{\text{Fu},C} = \text{ReLU}([h_i^{\text{At},C} | h_i^{\text{As},C}] W_C^{\text{Fu}} + b_C^{\text{Fu}})
$$
$$
h_j^{\text{Fu},D} = \text{ReLU}([h_j^{\text{At},D} | h_j^{\text{As},D}] W_D^{\text{Fu}} + b_D^{\text{Fu}})
$$

4.2 响应预测

使用线性相关系数解码器重建响应矩阵:
$$
\rho(h_i, h_j) = \frac{(h_i - \mu_i \mathbf{1}) (h_j - \mu_j \mathbf{1})^T}{\sqrt{(h_i - \mu_i \mathbf{1})(h_i - \mu_i \mathbf{1})^T} \sqrt{(h_j - \mu_j \mathbf{1})(h_j - \mu_j \mathbf{1})^T}}
$$
应用sigmoid函数处理不平衡样本:
$$
\phi(x) = \frac{1}{1 + e^{-\gamma x}}
$$
最终预测:
$$
\hat{R}_{ij}^K = \phi(\rho(h_i^{K,C}, h_j^{K,D})), \quad K \in {\text{At}, \text{As}, \text{Fu}}
$$

4.3 双关系蒸馏机制

促进知识从分支迁移到融合模块:

  • 表示蒸馏(Representation Distillation):保持细胞线和药物间的相似关系:
    $$
    S_{ij}^{K,C} = k(h_i^{K,C}, h_j^{K,C}), \quad S_{ij}^{K,D} = k(h_i^{K,D}, h_j^{K,D})
    $$
    损失函数(以属性分支为例):
    $$
    \mathcal{L}_{rd}^{\text{At}} = \frac{1}{N_C^2} \sum_{c_i \in C} \sum_{c_j \in C} | S_{ij}^{\text{At},C} - S_{ij}^{\text{Fu},C} |_2^2 + \frac{1}{N_D^2} \sum_{d_i \in D} \sum_{d_j \in D} | S_{ij}^{\text{At},D} - S_{ij}^{\text{Fu},D} |_2^2
    $$
    总表示蒸馏损失:$\mathcal{L}_{rd} = \mathcal{L}_{rd}^{\text{At}} + \mathcal{L}_{rd}^{\text{As}}$。
  • 预测蒸馏(Prediction Distillation):对齐分支和融合模块的预测:
    $$
    \mathcal{L}_{pd} = \frac{1}{N_C N_D} \sum_{c_i \in C} \sum_{d_j \in D} \left( | \hat{R}_{ij}^{\text{At}} - \hat{R}_{ij}^{\text{Fu}} |_2^2 + | \hat{R}_{ij}^{\text{As}} - \hat{R}_{ij}^{\text{Fu}} |_2^2 \right)
    $$
5. 优化目标

总损失函数结合预测任务和蒸馏损失:
$$
\mathcal{L} = \mathcal{L}_{ce} + \lambda_{rd} \mathcal{L}_{rd} + \lambda_{pd} \mathcal{L}_{pd}
$$
其中$\mathcal{L}_{ce}$为监督交叉熵损失:
$$
\mathcal{L}_{ce} = -\frac{1}{N_M} \sum_{c_i \in C} \sum_{d_j \in D} M_{ij} \left[ R_{ij} \log(\hat{R}_{ij}^{\text{Fu}}) + (1 - R_{ij}) \log(1 - \hat{R}_{ij}^{\text{Fu}}) \right]
$$
$\lambda_{rd}$和$\lambda_{pd}$为超参数平衡权重。

此构造过程使RedCDR能自适应整合多组学数据,并行学习属性与关联信息,并通过蒸馏提升预测鲁棒性。

MFGAN

感觉没什么东西捏

📚 𝒥𝑒𝒻𝑒𝓇𝑒𝓃𝒸𝑒

📄 Shi - MCMVDRP a multi-channel multi-view deep learning framework for cancer drug response prediction

📄 Sun - 2024 - DAPM-CDR A domain adaptation prompting model for drug response prediction

📄 Wang - 2024 - A hierarchical attention network integrating multi-scale relationship for drug response prediction

📄 Wang - 2024 - XGraphCDS An explainable deep learning model for predicting drug sensitivity from gene pathways and

📄 Xu 等 - RedCDR Dual Relation Distillation for Cancer Drug Response Prediction

📄 Zhou - 2024 - Multi-omics fusion based on attention mechanism for survival and drug response prediction in Digesti