CDR-model In 2024 | Part 2

Posted on 2025-07-27 Edited on 2025-07-28 In CDR , Model Views: Word count in article: 2.4k Reading time ≈ 9 mins.

2024年的CDR模型easy go

原来没有剩多少捏，蚌

想看2020到2022的可以前往CDR models From 2020 To 2022

想看2023的可以前往CDR models In 2023

想看2024（前半截）的可以前往CDR model In 2024 | Part 1

2024

RedCDR

不想看了捏（直接掏之前的笔记了捏）

RedCDR模型构造过程详解

RedCDR（Dual Relation Distillation for Cancer Drug Response Prediction）是一个用于癌症药物反应预测的双关系蒸馏模型。模型基于多组学数据和药物分子结构，通过并行双分支架构独立学习细胞线/药物属性信息与细胞线-药物关联信息，并使用融合模块实现知识蒸馏。以下详细说明模型的构造过程，包括核心组件、公式和关键步骤。

1. 模型总体框架

RedCDR由三个主要模块组成：属性分支（Attribute Branch）、关联分支（Association Branch）和融合模块（Fusion Module）。整体架构如图1所示：
RedCDR

输入：
- 细胞线多组学数据：基因组突变（$x_i^g \in \mathbb{R}^{1 \times \text{Dim}_g}$）、转录组表达（$x_i^t \in \mathbb{R}^{1 \times \text{Dim}_t}$）、表观基因组甲基化（$x_i^e \in \mathbb{R}^{1 \times \text{Dim}_e}$）。
- 药物分子图：$\mathcal{G}_j = (X_j^d, A_j^d)$，其中$X_j^d \in \mathbb{R}^{N_j^d \times \text{Dim}_d}$为原子特征矩阵，$A_j^d \in \mathbb{R}^{N_j^d \times N_j^d}$为邻接矩阵。
- 细胞线-药物响应矩阵：$R \in \mathbb{R}^{N_C \times N_D}$，$R_{ij} = 1$表示敏感响应，$R_{ij} = 0$表示抵抗响应。
输出：预测响应概率$\hat{R}_{ij}^{\text{Fu}}$。

2. 属性分支（Attribute Branch）

属性分支独立学习细胞线和药物的属性表示，包括多组学编码器和药物编码器。

2.1 自适应交互多组学编码器（Adaptive Interacting Multi-omics Encoder）

此模块整合细胞线的多组学数据，考虑组学间交互和重要性权重。结构如图2：
RedCDR-multi-omics-encoder

步骤1：基础多组学表示
使用独立网络提取各组学潜在表示（统一维度$F$）：
$$
e_i^g = f_g(x_i^g), \quad e_i^t = f_t(x_i^t), \quad e_i^e = f_e(x_i^e)
$$
其中$f_g(\cdot)$为1D卷积网络（适用于基因组数据），$f_t(\cdot)$和$f_e(\cdot)$为全连接网络。拼接后得到基础表示：
$$
h_i^b = \text{LeakyReLU}([e_i^g | e_i^t | e_i^e] W_b + b_b)
$$
这里$W_b \in \mathbb{R}^{3F \times F}$, $b_b \in \mathbb{R}^{1 \times F}$，$|$表示向量拼接。
步骤2：组学特定表示学习
构建多关系图，利用细胞线间相似性增强交互：
- 计算组学$m \in {g, t, e}$的相似矩阵$S^m$：
  $$
  S_{ij}^m = k(e_i^m, e_j^m) = \frac{e_i^m \cdot e_j^{mT}}{|e_i^m| |e_j^m|}
  $$
- 基于$S^m$构建邻接矩阵$A^m$（选择top-$k$相似细胞线）。
- 应用多层GCN传播信息：
  $$
  H^{m,(l+1)} = \text{LeakyReLU}(\widetilde{A}^m H^{m,(l)} W_m^{(l)})
  $$
  其中$\widetilde{A}^m = (\hat{D}^m)^{-1/2} (A^m + I) (\hat{D}^m)^{-1/2}$为归一化邻接矩阵，$H^{m,(0)} = [e_i^g | e_i^t | e_i^e]$。
步骤3：自适应融合
使用点积注意力机制加权融合组学表示，以$h_i^b$作为查询，组学特定表示$[h_i^g, h_i^t, h_i^e]$作为键和值：
$$
h_i^c = \text{Softmax}(q_i k_i^T) v_i, \quad q_i = h_i^b, \quad k_i = v_i = [h_i^g, h_i^t, h_i^e]
$$
最终细胞线表示：
$$
h_i^{\text{At},C} = \text{ReLU}(h_i^c W_C^{\text{At}} + b_C^{\text{At}})
$$
其中$W_C^{\text{At}} \in \mathbb{R}^{F \times F}$, $b_C^{\text{At}} \in \mathbb{R}^{1 \times F}$。

2.2 药物编码器（Drug Encoder）

处理药物分子图以提取全局表示：

应用多层GCN学习原子节点表示$H_j^d$：
$$
H_j^{d,(l+1)} = \text{LeakyReLU}(\widetilde{A}_j^d H_j^{d,(l)} W_d^{(l)})
$$
其中$\widetilde{A}_j^d$为归一化邻接矩阵。
使用全局最大池化（GMP）生成药物级表示：
$$
h_j^{\text{At},D} = \text{GMP}(H_j^d)
$$

3. 关联分支（Association Branch）

关联分支从细胞线-药物响应中学习表示，区分敏感和抵抗响应。

3.1 二分图构建

敏感图$\mathcal{G}^s = (X^s, A^s)$和抵抗图$\mathcal{G}^r = (X^r, A^r)$：
- 节点嵌入$X^s = X^r = [X^C | X^D] \in \mathbb{R}^{(N_C + N_D) \times F}$为随机初始化可训练向量。
- 邻接矩阵：
  $$
  A^s = \begin{bmatrix} 0 & R^s \ (R^s)^T & 0 \end{bmatrix}, \quad A^r = \begin{bmatrix} 0 & R^r \ (R^r)^T & 0 \end{bmatrix}
  $$
  其中$R_{ij}^s = M_{ij} R_{ij}$, $R_{ij}^r = M_{ij} (1 - R_{ij})$，$M_{ij}$为指示矩阵（存在响应时为1）。

3.2 表示学习

对敏感图应用多层GCN：
$$
H^{s,(l+1)} = \text{LeakyReLU}\left( (\hat{D}^s)^{-1/2} A^s (\hat{D}^s)^{-1/2} H^{s,(l)} W_s^{(l)} \right)
$$
其中$H^{s,(0)} = X^s$。拼接所有层输出：
$$
h_i^{S,C} = [h_i^{s,(0)} | h_i^{s,(1)} | \cdots | h_i^{s,(L)}], \quad h_j^{S,D} = [h_j^{s,(0)} | h_j^{s,(1)} | \cdots | h_j^{s,(L)}]
$$
同样方式学习抵抗图表示$h_i^{R,C}$和$h_j^{R,D}$。
整合敏感和抵抗表示：
$$
h_i^{\text{As},C} = \text{ReLU}([h_i^{S,C} | h_i^{R,C}] W_C^{\text{As}} + b_C^{\text{As}})
$$
$$
h_j^{\text{As},D} = \text{ReLU}([h_j^{S,D} | h_j^{R,D}] W_D^{\text{As}} + b_D^{\text{As}})
$$

4. 融合模块（Fusion Module）与双关系蒸馏

融合模块整合双分支表示，并通过蒸馏机制迁移知识。

4.1 分支融合

拼接属性分支和关联分支的表示：
$$
h_i^{\text{Fu},C} = \text{ReLU}([h_i^{\text{At},C} | h_i^{\text{As},C}] W_C^{\text{Fu}} + b_C^{\text{Fu}})
$$
$$
h_j^{\text{Fu},D} = \text{ReLU}([h_j^{\text{At},D} | h_j^{\text{As},D}] W_D^{\text{Fu}} + b_D^{\text{Fu}})
$$

4.2 响应预测

使用线性相关系数解码器重建响应矩阵：
$$
\rho(h_i, h_j) = \frac{(h_i - \mu_i \mathbf{1}) (h_j - \mu_j \mathbf{1})^T}{\sqrt{(h_i - \mu_i \mathbf{1})(h_i - \mu_i \mathbf{1})^T} \sqrt{(h_j - \mu_j \mathbf{1})(h_j - \mu_j \mathbf{1})^T}}
$$
应用sigmoid函数处理不平衡样本：
$$
\phi(x) = \frac{1}{1 + e^{-\gamma x}}
$$
最终预测：
$$
\hat{R}_{ij}^K = \phi(\rho(h_i^{K,C}, h_j^{K,D})), \quad K \in {\text{At}, \text{As}, \text{Fu}}
$$

4.3 双关系蒸馏机制

促进知识从分支迁移到融合模块：

表示蒸馏（Representation Distillation）：保持细胞线和药物间的相似关系：
$$
S_{ij}^{K,C} = k(h_i^{K,C}, h_j^{K,C}), \quad S_{ij}^{K,D} = k(h_i^{K,D}, h_j^{K,D})
$$
损失函数（以属性分支为例）：
$$
\mathcal{L}_{rd}^{\text{At}} = \frac{1}{N_C^2} \sum_{c_i \in C} \sum_{c_j \in C} | S_{ij}^{\text{At},C} - S_{ij}^{\text{Fu},C} |_2^2 + \frac{1}{N_D^2} \sum_{d_i \in D} \sum_{d_j \in D} | S_{ij}^{\text{At},D} - S_{ij}^{\text{Fu},D} |_2^2
$$
总表示蒸馏损失：$\mathcal{L}_{rd} = \mathcal{L}_{rd}^{\text{At}} + \mathcal{L}_{rd}^{\text{As}}$。
预测蒸馏（Prediction Distillation）：对齐分支和融合模块的预测：
$$
\mathcal{L}_{pd} = \frac{1}{N_C N_D} \sum_{c_i \in C} \sum_{d_j \in D} \left( | \hat{R}_{ij}^{\text{At}} - \hat{R}_{ij}^{\text{Fu}} |_2^2 + | \hat{R}_{ij}^{\text{As}} - \hat{R}_{ij}^{\text{Fu}} |_2^2 \right)
$$

5. 优化目标

总损失函数结合预测任务和蒸馏损失：
$$
\mathcal{L} = \mathcal{L}_{ce} + \lambda_{rd} \mathcal{L}_{rd} + \lambda_{pd} \mathcal{L}_{pd}
$$
其中$\mathcal{L}_{ce}$为监督交叉熵损失：
$$
\mathcal{L}_{ce} = -\frac{1}{N_M} \sum_{c_i \in C} \sum_{d_j \in D} M_{ij} \left[ R_{ij} \log(\hat{R}_{ij}^{\text{Fu}}) + (1 - R_{ij}) \log(1 - \hat{R}_{ij}^{\text{Fu}}) \right]
$$
$\lambda_{rd}$和$\lambda_{pd}$为超参数平衡权重。

此构造过程使RedCDR能自适应整合多组学数据，并行学习属性与关联信息，并通过蒸馏提升预测鲁棒性。

MFGAN

感觉没什么东西捏

📚 𝒥𝑒𝒻𝑒𝓇𝑒𝓃𝒸𝑒

📄 Shi - MCMVDRP a multi-channel multi-view deep learning framework for cancer drug response prediction

📄 Sun - 2024 - DAPM-CDR A domain adaptation prompting model for drug response prediction

📄 Wang - 2024 - A hierarchical attention network integrating multi-scale relationship for drug response prediction

📄 Wang - 2024 - XGraphCDS An explainable deep learning model for predicting drug sensitivity from gene pathways and

📄 Xu 等 - RedCDR Dual Relation Distillation for Cancer Drug Response Prediction

📄 Zhou - 2024 - Multi-omics fusion based on attention mechanism for survival and drug response prediction in Digesti