单细胞转录组 (scRNA-seq) 技术已成为生命科学研究的基石,它使我们能够以前所未有的分辨率识别出组织中所有细胞类型的“身份”。然而,疾病的发生发展,如肿瘤转移、炎症反应或组织纤维化,往往不是单个细胞的“独角戏”,而是多个细胞类型通过复杂的信号分子和受体进行高强度“对话”的结果。
如何从海量的 scRNA-seq数据中,精准地捕获和解读这些细胞间的“窃窃私语”? 这就是我们今天要探讨的焦点:细胞间通讯网络分析(Cell-Cell Communication,CCC)。
传统的分析仅关注每个细胞的基因表达,而 CCC分析则更进一步,利用已知的配体-受体(Ligand-Receptor)数据库,将不同细胞群体的表达数据连接起来。
核心原理:
1. 配体表达: 识别细胞A(信号发送方)高表达的配体(Ligand,如细胞因子、生长因子)。
2. 受体表达: 识别细胞B(信号接收方)高表达的受体(Receptor)。
3. 通讯潜力: 如果细胞A表达配体,同时细胞B表达匹配的受体,那么A to B 的信号通路就被认为具有潜在的通讯活性。
假设我们的研究对象是肿瘤微环境下的单细胞数据,目标是找出肿瘤细胞与免疫细胞是如何“勾结”的。
1. 细胞类型精细分群与注释
这几乎是所有 scRNA-seq 分析的基础。利用 UMAP/t-SNE 降维和 marker 基因识别,将细胞准确分成:肿瘤细胞、T 细胞、巨噬细胞、成纤维细胞等。细胞注释的精细程度直接决定了CCC结果的精确度。
2. 通讯活性矩阵生成
使用 CellPhoneDB 等工具,输入分群后的单细胞表达矩阵。软件将输出一个通讯活性矩阵:
这个矩阵能够直观地告诉我们:哪个细胞类型是最活跃的信号发送方,哪个细胞类型是最主要的信号接收方。
3. 核心配体-受体对筛选
通过阈值筛选出可靠的通讯对。例如:
通路 1: 肿瘤细胞 (L) to 巨噬细胞 (R)
通路 2: 成纤维细胞 (L)to T 细胞 (R)
重点关注那些具有生物学意义的分子,例如免疫检查点分子(如 PD-1、PD-L1)或促炎症因子。
4. 网络可视化与关键通路挖掘
将筛选出的配体-受体对以网络图或和弦图(Chord Diagram)的形式展示。通过图形化结果,我们可以一目了然地识别出:
“通讯枢纽”(Hub Cells): 在网络中连接最多、最关键的细胞类型(如调节 T 细胞的肿瘤相关巨噬细胞)。
“主导信号”: 在通讯网络中强度最高的信号通路(如 CXCL-CXCR 轴驱动的细胞招募)。
CCC分析的价值在于,它将静态的细胞身份列表转化为动态的作用机制假设:
1. 药物靶点新发现: 找出疾病状态下特有的高活性通讯轴。例如,如果发现成纤维细胞通过 TGF-β 信号轴强烈抑制 NK 细胞,那么 TGF-β 阻断剂将是一个新的干预策略。
2. 疾病进展机制揭示: 解释细胞类型间的相互作用如何推动疾病发展。例如,肿瘤细胞如何“贿赂”周围的基质细胞形成保护屏障。
3. 生物标志物: 确定影响关键细胞功能(如免疫逃逸、耐药性)的最重要信号分子组合。