本公開涉及生物信息領域,特別是涉及一種細胞通訊分析方法、裝置、電子設備和存儲介質(zhì)。
背景技術:
1、多細胞生物的細胞與細胞之間往往會通過細胞因子和膜蛋白等進行通訊,從而調(diào)節(jié)生命活動。因此,受體與配體介導的細胞間通訊對細胞分化、組織和器官內(nèi)的細胞類型相互作用、與免疫反應的研究上起到重要的作用。相關技術中,為了高效且準確的對細胞中的細胞互作關系進行分析,涌現(xiàn)了大量的細胞通訊分析應用。細胞通訊分析應用可以基于配受體數(shù)據(jù)集進行細胞通訊分析,但是目前,細胞通訊分析結果可靠性的較低。
技術實現(xiàn)思路
1、本公開實施例提供了一種細胞通訊分析方法、裝置、電子設備和存儲介質(zhì),該方法可以提高細胞通訊分析結果的可靠性。
2、根據(jù)本公開的一方面,提供了一種細胞通訊分析方法,包括:
3、獲取目標配受體數(shù)據(jù)集,所述目標配受體數(shù)據(jù)集為對多個預設配受體數(shù)據(jù)集與自建配受體數(shù)據(jù)集進行整合得到的配受體數(shù)據(jù)集,所述自建配受體數(shù)據(jù)集為基于多個基因庫中的潛在配受體基因構建的配受體數(shù)據(jù)集;
4、基于所述目標配受體數(shù)據(jù)集與待分析細胞群的空間轉(zhuǎn)錄數(shù)據(jù)及細胞注釋數(shù)據(jù)生成多個細胞通訊分析應用對應的細胞通訊分析數(shù)據(jù),并將每一細胞通訊分析數(shù)據(jù)輸入至相應的細胞通訊分析應用中進行細胞通訊分析,得到多個子分析結果;
5、對所述多個子分析結果進行并集處理,得到融合分析結果;
6、基于多個所述子分析結果與所述融合分析結果,計算所述融合分析結果的第一可信度分數(shù)與所述目標配受體數(shù)據(jù)集中每一配受體對的第二可信度分數(shù);
7、當所述第一可信度分數(shù)大于預設閾值時,基于所述第二可信度分數(shù)篩選出目標配受體對,并根據(jù)所述目標配受體對從所述融合分析結果中確定目標細胞分析結果。
8、根據(jù)本公開的一方面,提供了一種細胞通訊分析裝置,包括:
9、第一獲取單元,用于獲取目標配受體數(shù)據(jù)集,所述目標配受體數(shù)據(jù)集為對多個預設配受體數(shù)據(jù)集與自建配受體數(shù)據(jù)集進行整合得到的配受體數(shù)據(jù)集,所述自建配受體數(shù)據(jù)集為基于多個基因庫中的潛在配受體基因構建的配受體數(shù)據(jù)集;
10、分析單元,用于基于所述目標配受體數(shù)據(jù)集與待分析細胞群的空間轉(zhuǎn)錄數(shù)據(jù)及細胞注釋數(shù)據(jù)生成多個細胞通訊分析應用對應的細胞通訊分析數(shù)據(jù),并將每一細胞通訊分析數(shù)據(jù)輸入至相應的細胞通訊分析應用中進行細胞通訊分析,得到多個子分析結果;
11、合并處理單元,用于對所述多個子分析結果進行并集處理,得到融合分析結果;
12、計算單元,用于基于多個所述子分析結果與所述融合分析結果,計算所述融合分析結果的第一可信度分數(shù)與所述目標配受體數(shù)據(jù)集中每一配受體對的第二可信度分數(shù);
13、確定單元,用于當所述第一可信度分數(shù)大于預設閾值時,基于所述第二可信度分數(shù)篩選出目標配受體對,并根據(jù)所述目標配受體對從所述融合分析結果中確定目標細胞分析結果。
14、可選地,每一所述配受體對與對應的配受體可信度分數(shù)在所述目標配受體數(shù)據(jù)集中對應存儲,所述配受體可信度分數(shù)指示了所述配受體對在通用場景中的可信度;
15、所述計算單元具體用于:
16、基于多個所述子分析結果與所述融合分析結果,計算所述融合分析結果的第一可信度分數(shù)與每一配受體對在所述融合分析結果中的第三可信度分數(shù);
17、基于每一所述配受體對的所述第三可信度分數(shù)與所述配受體可信度分數(shù),計算每一所述配受體對的第二可信度分數(shù)。
18、可選地,所述融合分析結果中包含所述待分析細胞群中每一細胞基于所述目標配受體數(shù)據(jù)集中的每一所述配受體對進行細胞通訊的互作結果;
19、所述計算單元具體用于:
20、針對所述融合分析結果中的每一所述互作結果,確定多個所述子分析結果中包含所述互作結果的所述子分析結果的第一數(shù)目;
21、基于所述第一數(shù)目與所述子分析結果的總數(shù)目,計算所述互作結果對應的互作結果可信度分數(shù);
22、基于所述融合分析結果中的多個所述互作結果對應的所述互作結果可信度分數(shù),計算所述融合分析結果的第一可信度分數(shù)與每一配受體對在所述融合分析結果中的第三可信度分數(shù)。
23、可選地,所述計算單元具體用于:
24、計算所述融合分析結果中多個所述互作結果對應的所述互作結果可信度分數(shù)的平均值,作為所述融合分析結果的第一可信度分數(shù);
25、針對每一配受體對,獲取多個所述細胞與所述配受體對的多個所述互作結果對應的多個所述互作結果可信度分數(shù),并計算多個所述互作結果可信度分數(shù)的平均值,作為所述配受體對在所述融合分析結果中的第三可信度分數(shù)。
26、可選地,所述目標配受體數(shù)據(jù)集通過以下方式構建:
27、獲取多個所述預設配受體數(shù)據(jù)集與所述自建配受體數(shù)據(jù)集;
28、將所述預設配受體數(shù)據(jù)集中的配受體對與所述自建配受體數(shù)據(jù)集中的配受體對整合;
29、針對整合后的配受體數(shù)據(jù)集中的每一所述配受體對生成配受體注釋,將所述配受體對與所述配受體注釋對應存儲,構建所述目標配受體數(shù)據(jù)集。
30、可選地,所述針對整合后的配受體數(shù)據(jù)集中的每一所述配受體對生成配受體注釋,將所述配受體對與所述配受體注釋對應存儲,構建所述目標配受體數(shù)據(jù)集,包括:
31、獲取第一參考配受體數(shù)據(jù)集;
32、針對整合后的配受體數(shù)據(jù)集中的每一所述配受體對,基于所述第一參考配受體數(shù)據(jù)集獲取所述配受體對的配受體可信度分數(shù);
33、將所述配受體可信度分數(shù)作為所述配受體對的配受體注釋,將所述配受體對與所述配受體注釋對應存儲,構建所述目標配受體數(shù)據(jù)集。
34、可選地,所述自建配受體數(shù)據(jù)集通過以下方式構建:
35、獲取多個所述基因庫,并從所述基因庫中獲取多個所述潛在配受體基因;
36、基于多個所述潛在配受體基因構建潛在配受體對;
37、獲取第二參考配受體數(shù)據(jù)集,并基于所述第二參考配受體數(shù)據(jù)集從所述潛在配受體對中篩選得到目標潛在配受體對;
38、將所述目標潛在配受體對構建為所述自建配受體數(shù)據(jù)集。
39、可選地,所述細胞通訊分析裝置還包括:
40、第二獲取單元,用于基于所述目標配受體數(shù)據(jù)集與多個所述預設配受體數(shù)據(jù)集,獲取多個待評估配受體數(shù)據(jù)集;
41、篩選單元,用于從多個所述待評估配受體數(shù)據(jù)集中篩選出評估后配受體數(shù)據(jù)集;
42、所述分析單元具體用于:
43、基于所述評估后配受體數(shù)據(jù)集與待分析細胞群的空間轉(zhuǎn)錄數(shù)據(jù)及細胞注釋數(shù)據(jù)生成多個細胞通訊分析應用對應的細胞通訊分析數(shù)據(jù),并將每一細胞通訊分析數(shù)據(jù)輸入至相應的細胞通訊分析應用中進行細胞通訊分析,得到多個子分析結果;
44、所述計算單元具體用于:
45、基于多個所述子分析結果與所述融合分析結果,計算所述融合分析結果的第一可信度分數(shù)與所述評估后配受體數(shù)據(jù)集中每一配受體對的第二可信度分數(shù)。
46、可選地,所述篩選單元具體用于:
47、基于每一所述待評估配受體數(shù)據(jù)集中包含的多個配受體對,確定所述待評估配受體數(shù)據(jù)集的第四可信度分數(shù);
48、根據(jù)多個所述待評估配受體數(shù)據(jù)集的所述第四可信度分數(shù),篩選出評估后配受體數(shù)據(jù)集。
49、可選地,所述融合分析結果中包含所述待分析細胞群中的細胞與所述目標配受體數(shù)據(jù)集中配受體對之間的第一互作矩陣、細胞類型組與所述目標配受體數(shù)據(jù)集中所述配受體對之間的第二互作矩陣與不同所述細胞類型之間的第三互作矩陣;
50、所述計算單元具體用于:
51、基于多個所述子分析結果與所述融合分析結果中的所述第一互作矩陣,計算所述第一互作矩陣的第一子可信度分數(shù)與所述目標配受體數(shù)據(jù)集中每一配受體對的第二可信度分數(shù);基于多個所述子分析結果與所述融合分析結果中的所述第二互作矩陣,計算所述第二互作矩陣的第二子可信度分數(shù);基于多個所述子分析結果與所述融合分析結果中的所述第三互作矩陣,計算所述第三互作矩陣的第三子可信度分數(shù);
52、根據(jù)所述第一子可信度分數(shù)、所述第二子可信度分數(shù)與所述第三子可信度分數(shù),計算所述融合分析結果的第一可信度分數(shù)。
53、可選地,所述確定單元具體用于:
54、基于所述第一互作矩陣中獲取所述目標配受體對的配受體互作強度與所述待分析細胞群中每一所述細胞的細胞互作強度;
55、基于所述第二互作矩陣,生成所述細胞類型組與所述目標配受體對的所述第一互作關系圖;
56、基于所述第三互作矩陣,生成不同所述細胞類型之間的所述第二互作關系圖;
57、將所述細胞的細胞互作強度、所述目標配受體對的所述配受體互作強度、所述第一互作關系圖與所述第二互作關系圖作為目標細胞分析結果。
58、根據(jù)本公開的一方面,提供了一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)如上所述的細胞通訊分析方法。
59、根據(jù)本公開的一方面,提供了一種計算機可讀存儲介質(zhì),所述存儲介質(zhì)存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)如上所述的細胞通訊分析方法。
60、根據(jù)本公開的一方面,提供了一種計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括計算機程序,所述計算機程序被計算機設備的處理器讀取并執(zhí)行,使得該計算機設備執(zhí)行如上所述的細胞通訊分析方法。
61、本公開實施例中的細胞通訊分析方法,獲取目標配受體數(shù)據(jù)集,目標配受體數(shù)據(jù)集為對多個預設配受體數(shù)據(jù)集與自建配受體數(shù)據(jù)集進行整合得到的配受體數(shù)據(jù)集,自建配受體數(shù)據(jù)集為基于多個基因庫中的潛在配受體基因構建的配受體數(shù)據(jù)集;基于目標配受體數(shù)據(jù)集與待分析細胞群的空間轉(zhuǎn)錄數(shù)據(jù)及細胞注釋數(shù)據(jù)生成多個細胞通訊分析應用對應的細胞通訊分析數(shù)據(jù),并將每一細胞通訊分析數(shù)據(jù)輸入至相應的細胞通訊分析應用中進行細胞通訊分析,得到多個子分析結果;對多個子分析結果進行并集處理,得到融合分析結果;基于多個子分析結果與融合分析結果,計算融合分析結果的第一可信度分數(shù)與目標配受體數(shù)據(jù)集中每一配受體對的第二可信度分數(shù);當?shù)谝豢尚哦确謹?shù)大于預設閾值時,基于第二可信度分數(shù)篩選出目標配受體對,并根據(jù)目標配受體對從融合分析結果中確定目標細胞分析結果。
62、以此,本公開實施例的細胞通訊分析方法中,目標配受體數(shù)據(jù)集中既包括預設配受體數(shù)據(jù)集中的配受體對,也包括從基因庫中獲得的潛在配受體對。因此,目標配受體數(shù)據(jù)集中的配受體對較為全面?;谶@個目標配受體數(shù)據(jù)集進行細胞通訊分析可以提高分析結果的可靠性。多個細胞通訊分析應用根據(jù)對應的細胞通訊分析數(shù)據(jù)進行細胞通訊分析,得到多個子分析結果。將多個子分析結果取并集進行整合后得到融合分析結果。利用多個子分析結果與融合分析結果來計算融合分析結果的第一可信度分數(shù),因此,第一可信度分數(shù)越高,就表示融合分析結果得到了越多細胞通訊分析應用的支持,融合分析結果的可靠性越高。因此,通過設定預設閾值來判定融合分析結果的可靠性。細胞通訊分析結果中對于目標配受體集中配受體對的分析是十分重要的。因此,利用多個子分析結果與融合分析結果來計算每一配受體對的第二可信度分數(shù)。第二可信度分數(shù)越高也就表示了配受體對得到越多細胞通訊分析應用的支持,配受體對的可靠性越高。因此,利用第二可信度分數(shù)篩選出可靠的配受體對作為目標配受體對,并根據(jù)目標配受體從融合分析結果中確定目標細胞分析結果?;诖?,目標細胞分析結果是基于對融合分析結果的可靠性與配受體對的可靠性的雙重篩選得到的。因此,利用本公開實施例的細胞通訊分析方法得到的目標細胞分析結果的可靠性較高。
63、本公開的其他特征和優(yōu)點將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實施本公開而了解。本公開的目的和其他優(yōu)點可通過在說明書、權利要求書以及附圖中所特別指出的結構來實現(xiàn)和獲得。