R语言如何选择单因素

发布时间:2022-03-19 09:09:45 作者:iii
来源:亿速云 阅读:130

这篇文章主要介绍“R语言如何选择单因素”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“R语言如何选择单因素”文章能帮助大家解决问题。

这就要采用一些降维的方法,选择单因素中比较重要的一些单因素进行下游分析。方法有很多了,其中采用R包rbsurv进行分析比较多见。

具体操作如下:

# 先看看操作的数据框的结构

> head(exprSet)[0:6, 0:6]
  bcr_patient_barcode time status    NEAT1    MIR205HG LRRC75A_AS1
1        TCGA-2W-A8YY  148      0 37464.39    19.90881    24651.08
2        TCGA-4J-AA1J  226      0 81280.86 30453.54242    12288.18
3        TCGA-BI-A0VR 1505      0 57859.60 23164.53371    22721.61
4        TCGA-BI-A0VS  925      0 39732.40 34618.98183    13592.70
5        TCGA-BI-A20A   72      0 78514.49 29501.88646    14386.92
6        TCGA-C5-A0TN  348      1 47486.18 23953.34249    20335.92

############################################################
# 单因素中显著的基因,进一步鲁棒性筛选(此时选择全部的样本比较好)

sign_gene_expr <-t(exprSet[sign_gene_id])
dim(sign_gene_expr)

# 将矩阵的值转换成numeric
rust_test<-matrix(as.numeric(unlist(sign_gene_expr)),nrow=nrow(sign_gene_expr))
row.names(rust_test) <- row.names(sign_gene_expr)
time <- exprSet$time
status <- exprSet$status
fit <-rbsurv(time=time, status=status, x=rust_test, method="efron", max.n.genes=30, n.iter = 10,n.fold = 3,gene.ID =row.names(rust_test))

# 鲁棒性分析结果 
> fit$model
    Seq Order           Gene nloglik    AIC Selected
0     1     0              0  269.17 538.35         
110   1     1     AC092614.2  261.86 525.71 *       
2     1     2  RP11_415F23.3  256.66 517.32 *       
3     1     3  RP11_395A13.2  254.47 514.95 *       
4     1     4    RP4_728D4.2  252.83 513.66 *       
5     1     5        DBH_AS1  252.04 514.07 *       
6     1     6  RP11_731C17.2  247.11 506.22 *       
7     1     7   RP11_621L6.3  243.34 500.68 *       
8     1     8  RP11_415F23.4  243.21 502.41 *       
9     1     9 RP11_147L13.15  243.00 504.00 *       
10    1    10  RP11_753H16.5  240.87 501.75 *       
11    1    11   RP11_80H18.4  239.85 501.70 *       
12    1    12    AF064858.10  238.96 501.93 *       
13    1    13  RP11_261C10.5  238.50 503.00 *       
14    1    14  RP11_960L18.1  237.01 502.01 *       
15    1    15     AC093110.3  237.00 503.99 *       
16    1    16 RP11_1096G20.5  235.03 502.05 *       
17    1    17     STARD4_AS1  230.52 495.04 *       
18    1    18  RP11_166D19.1  229.46 494.91 *       
19    1    19    RP11_12M5.4  226.71 491.41 *       
20    1    20     AC005592.2  225.17 490.35 *       
21    1    21   RP11_33N14.5  220.06 482.12 *       
22    1    22  RP11_713N11.6  219.32 482.64 *       
23    1    23   RP11_823E8.3  219.26 484.51 *       
24    1    24  RP3_508I15.21  217.63 483.25 *       
25    1    25     DNAJC9_AS1  214.43 478.87 *       
26    1    26   RP11_452L6.8  212.73 477.45 *       
27    1    27      BOLA3_AS1  212.39 478.78 *       
28    1    28    RP4_794I6.4  211.21 478.41 *       
29    1    29     AC005523.3  209.16 476.32 *

可见30个因素都比较显著, 可以选择这些比较显著的单因素,进行下游的多因素分析。

关于“R语言如何选择单因素”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识,可以关注亿速云行业资讯频道,小编每天都会为大家更新不同的知识点。

推荐阅读:
  1. R语言怎么选择特定的行
  2. r语言和python应该选择哪个

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

r语言

上一篇:Pycharm怎么远程调试和MySQL数据库授权问题

下一篇:TCGAbiolinks错误Error in value[[3L]](cond)怎么解决

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》