R语言行筛选的方法之filter函数详解

下面介绍一下r语言中行筛选的方法，主要介绍filter函数

1. 数据

这里，使用asreml分析中的blup值为例，相关的模型为：

m1 = asreml(phen ~ g , random = ~ vm(progeny,ainv) + vm(dam,ainv) + vm(progeny,dinv),
            workspace = "10gb", residual = ~ idv(units),data = dat)
summary(m1)$varcomp

计算育种值：

blup = coef(m1)$random 
head(blup)
tail(blup)

数据特点：

没有id列，rownames的前缀为类型，比如vm(progeny, ainv)为加性效应的blup值，vm(progeny,dinv)为显性效应的blup值。

提取目的：

提取加性效应的blup值，显性效应的blup值和母体效应的blup
值提取blup值大于0.1的个体

2. 生成id列和类型

首先，把rowname提取，作为新的一列

blup1 = blup %>% as.data.frame() %>% mutate(id = rownames(.))
head(blup1)

根据下划线，进行分列：

blup2 = blup1 %>% separate(id,into = c("type","iid"),sep = "_",remove = f)
head(blup2)

3. 提取effect大于0.1的行

re1 = blup2 %>% filter(effect>0.1)
head(re1)

4. 提取加性效应，且effect小于0的行

这里，条件之间，默认是并集，如果想用交集，用|间隔。

re2 = blup2 %>% filter(type == "vm(progeny, ainv)",effect <0)
head(re2)

5. 根据部分行名删选

select函数，可以根据开头，中间，结尾，进行列的删选。

filter结合其它函数，也可以进行行的筛选。

如果想对id中，包含ainv的行，进行筛选，可以这样操作：

re3 = blup2 %>% filter(str_detect(id,"ainv")) %>% arrange(-effect)
head(re3)

注意，这里str_detect的pattern是正则表达式。如果直接用原始的字符：

re3 = blup2 %>% filter(str_detect(id,"vm(progeny, ainv)")) %>% arrange(-effect)
head(re3)

可以看到，报错，如果想要支持，需要对括号用两个反斜线进行转义。

转义后的代码：

re3 = blup2 %>% filter(str_detect(id,"vm\\(progeny, ainv\\)")) %>% arrange(-effect)
head(re3)

6. 固定字符特征进行行筛选

str_detect没有fixed = t的选项，如果想固定字符匹配，可以用fixed()函数：

re3 = blup2 %>% filter(str_detect(id,fixed("vm(progeny, ainv)"))) %>% arrange(-effect)
head(re3)

总结

到此这篇关于r语言行筛选的方法之filter函数详解的文章就介绍到这了,更多相关r语言行筛选filter函数内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

《R语言行筛选的方法之filter函数详解.doc》

下载本文的Word格式文档，以方便收藏与打印。

R语言行筛选的方法之filter函数详解

1. 数据

2. 生成id列和类型

3. 提取effect大于0.1的行

4. 提取加性效应，且effect小于0的行

5. 根据部分行名删选

6. 固定字符特征进行行筛选

总结

相关推荐

谈谈JavaScript中的函数

使用JavaScript如何提升变量和函数

python中如何获取最大值函数

xpath之string(.)方法

C语言下载minGW地址

利用pytorch自定义CNN网络（四）：损失函数和优化器

python-多继承构造函数声明问题

Python time strftime() 方法的使用