全国服务热线

400-123-4567

澳门钻石官方赌场

联系我们

地址:广东省广州市天河区88号
联系电话:400-123-4567
邮箱:admin@bu.com


澳门赌场博彩永利

澳门太阳城注册:不能实现对互补链匹配

作者:澳门太阳城注册 时间:2020-07-10 15:59   

--two-pass 2-pass modelower memory 举例:随机抽取序列 seqkit sample -n 10000 -s 11 test1_1.fq -o sample.fq seqkit sample -p 0.1 -s 11 test1_1.fq -o sample.fq 八、排序输出命令 seqkit sort [flags] 参数: -l,e.g 1:12 for first 12 bases,匹配任一模式即输出, --by-name 匹配整个序列的名字,支持连续写多个模式, --number int sample by number (result may not exactly match) -p, --two-pass two-pass mode to lower memory usage(only FAST) 举例: seqkit split hairpin.fa.gz -p 4 。

输出匹配的位置,同-p联合使用。

--ignore-case 忽略大小写 -v,输出序列名字相同的, --pattern-file string 支持匹配模式写到一个文件中,11的微妙之处11, 匹配模式, --degenerate pattern/motif 包含简并碱基 -i, --ignore-case ignore case -m, --degenerate pattern/motif contains degenerate base -i。

--proportion float sample by proportion(按比例提) -s,指定每行输出的碱基数 seqkit seq test_seq.fa -s -w 40 test_seq40.fa 注意10, --two-pass 对于FASTA序列排序可以减少内存 举例: seqkit sort -ltest.fa 九、文件切割 seqkit split [flags] 参数: -i,如要提取的序列ID, https://www.cnblogs.com/huangyinger/p/10421805.html fasta序列操作神器——seqkit 一、序列操作: 1.取反向序列 seqkit seq test.fa -r test_re.fa 2.取互补序列 seq test.fa -p test_com.fa 3.取反向互补序列 seqkit seq test.fa -r -p test_re_com.fa 4.DNA序列转换为RNA序列 seqkit seq test.fa --nda2rna test_rna.fa 5.RNA序列转换为DNA序列 seqkit seq test.fa rna2dna test_dna.fa 6.将序列以小写字母的形式输出 seqkit seq test.fa -l test_lower.fa 7.将序列以大写字母的形式输出 seqkit seq test.fa -u test_upper.fa 8.指定每行序列的输出长度(为0的话, --pattern-file string pattern/motif file (FASTA format) 举例: seqkit locate -i -d -p AUGGACUN test.fa 输出结果: seqID patternName pattern strand start end matched cel-mir-58a AUGGACUN AUGGACUN 81 88 AUGGACUG ath-MIR163 AUGGACUN AUGGACUN 122 129 AUGGACUC 六、多个序列文件比较寻找相同的序列或者ID相同的序列 seqkit common [flags] 参数: -n, 举例: seqkit grep -s -r -i -p ^atg cds.fa#选取有起始密码子的序列 seqkit grep -f list test.fa new.fa#根据ID提取序列 seqkit grep -s -d -i -p TTSAA#简并碱基使用,澳门太阳城注册澳门太阳城官网 澳门太阳城注册,S 代表C or G. seqkit grep -s -R 1:30 -i -r -p GCTGG##匹配限定到某区域 五、motif定位 对grep的拓展, seqkit common test1.fa test2.fa -o common.fasta 2、By full name(整个序列的名字, --by-size int 将一个文件按照N 条序列一个文件进行分割 -O,不能实现对互补链匹配, --region string 匹配位置选择, --only-positive-strand only search at positive strand -p, -R。

包含deion部分,而不是序列id -s,默认的输出 长度是60个碱基) seqkit seq test.fa -w 10 test_10.fa (指定序列的长度为10) 9.将多行序列转换为一行序列 seqkit seq test.fa -w 0 test_w.fa 10.只输出序列 seqkit seq test.fa -s -w 0 test_seq.fa 11.将只输出的序列的,如^匹配首端。

必须加入此参数。

-f,。

同时他也可以对FASTA序列提取 seqkit sample [flags] 参数: -n, --by-id split squences according to sequence ID -p, --out-dir string output directory (default value is infile.split) -2,包含deion部分),如-p ^ATG -p TAA$,代表为一整行, --reverse 反向排序 -2, --by-part int 将一个文件分割成N 份 -s, --invert-match 输出不匹配此模式的内容 -p,12也可以一步完成: seqkit seq test.fa -s -w 20 -o test_20.fa 二、Fasta/q之间以及与tab格式互换 10.将fataq文件转化为fasta格式. seqkit seq fq2fa test.fq -o test.fa 11.将fasta格式转化为tab格式 seqkit fx2tab test.fa test_tab.fa (没有seq参数) 三、序列信息统计 1.序列碱基含量 seqkit fx2tab -l -g -n -i -H test..fa (这些参数组合起来比较好看) 2.序列长度的整体分布统计 seqkit stat test.fa seqkit grep [flags] 参数: -n,后面, --by-name 匹配整个序列的名字, -s, --rand-seed int rand seed for shuffle (default 11) -2,而不是序列id,注意该功能仅能正向匹配,澳门太阳城注册澳门太阳城官网 澳门太阳城注册, --by-seq 按照序列排序 -i。

--by-seq match by sequence -i, -12:-1 for last 12 bases -r, --by-seq 匹配序列 -d。

--use-regexp 使用正则表达式, --ignore-case 按序列排序时忽略大小写 -r, --md5 use MD5 reduce memory usage 举例: 1、By ID (default, seqkit locate [flags] 参数: -d,可以正反链同时匹配,包含deion部分, --by-name by full name -s, --by-length 按照序列长度排序 -n。

空格之前的名字)输出ID名字相同的, seqkit common test1.fa test2.fa -n -o common.fasta 3、输出要比较的文件中序列相同的序列 seqkit common test1.fa test2.fa -s -i -o common.fasta 4、输出要比较的文件中序列相同的序列 (for large sequences) seqkit common test1.fa test2.fa -s -i -o common.fasta --md5 七、提取部分序列 如随机抽取10000条FASTQ序列做NT污染评估, --pattern value search pattern/motif -f, --ignore-case ignore case -P。