该项目已存档,不再维护。
普拉达
| 概述 | |
| 描述 | 普拉达是分析配对结束RNA-SEQ数据的管道,以产生基因表达值(RPKM)和基因融合候选者。 | 
| 发展信息 | |
| 语 | Python | 
| 当前版本 | 1.1 | 
| 平台 | UNIX(OpenPBS) | 
| 执照 | 麻省理工学院 | 
| 地位 | 存档 | 
| 最近更新时间 | 2013年4月 | 
| 参考 | |
| 引文 | 没有正式出版物 | 
| 帮助和支持 | |
| 接触 | mdacc-bioinfo-it-admin@mdanderson.org. | 
从RNA转录的CDNA逆转的大规模平行测序(RNA喃)逆转录提供了对MRNA的量和组成的精确估计。通过分析RNA-SEQ数据来表征转录组,我们开发了PRADA。普拉达侧重于基因表达估计,监督和无监督的基因融合鉴定的加工和分析,并监督内瘤缺失鉴定。管道生成的BAM文件与用于突变调用的不同工具易于兼容,并获得进一步下游分析的读取计数。
PRADA目前支持6个模块来处理和识别RNASEQ数据的异常:
| 预处理 | :生成对齐和重新校准的BAM文件。 | 
| 融合 | :识别候选基因融合。 | 
| 猜测-FT. | :监督搜索融合成绩单。 | 
| 猜测 - 如果 | :监督搜索沟里重排。 | 
| 同源性 | :在给定的两个基因之间计算同源性。 | 
| 框架 | :预测融合转录物的功能后果 | 
详细说明安装步骤和使用示例的每个模块的使用说明文件。
PRADA以Python编程语言编写,旨在在UNIX或Linux操作系统上的命令行环境中运行。要运行pyprada,下载预编译包并解压缩到首选安装位置。组合基因组和转录组参考文件可供下载:
HG19.
还提供了一个样本FASTQ文件和结果BAM文件示例文件。
下载并提取参考文件后,为参考文件夹中的所有Fasta文件生成索引文件:
[pyprada_dir] /tools/bwa-0.5.7-mh/bwa index-a bwtsw [hg19] / ensembl64.transcriptome.fasta [pyprada_dir] /tools/bwa-0.5.7-mh/bwa index -a bwtsw [hg19]/ sensembl64.transcriptome.formatted.fasta [pyprada_dir] /tools/bwa-0.5.7-mh/bwa index -a bwtsw [hg19] / ensembl64.transcriptome.plus.genome.fasta [pyprada_dir] /tools/bwa-0.5。7-MH / BWA索引-A BWTSW [HG19] / Homo_SAPIENS_ASSEMBLY19.FASTA
    
设置配置文件(ref.txt):
#reference文件compdb_fasta [hg19_ref] / ensembl64.transcriptome.plus.genome.fasta compdb_fai [hg19_ref] / sensembl64.transcriptome.plus.genome.fasta.fai compdb_map [hg19_ref] / ensembl64.transcriptome.plus.genome.map genome_fasta [hg19_ref] / homo_sapiens_assembly19.fasta genome_gtf [hg19_ref] / homo_sapiens.grch37.64.gtf dbsnp_vcf [hg19_ref] /dbsnp_135.b37.vcf select_tx [hg19_ref] / sembl64.selected.transcripts feature_file [hg19_ref] / ensembl64.canonical.gene.exons。Tab.txt tx_seq_file [hg19_ref] / ensembl64.transcriptome.fasta ref_anno [hg19_ref] / ensembl64.trancriptome.annotations ref_map [hg19_ref] / ensembl64.transcriptome.formatted.map ref_fasta [hg19_ref] /ensembl64.transcriptome.bromatted.fasta cds_file [hg19_ref] / ensembl.hg19.cds.txt txcat_file [hg19_ref] / ensembl64_primary_transcript.txt #preprocess步骤参数pbs_queue long #queue name,用于预处理模块pbs_email userid@mdanderson.org #email用于通知psitications_n_threads 24 #number使用的核心在对齐A.重新校准