发布时间:2025-07-20
浏览次数:0
[]]
我们的示例项目得到的结果,按照排序如下:
融合名称,连接读取次数,跨越片段数量
FGFR3--TACC3 773 1087
IGL-@-ext--PRAMENP 216 1343
IGL-@--PRAMENP 216 1343
IPO7--LINC02489 186 1724
PPFIA1--TSGA10IP 141 213
RNF121--COBL 125 6
IGL-@-ext--AL121832.3 121 0
IGL-@--AL121832.3 121 0
IGL-@-ext--FLOT2 108 1
IGL-@--FLOT2 108 1
按照排序如下:
IPO7--LINC02489 186 1724
IGL-@-ext--PRAMENP 216 1343
IGL-@--PRAMENP 216 1343
FGFR3--TACC3 773 1087
NFKB2--AC025062.3 82 770
IGL-@-ext--PRAMENP 25 366
IGL-@--PRAMENP 25 366
FOXP1--IGL@-ext 9 345
FOXP1--IGL@-ext 28 345
FOXP1--IGL@-ext 27 345
我们对于FGFR3-TACC3这一融合基因事件颇为熟悉,以它为例,我们可以探讨如何解读这一融合现象;首先,我们需要查阅相关的详细信息。
FGFR3--TACC3 773 1087 ONLY_REF_SPLICE
FGFR3^ENSG00000068078.18 chr4:1806934:+
TACC3^ENSG00000013810.19 chr4:1735731:+
YES_LDAS 33.6089 GT 1.8892 AG 1.9656
这是FusionAnnotator(包含于STAR-Fusion中)提供的注释结果汇总。
["Cosmic","ChimerPub","YOSHIHARA_TCGA","TumorFusionsNAR2018",
"ChimerKB","ChimerSeq","CCLE_StarF2019","TCGA_StarF2019",
"GUO2018CR_TCGA","Klijn_CellLines",禁止对染色体4上的0.05兆碱基区域进行修改。,
地区性调整:符号“+”后跟数字“48117”。]
可以看到4号染色体的两个临近基因的融合
首先IGV可视化
所获得的数据往往需要以图形方式呈现,若我们单独对FGFR3基因进行IGV可视化处理,则:
image-
如果我们单独的IGV可视化TACC3基因如下:
image-
这两个基因的长度相对较长,而我们的NGS测序技术仅能读取至100个碱基对,它们各自的长度都达到几十千碱基。因此,仅凭现有技术无法对融合事件进行观察,我们必须借助更为先进的工具,例如。
然后使用仔细检查
尽管这款工具被誉为star-的专用辅助工具,但其功能并不仅限于对star-融合事件的审查,它还能处理由多种软件生成的融合基因数据,例如:Prada、/GMAP-、STAR-以及其他类似软件(如上述提到的)的结果。之所以它能做到这一点,是因为它对输入数据的要求相当简单,只需提供两个基因之间的融合关系即可。
B3GNT1--NPSR1
ZNF709--DYRK1A
ZNF844--NCBP2
RBX1--HAPLN2
FAM180B--TRIM60
CASP9--ADCYAP1
HS3ST3A1--C1QTNF2
OPTC--AP000347.4
GRIA2--ZW10
运行工具:
使用conda命令,通过指定bioconda通道,安装名为fusion-inspector的软件包。
bin_star=请将路径输入为:'位于用户家目录下的biosoft文件夹中的STAR-2.7.3a子目录,该子目录下的bin文件夹中,Linux_x86_64版本的STAR程序执行文件'。
lib=该路径指向“~/biosoft/starFusion/db/GRCh38_gencode_v31_CTAT_lib_Oct012019.plug-n-play/ctat_genome_lib_build_dir/”,位于生物软件文件夹中。
FusionInspector工具,针对文件SRR2016940_fusionList.txt,进行融合检测操作。
-O SRR2016940
--genome_lib $lib \
将左序列文件存放在路径clean/SRR2016940_1_val_1.fq.gz中,同时将右序列文件保存在路径clean/SRR2016940_2_val_2.fq.gz内。
--out_prefix finspector \
--vis
工具实质上是一个集成的操作流程,其中涉及诸多步骤dnastar 11,尤其是大量采用Perl编写的代码,具体细节不便详述。令人意外的是dnastar 11,最终报告的生成竟然依赖于以.py结尾的脚本。若您未安装位于https://.com//-的该工具,系统将显示错误信息。
cd在用户主目录下的miniconda3虚拟环境中的share文件夹里,位于fusion-inspector-2.2.1-0目录内,有一个名为fusion-reports的子文件夹。
git clone请访问FusionInspector的GitHub页面,获取融合报告的相关信息,链接为:https://github.com/FusionInspector/fusion-reports.git。
pip install igv_reports
在用户的主目录下,位于miniconda3的虚拟环境中,有一个名为share的文件夹,其中包含一个名为fusion-inspector的子文件夹,该子文件夹中存放着版本号为2.2.1-0的fusion-inspector软件,而在该软件的文件夹中,有一个用于创建融合报告的脚本文件,其名称为create_fusion_report.py。
在指定路径下,位于RNA分析工具包Fusion-Inspector的2.2.1版本中,有一个名为fusion_report_html_template的文件夹,其中包含一个名为igvjs_fusion.html的HTML模板文件。
执行操作时,请确保指定了正确的路径,即fusions_json变量应指向位于用户主目录下的fusion文件夹中的FI子文件夹,具体文件名为finspector.fusion_inspector_web.json。
输入文件前缀为finspector,
执行命令:将html_output变量指向的文件路径设置为~/fusion/FI/finspector.fusion_inspector_web.html。
若缺少HTML报告并无大碍,我们可将数据文件导入至IGV中进行可视化展示,此过程需以下四个文件:
finspector.fa : the candidate fusion-gene contigs (if you copy things elsewhere, make sure to als copy the index file finspector.fa.fai)
finspector.bed : the reference gene structure annotations for fusion partners
finspector.junction_reads.bam : alignments of the breakpoint-junction supporting reads.
finspector.spanning_reads.bam : alignments of the breakpoint-spanning paired-end reads.
启动IGV系统即可,当然啦,这时候必须对IGV有所了解才是!
image-如果要批量检验全部样本的star-结果呢
编写自动化批量处理的脚本是必要的。这项任务相当复杂,感觉即便完成了,能理解的人也不多,还是算了吧。必须认真学习Linux,可以参照我在《》中制定的Linux入门六个阶段,通常每个阶段的学习时间至少需要一天以上。
最后友情宣传生信技能树
如有侵权请联系删除!
Copyright © 2023 江苏优软数字科技有限公司 All Rights Reserved.正版sublime text、Codejock、IntelliJ IDEA、sketch、Mestrenova、DNAstar服务提供商
13262879759
微信二维码