你好,欢迎进入江苏优软数字科技有限公司官网!

诚信、勤奋、创新、卓越

友好定价、专业客服支持、正版软件一站式服务提供

13262879759

工作日:9:00-22:00

dnastar 11 生信技能树多次介绍的star-fusion软件,结果咋理解?

发布时间:2025-07-20

浏览次数:0

[]]

我们的示例项目得到的结果,按照排序如下:

融合名称,连接读取次数,跨越片段数量
FGFR3--TACC3    773 1087
IGL-@-ext--PRAMENP    216 1343
IGL-@--PRAMENP    216 1343
IPO7--LINC02489    186 1724
PPFIA1--TSGA10IP    141 213
RNF121--COBL    125 6
IGL-@-ext--AL121832.3    121 0
IGL-@--AL121832.3    121 0
IGL-@-ext--FLOT2    108 1
IGL-@--FLOT2    108 1

按照排序如下:

IPO7--LINC02489    186 1724
IGL-@-ext--PRAMENP    216 1343
IGL-@--PRAMENP    216 1343
FGFR3--TACC3    773 1087
NFKB2--AC025062.3    82  770
IGL-@-ext--PRAMENP    25  366
IGL-@--PRAMENP    25  366
FOXP1--IGL@-ext    9   345
FOXP1--IGL@-ext    28  345
FOXP1--IGL@-ext    27  345

我们对于FGFR3-TACC3这一融合基因事件颇为熟悉,以它为例,我们可以探讨如何解读这一融合现象;首先,我们需要查阅相关的详细信息。

FGFR3--TACC3    773 1087    ONLY_REF_SPLICE 
FGFR3^ENSG00000068078.18    chr4:1806934:+  
TACC3^ENSG00000013810.19    chr4:1735731:+  
YES_LDAS    33.6089 GT  1.8892  AG  1.9656  
这是FusionAnnotator(包含于STAR-Fusion中)提供的注释结果汇总。
["Cosmic","ChimerPub","YOSHIHARA_TCGA","TumorFusionsNAR2018",
"ChimerKB","ChimerSeq","CCLE_StarF2019","TCGA_StarF2019",
"GUO2018CR_TCGA","Klijn_CellLines",禁止对染色体4上的0.05兆碱基区域进行修改。,
地区性调整:符号“+”后跟数字“48117”。]

可以看到4号染色体的两个临近基因的融合

首先IGV可视化

所获得的数据往往需要以图形方式呈现,若我们单独对FGFR3基因进行IGV可视化处理,则:

image-

如果我们单独的IGV可视化TACC3基因如下:

image-

star-fusion RNA-seq 融合基因分析 _ FusionInspector 工具应用 _dnastar 11

这两个基因的长度相对较长,而我们的NGS测序技术仅能读取至100个碱基对,它们各自的长度都达到几十千碱基。因此,仅凭现有技术无法对融合事件进行观察,我们必须借助更为先进的工具,例如。

然后使用仔细检查

尽管这款工具被誉为star-的专用辅助工具,但其功能并不仅限于对star-融合事件的审查,它还能处理由多种软件生成的融合基因数据,例如:Prada、/GMAP-、STAR-以及其他类似软件(如上述提到的)的结果。之所以它能做到这一点,是因为它对输入数据的要求相当简单,只需提供两个基因之间的融合关系即可。

B3GNT1--NPSR1
ZNF709--DYRK1A
ZNF844--NCBP2
RBX1--HAPLN2
FAM180B--TRIM60
CASP9--ADCYAP1
HS3ST3A1--C1QTNF2
OPTC--AP000347.4
GRIA2--ZW10

运行工具:

使用conda命令,通过指定bioconda通道,安装名为fusion-inspector的软件包。

bin_star=请将路径输入为:'位于用户家目录下的biosoft文件夹中的STAR-2.7.3a子目录,该子目录下的bin文件夹中,Linux_x86_64版本的STAR程序执行文件'。
lib=该路径指向“~/biosoft/starFusion/db/GRCh38_gencode_v31_CTAT_lib_Oct012019.plug-n-play/ctat_genome_lib_build_dir/”,位于生物软件文件夹中。
FusionInspector工具,针对文件SRR2016940_fusionList.txt,进行融合检测操作。
-O SRR2016940
--genome_lib $lib  \
将左序列文件存放在路径clean/SRR2016940_1_val_1.fq.gz中,同时将右序列文件保存在路径clean/SRR2016940_2_val_2.fq.gz内。
--out_prefix finspector \
--vis 

工具实质上是一个集成的操作流程,其中涉及诸多步骤dnastar 11,尤其是大量采用Perl编写的代码,具体细节不便详述。令人意外的是dnastar 11,最终报告的生成竟然依赖于以.py结尾的脚本。若您未安装位于https://.com//-的该工具,系统将显示错误信息。

cd在用户主目录下的miniconda3虚拟环境中的share文件夹里,位于fusion-inspector-2.2.1-0目录内,有一个名为fusion-reports的子文件夹。
git clone请访问FusionInspector的GitHub页面,获取融合报告的相关信息,链接为:https://github.com/FusionInspector/fusion-reports.git。
pip install igv_reports

在用户的主目录下,位于miniconda3的虚拟环境中,有一个名为share的文件夹,其中包含一个名为fusion-inspector的子文件夹,该子文件夹中存放着版本号为2.2.1-0的fusion-inspector软件,而在该软件的文件夹中,有一个用于创建融合报告的脚本文件,其名称为create_fusion_report.py。
在指定路径下,位于RNA分析工具包Fusion-Inspector的2.2.1版本中,有一个名为fusion_report_html_template的文件夹,其中包含一个名为igvjs_fusion.html的HTML模板文件。
执行操作时,请确保指定了正确的路径,即fusions_json变量应指向位于用户主目录下的fusion文件夹中的FI子文件夹,具体文件名为finspector.fusion_inspector_web.json。
输入文件前缀为finspector,
执行命令:将html_output变量指向的文件路径设置为~/fusion/FI/finspector.fusion_inspector_web.html。

若缺少HTML报告并无大碍,我们可将数据文件导入至IGV中进行可视化展示,此过程需以下四个文件:

finspector.fa : the candidate fusion-gene contigs (if you copy things elsewheremake sure to als copy the index file finspector.fa.fai)
finspector.bed : the reference gene structure annotations for fusion partners
finspector.junction_reads.bam : alignments of the breakpoint-junction supporting reads.
finspector.spanning_reads.bam : alignments of the breakpoint-spanning paired-end reads.

启动IGV系统即可,当然啦,这时候必须对IGV有所了解才是!

image-如果要批量检验全部样本的star-结果呢

编写自动化批量处理的脚本是必要的。这项任务相当复杂,感觉即便完成了,能理解的人也不多,还是算了吧。必须认真学习Linux,可以参照我在《》中制定的Linux入门六个阶段,通常每个阶段的学习时间至少需要一天以上。

最后友情宣传生信技能树

如有侵权请联系删除!

13262879759

微信二维码