今天凡太百科給各位分享gff的知識,其中也會對國防服役章進(jìn)行解釋,如果能碰巧解決你現(xiàn)在面臨的問題,別忘了關(guān)注本站,現(xiàn)在開始吧!

GTF與GFF
一、格式介紹
(一)gtf 文件。GTF 為General Transfer Format縮寫,跟 GFF2格式類似。相信大家做轉(zhuǎn)錄組分析時候經(jīng)常會看到Cufflinks或者Stringtie軟件對轉(zhuǎn)錄組進(jìn)行定量與組裝會時產(chǎn)生一個gtf文件,里面包含的信息如下:
每列信息的含義如下:
seqname ?- 序列的ID,可以是染色體的ID也可以是Scaffold或者Contig的ID。
source ?- 產(chǎn)生此文件的軟件,如Stringtie產(chǎn)生的則為Stringtie,CUfflinks產(chǎn)生的則為Cufflinks,不知道的使用點(diǎn) “.” 表示。
feature ?- 后面start和end之間區(qū)域代表的特征,如果此區(qū)域是基因,則此處為gene,如果是外顯子,則為exon,如果是轉(zhuǎn)錄本,則為transcript,如果是非編碼RNA則為lncRNA,如果是重復(fù)序列,則為TE,等等,主要表明這一塊區(qū)域的特征。
start ?-上述feature的在序列上的起始位置。
end ?- 上述feature的在序列上的終止位置。
score ?- 一個浮點(diǎn)數(shù)值,也可以為點(diǎn) “.” 。有值的時候代表上述feature的可靠
性。因?yàn)闊o論是gene還是mRNA,都是基于預(yù)測差生的,因而必然會有一個值來衡量預(yù)測準(zhǔn)確性。
strand ?- + (forward)或者 - (reverse),代表上述feature是位于正鏈還是負(fù)鏈上。
frame ?- 內(nèi)含子相位,只能為'0', '1' or '2',或者為點(diǎn) “.”。 '0' 代表feature起始堿基為三聯(lián)體密碼子的第一個堿基, '1' 代表三聯(lián)體密碼子的第2個堿基, 2代表第3個堿基。
attribute ?-備注列。主要備注該feature的一些信息,常見的是gene或者transcript等的ID信息以及FPKM值等,多個備注信息之間通常用分號分隔。
(二)gff 格式。為general feature format縮寫,目前采用的是version 3,即我們常說的gff3文件。該文件常用來對基因組進(jìn)行注釋,表示基因,外顯子,CDS,UTR等在基因組上的位置。眾多基因預(yù)測軟件如Glean,EVM,AUGUSTUS等會產(chǎn)生此格式文件。
與gtf文件不同之處只是在第9列。此列格式為“標(biāo)簽=值”(tag=value),標(biāo)簽與值之間用“=”,不同的標(biāo)簽之間用“;”隔開,一個標(biāo)簽可以有多個值,不同值用“,”分割。
二、gtf與gff轉(zhuǎn)換以及對GFF文件進(jìn)行過濾。
常采用的軟件是gffread,為Cufflinks自帶的一個程序,他不僅可以實(shí)現(xiàn)GTF與GFF的互相轉(zhuǎn)換,而且還可以對GFF文件進(jìn)行過濾處理。以下是gffread的幫助信息:
Usage:
gffread input_gff [-g genomic_seqs_fasta | dir][-s seq_info.fsize]?
?[-o outfile.gff] [-t tname] [-r [[strand]chr:]start..end [-R]]
?[-CTVNJMKQAFGUBHZWTOLE] [-w exons.fa] [-x cds.fa] [-y tr_cds.fa]
?[-i maxintron]?
input_gffmatch為一個GFF/GTF文件,必填的一個文件
常用參數(shù)介紹:
?-g ?序列文件,即GFF/GTF文件第一列ID對應(yīng)的序列文件。
?-i ?丟棄掉內(nèi)含子大于的轉(zhuǎn)錄本(mRNA/transcript)
?-r ?起始和終止位置,填寫示例100.10000即為輸出與100到10000有重疊的所有轉(zhuǎn)錄組,也可以限制序列ID及鏈,填寫示例:+Chr1:100..10000。
?-R ?丟棄掉此范圍的轉(zhuǎn)錄本,與-r相反。
?-U ?丟棄掉 single-exon的轉(zhuǎn)錄本
?-C ?丟低調(diào)無CDS的轉(zhuǎn)錄本。
?-V ?丟棄掉含有移碼突變的轉(zhuǎn)錄本。
?-H ?如果使用了-V,則重新檢查并調(diào)整內(nèi)含子相位,避免由于翻譯起始位點(diǎn)選擇的位置不對導(dǎo)致移碼突變的產(chǎn)生。
?-B 如果使用了-V, 對于單外顯子基因,則重新檢查相反的鏈,是否存在移碼突變。
?-N ?丟棄掉多外顯子基因剪接位點(diǎn)不是常見的 GT-AG, GC-AG or AT-AC序列。
?-J ?丟棄掉沒有起始密碼子或者終止密碼子的轉(zhuǎn)錄本,僅保留有完整編碼框的轉(zhuǎn)錄本。
?--no-pseudo:過濾掉含有 'pseudo' 的注釋信息
?-M/--merge : 合并完全相同的或者存在包含關(guān)系的轉(zhuǎn)錄本。
-d:使用 -M ,將合并信息輸出到文件中
?--cluster-only: 類似于 --merge 但是不合并轉(zhuǎn)錄本
-K ?對于-M 選項(xiàng):also collapse shorter, fully contained transcripts
? ? ? with fewer introns than the container
-Q?對于-M 選項(xiàng):移除包含關(guān)系的轉(zhuǎn)錄本的限制條件:多外顯子轉(zhuǎn)錄本將會合并,如果他們內(nèi)含子位置完全一樣,單外顯子轉(zhuǎn)錄本只需要有80%一樣即可合并。
?--force-exons: ?使GFF features的最小層級為exon
?-E 對于重復(fù)的 ID或者?GFF/GTF 其他潛在的格式問題給出警告信息。
-Z ?將內(nèi)含子小于4 bp的鄰近的兩個外顯子合并為一個。
?-w ?輸出每個轉(zhuǎn)錄本的外顯子序列
?-x ?輸出CDS序列
?-W ?對于 -w 和 -x 選項(xiàng),輸出外顯子位置坐標(biāo)到FASTA序列的ID中
?-y ?輸出蛋白質(zhì)序列
?-L ?將Ensembl GTF 轉(zhuǎn)換為 GFF3 conversion (implies -F; should be used with -m)
?-o ? 輸出"filtered" 后的GFF文件 。
-T ?-o 參數(shù)將輸出 GTF格式。
示例命令:
1.GFF轉(zhuǎn)換GTF
gffread input.gff3 -T -o out.gtf‘
2.GTF轉(zhuǎn)換GFF3
gffread input.gtf -o out.gff3
3.根據(jù)GFF或者GTF提取蛋白質(zhì),CDS和外顯子序列
gffread gene.gff3 -g genome.fa -x cds.fa -y pep.fa -w cdna.fa
三、GFF文件比較
主要采用gffcompare(),其主要具有三個功能:1)評估Cufflinks/Stringtie等轉(zhuǎn)錄本組裝軟件的準(zhǔn)確性;2)合并多個GFF/GTF中重疊的部分(多個樣本組裝結(jié)果的合并)3)可以對一個或多個GTF/GFF文件的注釋相對于參考的GTF/GFF文件進(jìn)行分類(with "class codes" assigned to transcripts as per their relationship with the matching/overlapping reference transcript),如Pacbio預(yù)測的GTF與參考GFF比較,修正和評估參考的注釋結(jié)果。
Usage:
gffcompare [-r reference_mrna.gtf [-R]] [-G] [-T] [-V] [-s seq_path]
? ? [-o outprefix] [-p cprefix]?
? ? {-i input_gtf_list | input1.gtf [input2.gtf .. inputN.gtf]}
常用參數(shù)介紹:
-i ?多個GTF 文件時,使用此選項(xiàng)較方便,將多個GTF文件寫在一個文件中,通過此選項(xiàng)傳入即可。
-r 參考的 GTF/GFF文件
-R ?針對的是-r參數(shù),僅考慮參考與任何輸入的注釋文件有重疊的 。
-Q 針對的是-r參數(shù),僅考慮輸入的注釋文件與任何參考有重疊的 。 ? ?(警告,這將丟棄所有的新的注釋位點(diǎn))
-M 丟棄(忽略)掉輸入的注釋文件和參考注釋文件中單外顯子轉(zhuǎn)錄本
-N 丟棄(忽略)掉參考注釋文件中單外顯子轉(zhuǎn)錄本
-s 基因組序列文件
-e 當(dāng)評估外顯子準(zhǔn)確性時,離參考末端外顯子最遠(yuǎn)的距離(默認(rèn)100)
-d 轉(zhuǎn)錄本聚類時起始位點(diǎn)相差的最大距離 (默認(rèn)100)
-C ?在.combined.gtf文件中包含 "contained" 類型的轉(zhuǎn)錄本
-F 如果僅是3’端不同,則不丟棄輸入的GTF文件中被參考包含的冗余的轉(zhuǎn)錄本注釋信息。
-G 不丟棄輸入的GTF文件中被參考包含的冗余的轉(zhuǎn)錄本注釋信息,主要是鑒于可變剪接。
-T 對于每一個輸入文件不產(chǎn)生 .tmap 和 .refmap文件
-V 給出 GFF 解析時的警告信息
參考命令:
gffcompare ?-r refChr.gff3 ?-R -G -o combine input.gtf
輸出結(jié)果中有以下幾個文件:
combine.combined.gtf
combine.loci
combine.stats
combine.tracking
其中在combine.combined.gtf中有一個class_code 代表輸入的注釋文件與參考注釋文件相似性信息,具體如下:
#Transfrag class codes
PriorityCodeDescription
1=Complete match of intron chain
2cContained
3jPotentially novel isoform (fragment): at least one splice junction is shared with a reference transcript
4eSingle exon transfrag overlapping a reference exon and at least 10 bp of a reference intron, indicating a possible pre-mRNA fragment.
5iA transfrag falling entirely within a reference intron
6oGeneric exonic overlap with a reference transcript
7pPossible polymerase run-on fragment (within 2Kbases of a reference transcript)
8rRepeat. Currently determined by looking at the soft-masked reference sequence and applied to transcripts where at least 50% of the bases are lower case
9uUnknown, intergenic transcript
10xExonic overlap with reference on the opposite strand
11sAn intron of the transfrag overlaps a reference intron on the opposite strand (likely due to read mapping errors)
12.(.tracking file only, indicates multiple classifications)
由于輸出文件幾乎跟cuffcompare格式幾乎是一樣的,
更詳細(xì)輸出介紹參見。
轉(zhuǎn)自:
女生說GFF是什么意思?
gff的意思是"增益平坦濾波器、腎小球?yàn)V過分?jǐn)?shù)",其次還有"明貴美加"的意思,在線發(fā)音:[gff],gff在英語中經(jīng)常以名詞形式出現(xiàn),在《新英漢漢英詞典》中,共找到76個與gff相關(guān)的同義詞和例句。
臺達(dá)變頻器顯示GFF是什么意思?
屬于接地故障,檢查去電機(jī)的線路有無破損接地
原因分析:
接地保護(hù)線路動作,當(dāng)交流電機(jī)驅(qū)動器檢測到輸出端子接地且接地電流大于交流電機(jī)驅(qū)動器額定電流的50%時,需要注意的是,這種保護(hù)是針對交流電機(jī)驅(qū)動器而不是人體的。
故障排除:
1、檢查與電機(jī)的連接是否短路或接地。
2、確定IGBT電源模塊是否損壞。
3、檢查輸出側(cè)接線是否絕緣不良。
擴(kuò)展資料:
臺達(dá)變頻器的常見故障代碼如下:
(1)OC報(bào)警,鍵盤面板LCD顯示:加、減、恒速時過電流。
(2)OLU報(bào)警,鍵盤面板LCD顯示:變頻器過負(fù)載。
(3)OU1報(bào)警,鍵盤面板LCD顯示:加速時過電壓。
(4)LU報(bào)警,鍵盤面板LCD顯示:欠電壓。
(5)EF報(bào)警,鍵盤面板LCD顯示:對地短路故障。G/P9系列變頻器出現(xiàn)此報(bào)警時可能是主板或霍爾元件出現(xiàn)了故障。
(6)Er1報(bào)警,鍵盤面板LCD顯示:存貯器異常。
(7)Er7報(bào)警,鍵盤面板LCD顯示:自整定不良。











