Nwlapcug.com


Come convertire un File TXT in FASTA

Come convertire un File TXT in FASTA


Vengono eseguiti studi clinici per analizzare i dati di sequenza della proteina e trovare cure per le malattie. Dati di sequenza della proteina sono messo in formato FASTA (fast-all) affinché programmi software capire come elaborare la sequenza di dati. Il formato FASTA ha fino a 80 caratteri per riga di dati di sequenza e utilizza lo standard di codice IUB/IUPAC (International Union di biochimica/International Union of Pure and Applied Chemistry). Conversione di un file TXT (testo normale) in FASTA formato prevede la modifica o aggiunta di dati di sequenza FASTA-formattato in un file di testo esistente con linee di dati di sequenza della proteina. Programmi di editor di testo come blocco note fare questo semplice da fare.

Istruzioni

1

Aprire il file di testo di sequenza della proteina da modificare in un editor come blocco note di testo.

2

Modificare o aggiungere la riga di descrizione per seguire il formato FASTA. Ad esempio, > gi|129295|sp| P01013| OVAX_CHICK GENE proteina X (OVOALBUMINA-correlati) è una valida linea di descrizione FASTA. Questa riga fornisce una descrizione univoca per le righe di dati di sequenza che seguono. Formato FASTA richiede l'uso del simbolo (>) di maggiore quindi al programma può identificare le informazioni descrittive univoche ed evitare la descrizione come una linea di sequenza di dati della proteina di elaborazione.

3

Premere il tasto "Enter" per inserire un'interruzione di riga dopo la riga di descrizione è modificata.

4

Modificare o aggiungere il formato della linea dati sequenza della proteina per essere conformi ai codici standard IUB/IUPAC. La IUB/IUPAC standard utilizza le lettere dell'alfabeto per rappresentare codici accettabili o sequenze di query per gli amminoacidi o acidi nucleici in formato FASTA. Ad esempio, QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE
rappresenta una riga di dati di sequenza valida dal momento che si inizia con la lettera "Q", che rappresenta la glutammina e finisce con la lettera "E", che rappresenta il glutammato.

5

Aggiungere più righe di dati di sequenza, modificare le linee di dati di sequenza esistenti o aggiungere interruzioni di riga dopo 80 caratteri desiderati. Aderendo agli standard di linea FASTA sequenza dati e interruzioni di riga assicura che il programma segua le istruzioni relazionate al glutamina, glutammato e altri codici di lettera. Le lettere nello standard IUB/IUPAC sono semplicemente le istruzioni del programma software che processi FASTA dati formattati.

6

Fare clic su "File", selezionare "Salva" poi clicca sul pulsante "Salva". Il tuo file TXT è ora in formato FASTA.