Jak przekonwertować plik TXT na FASTA

Krok 1

Otwórz plik tekstowy z sekwencją białek, które chcesz edytować w programie do edycji tekstu, takim jak Notatnik.

Krok 2

Edytuj lub dodaj linię opisu, aby postępować zgodnie z formatem FASTA. Na przykład:> gi | 129295 | sp | P01013 | OVAX_CHICK GENE X PROTEIN (OVALBUMIN-RELATED) jest prawidłową linią opisową FASTA. Ta linia zawiera unikalny opis sekwencji następujących po sobie danych. Format FASTA wymaga użycia symbolu większego niż (>), aby program mógł zidentyfikować unikalną informację opisową i uniknąć przetwarzania opisu jako linii danych sekwencji białka.

Krok 3

Naciśnij "Enter", aby wstawić podziałkę linii po edycji linii tekstu.

Krok 4

Edytuj lub dodaj format linii danych sekwencji białka, aby dostosować ją do standardowych kodów IUB / IUPAC. Standard IUB / IUPAC wykorzystuje litery alfabetu do reprezentowania akceptowalnych kodów lub sekwencji zapytań dla aminokwasów lub kwasów nukleinowych w formacie FASTA. Na przykład QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE reprezentuje prawidłową linię sekwencji danych, ponieważ zaczyna się od litery "Q", reprezentującej glutaminę, a kończy się literą "E", która reprezentuje glutaminian.

Krok 5

Dodaj kolejne wiersze sekwencji danych, edytuj istniejące lub dodaj podziały wierszy po 80 znakach, jeśli to konieczne. Dodanie standardów linii i podziałów linii do strumienia danych FASTA zapewnia, że ​​program postępuje zgodnie z instrukcjami dotyczącymi glutaminy, glutaminianu i innych kodów literowych. Litery w standardzie IUB / IUPAC są po prostu instrukcjami dla programu, który przetwarza dane w formacie FASTA.

Krok 6

Kliknij "Plik", wybierz i kliknij przycisk "Zapisz". Twój plik TXT jest już w formacie FASTA.