Jak przekonwertować plik TXT na FASTA
Krok 1
Otwórz plik tekstowy z sekwencją białek, które chcesz edytować w programie do edycji tekstu, takim jak Notatnik.
Krok 2
Edytuj lub dodaj linię opisu, aby postępować zgodnie z formatem FASTA. Na przykład:> gi | 129295 | sp | P01013 | OVAX_CHICK GENE X PROTEIN (OVALBUMIN-RELATED) jest prawidłową linią opisową FASTA. Ta linia zawiera unikalny opis sekwencji następujących po sobie danych. Format FASTA wymaga użycia symbolu większego niż (>), aby program mógł zidentyfikować unikalną informację opisową i uniknąć przetwarzania opisu jako linii danych sekwencji białka.
Krok 3
Naciśnij "Enter", aby wstawić podziałkę linii po edycji linii tekstu.
Krok 4
Edytuj lub dodaj format linii danych sekwencji białka, aby dostosować ją do standardowych kodów IUB / IUPAC. Standard IUB / IUPAC wykorzystuje litery alfabetu do reprezentowania akceptowalnych kodów lub sekwencji zapytań dla aminokwasów lub kwasów nukleinowych w formacie FASTA. Na przykład QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE reprezentuje prawidłową linię sekwencji danych, ponieważ zaczyna się od litery "Q", reprezentującej glutaminę, a kończy się literą "E", która reprezentuje glutaminian.
Krok 5
Dodaj kolejne wiersze sekwencji danych, edytuj istniejące lub dodaj podziały wierszy po 80 znakach, jeśli to konieczne. Dodanie standardów linii i podziałów linii do strumienia danych FASTA zapewnia, że program postępuje zgodnie z instrukcjami dotyczącymi glutaminy, glutaminianu i innych kodów literowych. Litery w standardzie IUB / IUPAC są po prostu instrukcjami dla programu, który przetwarza dane w formacie FASTA.
Krok 6
Kliknij "Plik", wybierz i kliknij przycisk "Zapisz". Twój plik TXT jest już w formacie FASTA.