Hoe een TXT-bestand naar FASTA te converteren

Klinische studies worden uitgevoerd om eiwitsequentiegegevens te analyseren en behandelingen voor ziekten te vinden. Eiwitsequentiegegevens worden in het FASTA-formaat (fast-all) geplaatst, zodat softwareprogramma's begrijpen hoe de gegevensreeks moet worden verwerkt. Het FASTA-formaat heeft maximaal 80 tekens per sequentiegegevensregel en maakt gebruik van de IUB/IUPAC-codestandaard (International Union of Biochemistry/International Union of Pure and Applied Chemistry). Het converteren van een TXT-bestand (platte tekst) naar FASTA-indeling omvat het bewerken of toevoegen van FASTA-geformatteerde sequentiegegevens aan een bestaand tekstbestand met eiwitsequentiegegevenslijnen. Teksteditorprogramma's zoals Kladblok maken dit eenvoudig te doen.

Open het tekstbestand met de eiwitsequentie dat u wilt bewerken in een tekstbewerkingsprogramma zoals Kladblok.

Bewerk of voeg de beschrijvingsregel toe om het FASTA-formaat te volgen. >gi|129295|sp|P01013|OVAX_CHICK GENE X PROTEIN (OVALBUMIN-RELATED) is bijvoorbeeld een geldige FASTA-beschrijvingsregel. Deze regel geeft een unieke beschrijving voor de sequentiegegevensregels die volgen. Het FASTA-formaat vereist het gebruik van het groter-dan-symbool (>), zodat het softwareprogramma de unieke beschrijvende informatie kan identificeren en de verwerking van de beschrijving als een sequentielijn voor eiwitgegevens kan vermijden.

Druk op de "Enter"-toets om een ​​regeleinde in te voegen zodra de beschrijvingsregel is bewerkt.

Bewerk of voeg het formaat van de eiwitsequentiegegevenslijn toe om te voldoen aan de IUB/IUPAC-standaardcodes. De IUB/IUPAC-standaard gebruikt de letters van het alfabet om aanvaardbare codes of zoeksequenties voor aminozuren of nucleïnezuren in het FASTA-formaat weer te geven. QIKDLLVSSSTDLDTTLVLVNAIYFKGMWKTAFNAEDTREMPFHVTKQESKPVQMMCMNNSFNVATLPAE staat bijvoorbeeld voor één regel met geldige sequentiegegevens, aangezien deze begint met de letter "Q", die glutamine voorstelt, en eindigt met de letter "E", die glutamaat voorstelt.

Voeg indien nodig meer reeksgegevensregels toe, bewerk bestaande reeksgegevensregels of voeg regeleinden toe na 80 tekens. Door zich te houden aan de FASTA-reeksgegevenslijnstandaarden en regeleinden, zorgt het ervoor dat het programma de instructies volgt met betrekking tot glutamine, glutamaat en andere lettercodes. De letters in de IUB/IUPAC-standaard zijn gewoon instructies voor het softwareprogramma dat FASTA-geformatteerde gegevens verwerkt.

Klik op "Bestand", selecteer "Opslaan" en klik vervolgens op de knop "Opslaan". Uw TXT-bestand is nu in FASTA-indeling.