4일차
From Biocourse
생물정보학 프로그래밍 특훈 4일차22. GenBank format file (아미노산 서열의 파일) 을 open 하여 첫 번째 라인을 읽어 title에 저장하고 한 line 씩 읽으면서 'ORIGIN'이라는 단어로 시작되는 행을 찾아, 그 다음 행부터 끝까지 읽어 'seq'라는 변수에 저장한다.
23. 문제 22번 상태에서 seq의 문자중 알파벳만 저장하여 화면에 출력한다. 숫자, 공백, 모든 기호는 제외한다.
ex) 1 RWNGCDPPRK NDC // (저장) RWNGCDPPRKNDC (*) 알파벳만 seq1에 저장한다. 문제 14번 코드를 그대로 사용
24. 문제 23번에서 seq내 저장된 내용을 formatting 하여 출력한다. 만약, 아미노산이 60개라면 (10개+개행문자)*6 줄이 된다.
25. user interface 입력파일 지정, 출력파일 지정하는 부분 만든다. 아래의 내용이 동작되도록 한다.
Enter input file: Enter ouput file:
Option-1) read a FASTA format DNA sequence file and make a reverse sequence file & print
Option-2) Option-1에서 reverse대신 reverse complement sequence 만든다. A->T, T->A, G->C, C->G, N->N으로 변환
Option-3) GenBank format file을 FASTA format으로 conversion한다. print는 ">"으로 시작
25-1.GenBank 파일 하나를 읽어들 인 다음 아래와 같은 포맷으로 변환시키시오.
출력> Title : Organism : mRNA :
25-2.여러 개의 파일을 사용하여 25-1번을 수행하시오.
