Bio.Align.AlignInfo.SummaryInfo
From Biocourse
Bio.Align.AlignInfo.SummaryInfo1. 종류
- class
2. 설명
- 다중서열정렬 된 정렬결과로부터 다양한 정보를 계산해 주는 기능을 하는 클래스이다.
3. Initialize
- __init__(self, alignment)
- alignment
: Bio.Align.Generic.Alignment 클래스를 상속받아 구현된 클래스들을 인수로 지정할 수 있다.
: 정보를 계산할 대상을 지정한다. Bio.Clustalw.ClustalAlignment 클래스는 Bio.Align.Generic.Alignment 클래스를 상속받았으므로 지정 가능하다.
4. Attribute
5. Method
- dumb_consensus(self, threshold = .7, ambiguous = "X", consensus_alpha = None, require_multiple = 0)
: 정렬된 Sequence 들로 부터 consensus sequence 를 계산해 준다. 반환값은 Bio.Seq.Seq 타입이다.
: 정렬된 Sequence 들의 첫번째 residue들부터 차례로 읽어가면서 그 Residue 열에서 가장 많은 residue 타입을 consensus sequence 의 각 residue 로 지정하게 된다.
- threshold
: float 타입을 설정한다. Residue 열에서 발견빈도가 일정기준 이상이어야 consensus residue 로 지정되는데 그 기준을 설정한다.
: 값이 1 이면 Residue 열의 모든 Residue 가 한가지 타입인 경우이다.
- ambiguous
: string 타입을 설정한다. Residue 열에서 발견빈도가 가장 높은 Residue 타입이 두 종류 이상일 경우 표시할 문자를 지정한다.
- consensus_alpha
: Bio.Alphabet.IUPAC 에 정의되어 있는 속성들 중에서 지정한다. 지정하지 않으면 Method 내에서 자동으로 계산하여 지정한다.
- require_multiple
: Residue 열에서 나머지 Residue 들이 gap 이고 하나만 정상적인 Residue 일 경우 처리방법을 설정한다.
: 0 인 경우는 그 하나의 Residue 를 consensus sequence 의 residue 로 기록한다.
: 다른 값이 지정되면, ambiguous 에 지정된 문자를 consensus sequence 의 residue 로 기록한다.
- pos_specific_score_matrix(self, axis_seq = None, chars_to_ignore = [])
: 정렬된 sequence 들로부터 PSSM 을 계산해준다. 반환값은 Bio.Align.AlignInfo.PSSM 타입이다.
- axis_seq
: string처럼 작용할 수 있는 타입을 지정한다. Bio.Seq.Seq 타입은 string처럼 사용할 수 있으므로 지정가능하다.
- chars_to_ignore
: list 타입이다. PSSM 제작 시 제외할 residue 문자를 지정한다. 기본적으로 gap 문자는 제외된다.
- information_content(self, start = 0, end = None, e_freq_table = None, log_base = 2, chars_to_ignore = [])
: Information content 를 계산해 준다.
- start
: int 타입을 설정한다. 0 이나 양의 정수를 지정한다. 전체 sequence에서 information content 를 계산할 부분의 시작지점 인덱스 값이다.
- end
: int 타입을 설정한다. 0 이나 양의 정수를 지정한다. 전체 sequence에서 information content 를 계산할 부분의 끝지점 인덱스 값이다.
- e_freq_table
: Bio.SubsMat.FreqTable 타입의 값을 지정한다. 이 클래스는 Dictionary처럼 사용할 수 있다.
: 지정되는 값은 {'G' : 0.4, 'C' : 0.4, 'T' : 0.1, 'A' : 0.1} 같은 형식을 띄게 된다.
: frequency table 을 지정한다.
- log_base
: int 타입을 지정한다. log base 로 적당한 값을 지정한다.
- chars_to_ignore
: list 타입을 지정한다. information content 계산 시 계산에서 제외할 residue 문자를 지정한다.
