Bio.Blast.NCBIStandalone

From Biocourse

Jump to: navigation, search
Bio.Blast.NCBIStandalone

1. 종류
    - module


2. 설명
    - local version Blast 프로그램을 이용할 수 있게 해주는 코드를 제공한다. 


3. Initialize
    - module 은 따로 initialize 하지 않는다.


4. Attribute
   


5. Function

    - blastall(blastcmd, program, database, infile, **keywds)
        : blastall 프로그램을 실행하고 그 결과를 handle 객체로 반환한다. 결과는 일반적인 file handle 과 같은 방법으로 취급할 수 있다.

        - blastcmd
            : string 타입을 지정한다. blastall 프로그램의 경로를 지정한다.

        - program
            : string 타입을 지정한다. Blast 프로그램 중 사용할 종류를 지정한다. (예: 'blastn')

        - database
            : string 타입을 지정한다. Blast alignment 시 사용할 데이터베이스 파일의 경로를 지정한다.
            : 데이터베이스 파일은 formatdb 명령어를 수행한 것이어야 한다.

        - infile
            : string 타입이다. Blast alignment 를 할 파일의 경로를 지정한다.

        - **keywds
            : Blastall 실행 명령문의 적당한 옵션을 Dictionary의 key=value 형식으로 지정한다. 예) align_view = 7
            : 이 인수로 전달될 수 있는 값에 대한 설명은 http://www.ncbi.nlm.nih.gov/BLAST/blastcgihelp.shtml 를 참고할 수 있다.

            - matrix
                : Matrix to use.

            - gap_open
                : Gap open penalty.

            - gap_extend
                : Gap extension penalty.

            - nuc_match
                : Nucleotide match reward.  (BLASTN)

            - nuc_mismatch
                : Nucleotide mismatch penalty.  (BLASTN)

            - query_genetic_code
                : Genetic code for Query.

            - db_genetic_code
                : Genetic code for database.  (TBLAST[NX])

            - gapped
                : Whether to do a gapped alignment. T/F (not for TBLASTX)

            - expectation
                : Expectation value cutoff.

            - wordsize
                : Word size.

            - strands
                : Query strands to search against database.([T]BLAST[NX])

            - keep_hits
                : Number of best hits from a region to keep.

            - xdrop
                : Dropoff value (bits) for gapped alignments.

            - hit_extend
                : Threshold for extending hits.

            - region_length
                : Length of region used to judge hits.

            - db_length
                : Effective database length.

            - search_length
                : Effective length of search space.

            - filter
                : Filter query sequence?  T/F

            - believe_query
                : Believe the query defline.  T/F

            - restrict_gi
                : Restrict search to these GI's.

            - nprocessors
                : Number of processors to use.

            - html
                : Produce HTML output?  T/F

            - descriptions
                : Number of one-line descriptions.

            - alignments
                : Number of alignments.

            - align_view
                : Alignment view.  Integer 0-6.

            - show_gi
                : Show GI's in deflines?  T/F

            - seqalign_file
                : seqalign file to output.