Coding and non-coding DNA

From Biocourse

Jump to: navigation, search
 

ACLAME ‐ A Classification of Mobile genetic Elements
URL : http://aclame.ulb.ac.be/

Motivation : MGEs(Mobile genetic Elements)의 기능에 따른

체계적 분류

개발 프로그램 :

데이터 건수 : 31,250 proteins found in 687 MGEs hosted by 279 organisms

국가 : 벨기에

기관 : ULB‐SCMBB

다운로드 :

내용 : ACLAME는 알려진 모든 phage게놈plasmid,transposon을 등의 다양한 정보원으로부터

유동적 유전요소의 수집, 분류를 목적으로 한 ACLAME 프로젝트를 통해 만들어진

데이터베이스이다. ACLAME는 단백질,유전자, 그리고 나아가 더 높은 수준에서 유동적 유전요소의

기능적인 단위의 포괄적 분류를 수립하기 위한 전체 유전체와 유전적 본질에 대한 정보를 제공한다.


Ciliate IES‐MDS database

Motivation :
개발 프로그램 : Apache, Red Hat Linux
데이터 건수 :
국가 : 미국
기관 : 프린스톤 대학
다운로드 :
내용 : 섬모충문의 internal eliminated segments (IESs)와
macronuclear destined segments (MDSs)에 대한 데이터베이스 제공 

 
CORG ‐ A database for COmparative Regulatory Genomics
Motivation : 조절 유전체의 비교를 위해 설립
개발 프로그램 :
데이터 건수 :
국가 : 독일
기관 : MAX PLANCK INSTITUTE FOR MOLECULAR GENETICS
다운로드 :
내용 : CORG는 다양한 개체간의 conserved Non‐coding DNA segments의 비교를 통한
Comparative Regulatory Genomics 관련 정보 제공한다.각적인 상동성을 지닌 유전체
서열 사이에서의 Non‐coding DNA segments는 추정상의 조절인자들에 대한 좋은 지시자가
된다. CORG는 체계적인 접근법을 통해 남자와 마우스, 랫, fugu 그리고 Zebrafish간의
orthologous유전자의 upstream부위에서부터 보존적인 non‐coding 블록을 연구한다.
최근 닭과 침팬치의 연구가 새롭게 추가되었다. 

 
Codon usage Database
Motivation :
개발 프로그램 : Countcodon program
데이터 건수 :
국가 : 일본
기관 : Kazusa DNA Research Institute
내용 : CUTG (Codon Usage Tabulated from GenBank)의 웹 버전으로 Genbank에 들어 있는
DNA 서열을 바탕으로 각 종들의 코돈 사용 빈도를 검색해 준다. 

 
Entrez Gene
Motivation :
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : NCBI
내용 : Entrez Gene는 NCBI의 RefSeq(Reference Sequence)로부터 종별 유전자의 기준이 되는
서열, 유전체 서열과 전사의 진행과정, RNA Splicing기작, 어떤 단백질들이 발현되는지에 대한
체계적인 정보의 검색을 가능하게 한다. 

FREP
Motivation :
개발 프로그램 : Apache, Perl, PostgreSQL
데이터 건수 : 31,396 non‐redundant variant repeats sequences (VRS)
국가 : 일본
기관 : RIKEN
내용 : FREP 데이터베이스는 마우스 cDNA내의 반복서열의 protein‐coding potential과 이들의
분자수준에서의 기능적 관계에 대한 정보를 제공한다. 

 
Islander  
Motivation :
개발 프로그램 : mysql, Perl CGI
데이터 건수 :
국가 : 미국
기관 : Department of Biology, Indiana University
내용 : 원핵생물의 염색체는 종종 site‐specific integrases에 의해 전달되는
islands(prophages, pathogenicity islands 등)를 가지며 이것은 유전체 진화에 있어서
중요한 의미를 지닌다. Islander는 세균 유전체의 genomic islands에 대한 정보를 제공한다. 

 
L1Base
Motivation : 활성을 지니는 것으로 예상되는 LINE‐1에 대한
온라인상의 데이터베이스 제공
개발 프로그램 : L1Xplorer
데이터 건수 :
국가 : 독일
기관 : MAX PLANCK INSTITUTE FOR MOLECULAR GENETICS
다운로드 :
내용 : L1Base는 인간과 설치류의 유전체내에서 활성을 지니는 것으로 예상되는 LINE‐1에 대한
데이터베이스이다. L1Base에는 L1의 동정과 기능적인 주석을 달기 위한 tool을 제공한다.

MethDB
Motivation :
개발 프로그램 : MacOS
데이터 건수 : 5,382 patterns/profiles, 19,905 5mC content data
국가 : 프랑스
기관 :
내용 : MethDB는 DNA내에서 methylated cytosines에 의한 현상에 대한 정보를 제공한다.
데이터베이스는 methylation 자료의 저장에 맞게 설계되었으며 분석에 필요한 tool을 직접
제공하지는 않으며 관련 tools의 사이트를 링크하고 있다.
데이터베이스는 RDBMS Filemaker Pro에 기초를 둔다.

MICAS
Motivation : 원핵생물 Microsatellites 의 손쉬운 검색을 돕는다.
개발 프로그램 :
데이터 건수 :
국가 : 인도
기관 : CDFD(Centre for DNA Fingerprinting and Diagnostics)
다운로드 :
내용 : MICAS는 주어진 염기서열유전체 서열 내에서 사용자가 non‐redundant microsatellites를
쉽게 찾아낼 수 있도록 하기 위해 만들어진 서버이다.
사용자는MICdb(Database of Prokaryotic Microsatellites) 시스템을 통해서 정보를 검색 할 수 있다.

PACRAT  
Motivation : PACRAT system은 유전자 발현의 조절과
진행방향에 대한 연구를 위해 다수의 고세균 유전체로부터
프로모터 부위를 적출하기 위한 목적으로 만들어졌다.
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : 오하이오 주립대학
내용 : PACRAT은 고세균 유전체와 박테리아 유전체의 intergenic sequence에 관련된 정보를
제공한다. User ID를 발급받아야 사용할 수 있다.

PANDIT  
Motivation :
개발 프로그램 :
데이터 건수 : 7,738 families
국가 : 영국
기관 : EMBL‐EBI
내용 : PANDIT(Protein and Associated Nucleotide Domains with Inferred Trees)은
EBI내의 데이터베이스로 다각적인 서열의 배열과 많은 일반적인 단백질 도메인을
포함하는 계통수에 관한 정보를 제공한다.

RECODE
Motivation :
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : Department of Human Genetics, University of Utah
다운로드 :
내용 : 미국립보건원의 보조를 받는 RECODE는 Translational recoding 현상에 대한
데이터베이스이다. RECODE는 또한 유전체 서열 내의 SECIS(selenocysteine이
들어간 서열) 영역의 검증과 일반적인 리보솜의 frameshifting의 시각화와 검증에 대한
프로그램을 제공한다.

NCBI Refseq
Motivation : DNA, RNA, 단백질에 관한 효율적인 정보의 제공을 목적으로 한다.
개발 프로그램 :
데이터 건수 : 단백질 ‐ 1,899,454, Organisms ‐ 3,060
국가 : 미국
기관 : NCBI
내용 : NCBI의 RefSeq(Reference Sequence)는 통합적이면서도 중복이 없는 Genomic DNA,
Transcript(RNA), 그리고 생산물(단백질)에 관한 정보를 제공한다. RefSeq는 BLAST, Entrez,
그리고 NCBI FTP로의 접근을 용이하게 함으로써 정보의 효율성을 높여준다.

S/MARt DB
Motivation :
개발 프로그램 :
데이터 건수 :
국가 : 독일
기관 : Department of Bioinformatics
다운로드 :
내용 : S/MARt DB는 핵기질과 상호작용하는 핵기질 단백질과 scaffold/matrix attached regions
에 관한 정보를 제공한다. S/MARt DB는 효모에서부터 인간에 이르기까지의 정보를 축적하고
있다. S/MARt DB는 다양한 관련 사이트의 링크를 제공한다.

STRBase
Motivation : STR에 관련된 정보와 기술을 통합함으로써
Human identity testing에 있어서 short tandem repeat DNA
markers의 이용과 연구에 편의를 제공.
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : National Institute of Standards and Technology
다운로드 :
내용 : 미국 표준기술연구소의 데이터베이스로
Short tandem DNA repeats에 대한 정보를 제공한다.

TIGR plant repeat database
Motivation : 식물 유전체 내 반복서열의 분류
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : TIGR(The Institute for Genomic Research)
내용 : 다양한 유기체의 게놈을 연구하는 TIGR(The Institute for Genomic Research)의
데이터베이스로 식물유전체 내의 반복서열에 대한 정보를 제공한다.
데이터베이스내의 모든 반복서열은 향후 연구를 위해 모두 코드화 되어있다.

UniVec
Motivation : 벡터의 혼성을 위한 핵산서열의 빠른 확인
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : NCBI
내용 : UniVec은 NCBI FTP 디렉터리로부터 보급되고 있으며 벡터의 혼성을 위한 핵산 서열의
빠른 확인을 목적으로 하는 데이터베이스이다. 많은 수의 벡터로부터 각각의 특이한 서열조각 중
단 하나의 copy를 포함하는 데이터베이스를 만들기 위해 불필요한 많은 부분이 삭제되었기
때문에 UniVec을 이용한 스크리닝은 효율적인 방법이 된다.
 
UTRdb/UTRsite
Motivation : 진핵생물 mRNA내 번역되지 않는 부분에 관한 정보의 제공
개발 프로그램 :
데이터 건수 :
국가 : 독일
기관 : Lionbioscience
다운로드 :
내용 : Lionbioscience사의 상품 중 하나인 SRS(Sequence Retrival System)내의 데이터베이스로
진핵생물 mRNA내의 5`과 3` 번역이 이루어지지 않는 부분에 대한 정보를 제공한다.
UTRsite는 5`또는 3` UTR서열 내에 위치한 기능적인 서열의 패턴에 대한 모음이다.
UTRdb/UTRsite는 데이터베이스내의 검색을 위한 두 개의 tool인 UTRScan과 UTRBlast를 제공한다.

VectorDB
Motivation : nucleic acid vector의 분류와 동정
개발 프로그램 :
데이터 건수 : 2,600종류 이상의 벡터 정보 보유
국가 : 미국
기관 : Leland Stanford Junior University
다운로드 :
내용 : VectorDB는 The Saccharomyces Genome Database (SGDTM) 프로젝트를 통해 만들어졌다.
VectorDB는 분자생물학에서 일반적으로 이용되는 많은 벡터에 대한 서열 정보와 주석을 포함한다.
GenBank내에 존재하는 벡터의 경우 NCBI의 Entrez에 직접 연결되어있다.