L1Base
Motivation : 활성을 지니는 것으로 예상되는 LINE‐1에 대한
온라인상의 데이터베이스 제공
개발 프로그램 : L1Xplorer
데이터 건수 :
국가 : 독일
기관 : MAX PLANCK INSTITUTE FOR MOLECULAR GENETICS
다운로드 :
내용 : L1Base는 인간과 설치류의 유전체내에서 활성을 지니는 것으로 예상되는 LINE‐1에 대한
데이터베이스이다. L1Base에는 L1의 동정과 기능적인 주석을 달기 위한 tool을 제공한다.
MethDB
Motivation :
개발 프로그램 : MacOS
데이터 건수 : 5,382 patterns/profiles, 19,905 5mC content data
국가 : 프랑스
기관 :
내용 : MethDB는 DNA내에서 methylated cytosines에 의한 현상에 대한 정보를 제공한다.
데이터베이스는 methylation 자료의 저장에 맞게 설계되었으며 분석에 필요한 tool을 직접
제공하지는 않으며 관련 tools의 사이트를 링크하고 있다.
데이터베이스는 RDBMS Filemaker Pro에 기초를 둔다.
MICAS
Motivation : 원핵생물 Microsatellites 의 손쉬운 검색을 돕는다.
개발 프로그램 :
데이터 건수 :
국가 : 인도
기관 : CDFD(Centre for DNA Fingerprinting and Diagnostics)
다운로드 :
내용 : MICAS는 주어진 염기서열과 유전체 서열 내에서 사용자가 non‐redundant microsatellites를
쉽게 찾아낼 수 있도록 하기 위해 만들어진 서버이다.
사용자는MICdb(Database of Prokaryotic Microsatellites) 시스템을 통해서 정보를 검색 할 수 있다.
PACRAT
Motivation : PACRAT system은 유전자 발현의 조절과
진행방향에 대한 연구를 위해 다수의 고세균 유전체로부터
프로모터 부위를 적출하기 위한 목적으로 만들어졌다.
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : 오하이오 주립대학
내용 : PACRAT은 고세균 유전체와 박테리아 유전체의 intergenic sequence에 관련된 정보를
제공한다. User ID를 발급받아야 사용할 수 있다.
PANDIT
Motivation :
개발 프로그램 :
데이터 건수 : 7,738 families
국가 : 영국
기관 : EMBL‐EBI
내용 : PANDIT(Protein and Associated Nucleotide Domains with Inferred Trees)은
EBI내의 데이터베이스로 다각적인 서열의 배열과 많은 일반적인 단백질 도메인을
포함하는 계통수에 관한 정보를 제공한다.
RECODE
Motivation :
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : Department of Human Genetics, University of Utah
다운로드 :
데이터베이스이다. RECODE는 또한 유전체 서열 내의 SECIS(selenocysteine이
들어간 서열) 영역의 검증과 일반적인 리보솜의 frameshifting의 시각화와 검증에 대한
프로그램을 제공한다.
NCBI Refseq
Motivation : DNA, RNA, 단백질에 관한 효율적인 정보의 제공을 목적으로 한다.
개발 프로그램 :
데이터 건수 : 단백질 ‐ 1,899,454, Organisms ‐ 3,060
국가 : 미국
기관 : NCBI
내용 : NCBI의 RefSeq(Reference Sequence)는 통합적이면서도 중복이 없는 Genomic DNA,
그리고 NCBI FTP로의 접근을 용이하게 함으로써 정보의 효율성을 높여준다.
S/MARt DB
Motivation :
개발 프로그램 :
데이터 건수 :
국가 : 독일
기관 : Department of Bioinformatics
다운로드 :
내용 : S/MARt DB는 핵기질과 상호작용하는 핵기질 단백질과 scaffold/matrix attached regions
에 관한 정보를 제공한다. S/MARt DB는 효모에서부터 인간에 이르기까지의 정보를 축적하고
있다. S/MARt DB는 다양한 관련 사이트의 링크를 제공한다.
STRBase
Motivation : STR에 관련된 정보와 기술을 통합함으로써
Human identity testing에 있어서 short tandem repeat DNA
markers의 이용과 연구에 편의를 제공.
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : National Institute of Standards and Technology
다운로드 :
내용 : 미국 표준기술연구소의 데이터베이스로
Short tandem DNA repeats에 대한 정보를 제공한다.
TIGR plant repeat database
Motivation : 식물 유전체 내 반복서열의 분류
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : TIGR(The Institute for Genomic Research)
내용 : 다양한 유기체의 게놈을 연구하는 TIGR(The Institute for Genomic Research)의
데이터베이스로 식물유전체 내의 반복서열에 대한 정보를 제공한다.
데이터베이스내의 모든 반복서열은 향후 연구를 위해 모두 코드화 되어있다.
UniVec
Motivation : 벡터의 혼성을 위한 핵산서열의 빠른 확인
개발 프로그램 :
데이터 건수 :
국가 : 미국
기관 : NCBI
내용 : UniVec은 NCBI FTP 디렉터리로부터 보급되고 있으며 벡터의 혼성을 위한 핵산 서열의
빠른 확인을 목적으로 하는 데이터베이스이다. 많은 수의 벡터로부터 각각의 특이한 서열조각 중
단 하나의 copy를 포함하는 데이터베이스를 만들기 위해 불필요한 많은 부분이 삭제되었기
때문에 UniVec을 이용한 스크리닝은 효율적인 방법이 된다.
UTRdb/UTRsite
Motivation : 진핵생물 mRNA내 번역되지 않는 부분에 관한 정보의 제공
개발 프로그램 :
데이터 건수 :
국가 : 독일
기관 : Lionbioscience
다운로드 :
내용 : Lionbioscience사의 상품 중 하나인 SRS(Sequence Retrival System)내의 데이터베이스로
진핵생물 mRNA내의 5`과 3` 번역이 이루어지지 않는 부분에 대한 정보를 제공한다.
UTRsite는 5`또는 3` UTR서열 내에 위치한 기능적인 서열의 패턴에 대한 모음이다.
UTRdb/UTRsite는 데이터베이스내의 검색을 위한 두 개의 tool인 UTRScan과 UTRBlast를 제공한다.
VectorDB
Motivation : nucleic acid vector의 분류와 동정
개발 프로그램 :
데이터 건수 : 2,600종류 이상의 벡터 정보 보유
국가 : 미국
기관 : Leland Stanford Junior University
다운로드 :
내용 : VectorDB는 The Saccharomyces Genome Database (SGDTM) 프로젝트를 통해 만들어졌다.
VectorDB는 분자생물학에서 일반적으로 이용되는 많은 벡터에 대한 서열 정보와 주석을 포함한다.
GenBank내에 존재하는 벡터의 경우 NCBI의 Entrez에 직접 연결되어있다.