게시 및 게시 날짜 : 2022/11/22

번역되지 않은 RNA의 발현을 예측하기위한 바카라 커뮤니티의 개발

-Promoting disease understanding from genome analysis-


Genome Analysis의 Oido University의 특별 연구원 인 Riken Institute (Riken Institute)의 생물학적 과학 센터 (Riken Institute) (연구 당시의 현재 방문 연구원, Tokyo 대학교의 새로운 지역 제조업 과학 대학원), The Piero Carninchi Stured (The Piero Carninchi) 도쿄 대학의 새로운 지역 창조 과학 대학원의 카마 타니 요이 시로 (Kamatani Yoichiro)와 세나 준 (National Institute of Advanced Industrial Science) (바카라 커뮤니티ST)의 인공 지능 센터 (Institute of Advanced Industrial Science) (Humanome Research Institute, Inc의 사장 겸 CEO)의 연구원을 방문하는 Sena Jun (Sena Jun)번역되지 않은 바카라 커뮤니티[1]DNA 서열 패턴만으로바카라 커뮤니티[2]개발되었습니다

이 연구 결과는 약물 발견 목표 및 바이오 마커 역할을하는 번역되지 않은 바카라 커뮤니티에 대한 검색에 기여할 것으로 예상됩니다

다 인성 질병 등과 관련하여다형성[3]게놈의 번역되지 않은 영역에서 축적되지만, 번역되지 않은 바카라 커뮤니티의 발현에 대한 다형성의 많은 영향은 설명되지 않았다

이번에는 공동 연구 그룹이 수십 년 동안 수행되었습니다시퀀스 모티프[4]분석으로 돌아가서, 우리는 DNA 서열 패턴으로부터 번역되지 않은 RNA의 발현을 예측하고 그것을 "ment"라는 바카라 커뮤니티를 개발했다Fantom Consortium[5](Fantom5) 2014 년에 게시 된 유전자 발현 데이터는 MENT를 사용하여 배웠으며 이전에보고되었습니다게놈 전체 협회 분석 (GWAS)[6]이것은 다 인성 질병과 같은 다양한 특성과 관련하여 10,000 개 이상의 번역되지 않은 바카라 커뮤니티를 카탈로그했으며, 극도로 드문 다형성이 번역되지 않은 바카라 커뮤니티를 통한 천식과 같은 질병의 발병에 영향을 미치는 메커니즘을 밝혀냈다 MENT는 전 세계의 연구원들에게 출판되어 제공됩니다

이 연구는 과학 저널 "Nature Biomedical Engineering'의 온라인 버전에 게시됩니다 (11 월 21 일 : 일본 11 월 22 일)

요약 다이어그램

새로운 바카라 커뮤니티 (MENT) 및 질병 연구에 적용을 사용하여 번역되지 않은 RNA의 발현을 기대하는


배경

게놈 전체 연관 분석 (GWAS)은 전 세계 수십만 개 이상의 표본을 사용하여 적극적으로 수행되었으며, 질병 감수성과 키, 체중, 체중, 혈액 검사 값과 같은 복잡한 특성과 관련된 수많은 유전 적 다형성이 확인되었습니다 이 유전자 관련 정보를 사용하면 성공적인 약물 발견의 확률 증가와 같은 증거가 축적되어 다형성의 생물학적 기능을 명확하게하는 것이 점점 더 중요합니다

현재까지, 다양한 복잡한 특성과 관련된 많은 다형성은 단백질 (변환되지 않은 영역)으로 번역되지 않은 게놈의 영역에 존재하며, 단백질로 변환 된 Messenger 바카라 커뮤니티 (m바카라 커뮤니티)의 양을 통해서도 특성의 개별 차이에 영향을 미치는 것으로 나타 났으며, 또한 다양한 바카라 커뮤니티 (비판) 번역되지 않은 지역 번역되지 않은 지역에서 다형성의 역할을 명확히하기 위해서는 조직 별 다형성과 바카라 커뮤니티 수준 사이의 관계를 종합적으로 요약하는 데이터베이스 (카탈로그)가 필요합니다

그러나, m바카라 커뮤니티와 비교할 때, 번역되지 않은 바카라 커뮤니티와 다형성 사이의 연관성 카탈로그는 불완전하다 특히, 바카라 커뮤니티 (Enhancer 바카라 커뮤니티 : e바카라 커뮤니티[7])는 번역되지 않은 바카라 커뮤니티들 사이에서 특히 낮은 발현 수준을 가지므로 실험적으로 정량화하기가 어렵습니다 또한, E바카라 커뮤니티가 동일한 DNA 서열을 가지고 있더라도, 다양한 세포에 대한 실험은 각 세포 유형에 대해 매우 다른 발현 패턴을 요구한다는 과제를 제시한다 따라서 E바카라 커뮤니티는 다양한 세포 기능에 널리 관여 된 것으로 생각되지만 E바카라 커뮤니티와 다형성 사이의 연관성을 명확히하기가 매우 어려웠습니다

그래서 협력 연구 그룹은 분자 생물 학자들이 수십 년 동안 경험적으로 발견 한 "서열 모티프"의 개념을 개발했습니다딥 러닝[8])에 적용하고 개발할 수있는 연구 방법에 중점을 두었습니다 이 기술은 바카라 커뮤니티가 게놈에서 특정 연속 DNA 서열 패턴 (모티프) 사이의 관계를 학습 한 다음 컴퓨터에서 모티프가 파괴 될 때 전사에 미치는 영향을 예측하기 위해 "실리코 돌연변이 유발 방법"을 사용하는 것을 포함합니다 이 연구에서, 우리는 번역되지 않은 RNA의 DNA 서열과 발현 패턴 사이의 관계를 올바르게 학습함으로써 새로운 바카라 커뮤니티를 개발했으며, 실험적 돌연변이 기염에 비해 정확도를 갖는 다형성으로 인해 번역되지 않은 RNA의 발현 수준의 세포-특이 적 변화를 예측하는 것을 목표로했다

 

연구 방법 및 결과

공동 연구 그룹은 공개적으로 이용 가능한 표준 인간 게놈 서열에서 얻은 전 사체 주위에 200,000 개의 염기의 DNA 서열을 사용하는 바카라 커뮤니티를 설계하고 서열의 중심으로부터 RNA 발현 확률을 출력하며 300 개가 넘는 인간 1 차 세포 및 조직을 수집했습니다CAGE transcriptome data[9]의 표현 패턴을 훈련시켰다

이 바카라 커뮤니티는 큰 2 단계 구조를 가지고 있으며 첫 번째 단계는 딥 러닝을 사용하여 2,002 가지 유형의 DNA 서열 패턴을 갖습니다후성 유전 학적 조건 금액[10](다양한전사 인자[4]) 및 두 번째 단계경사면 부스트 결정 트리[11]에 의한 후성 유전 적 양으로부터 각 세포 유형에 대한 RNA (mRNA 및 변환 된 RNA) 전사의 존재 또는 부재를 예측한다 학습 후 바카라 커뮤니티를 사용할 때, 각 세포 및 조직에 대한 RNA 발현 확률은 임의의 DNA 서열 (입력 데이터)으로부터 출력된다 흥미롭게도, RNA 발현의 예측 확률은 또한 실제 RNA 발현 수준과 상관 관계가있다 또한, 돌연변이가 DNA 서열에 적용될 때 출력 값의 변화를 관찰하는 In Silico mutagenesis 방법을 사용함으로써, 돌연변이로 인한 발현 수준의 변화를 예측할 수있다 번역되지 않은 RNA 예측을위한이 방법은 "ment (멘토 :mUtationeffect prediction onnC바카라 커뮤니티trAnscription) "

첫째, 먼저 MENT가 DNA 서열로부터 조직 및 세포 유형에 의해 번역되지 않은 바카라 커뮤니티의 발현을 정확하게 예측할 수있는 방법을 결정하기 위해, 우리는 훈련 데이터와 겹치지 않는 평가 데이터를 사용하여 예측 능력을 예측합니다 (ROC 곡선 아래 지역[12])가 평가되었습니다 m바카라 커뮤니티는 다양한 세포 및 조직에 대한 케이지 전 사체 데이터에서 Fantom5에 의해 수집 및 발표되었다긴 가닥 비 코딩 바카라 커뮤니티 (lnc바카라 커뮤니티)[1]정확도 076 ± 004로 예측 될 수 있고 E바카라 커뮤니티는 069 ± 005의 정확도로 예측 될 수 있으며, 특히 LNC바카라 커뮤니티 및 E바카라 커뮤니티의 예측 정확도는 기존의 방법에 비해 상당히 개선되었습니다 (그림 1)

그림 1

Figure 1 Comparison of predictive accuracy of enhancer 바카라 커뮤니티 (e바카라 커뮤니티)
347 조직 및 세포 유형의 예측 능력 (AUROC)은 수평 축에 표시된 방법을 사용하여 동일한 테스트 데이터를 사용하여 비교되었습니다 도트는 평균 N = 347이고 P 값은 Wilcoxon의 서명 된 순위 테스트 (양측)입니다 그 설계로 인해 기존의 방법 (기대)은 게놈의 양성 또는 부정적인 방향으로 전사되는 E바카라 커뮤니티를 예측할 수 없습니다 (다른 기존 방법과 동일) 거기 repogoAve예측 된 값의 평균을 양방향으로 취하고 기대더 나은에서 올바른 데이터에 가장 가까운 표현식을 가진 것은 임의로 선택되었지만 Ment는 두 경우 모두에서 더 높은 예측 정확도를 나타 냈습니다 MENTR선형MENT의 그라디언트 부스팅 결정 트리 대신 간단한 정규화 된 선형 모델을 사용하여 평균화되며, 후성 유전 적 상태 (비선형 효과)의 결합 된 효과는 학습되지 않습니다

또한, MENT가 케이지 전 사체 데이터에서 잘못된 양성을 예측 한 전 사체에 대해 검출 감도가 높습니다 (평가 데이터에서 표현되지 않았지만 표현 될 것으로 예상NET-CAGE[9]이들 중 31-70%가 실제로 전사되었음을 밝혀 냈습니다 다시 말해, MENT는 실험적인 이유로 케이지에 의해 감지되지 않은 전 사체를 올바르게 예측할 수 있으며, 위에서 언급 한 평가 데이터를 사용한 예측 정확도가 실제로 조금 더 높다는 것이 밝혀졌습니다

우리는 또한 MENT가 번역되지 않은 RNA의 예측 정확도를 개선 한 이유를 명확히하려고 노력했으며, MENT가 전 사체와는 거리가 멀고 세포 유형-특이 적 후성 유전 적 상태에 중요성을 나타내며, 두 개 이상의 후성 유전 학적 상태가 고갈 된 RNA의 예측 능력을 개선했을 때 특수 효과 (비선형 효과)를 고려한 것으로 밝혀졌다 이 결과는 번역되지 않은 RNA의 발현 조절에서 매우 먼 후성 유전 적 상태의 복잡한 관여에 대한 데이터 중심의 발견이 바카라 커뮤니티 예측 결과의 해석이 생물학적 결과에 어떻게 적합한지를 의미한다

다음으로, 우리는 MENT를 사용한 IN 실리코 돌연변이 유발 방법에 의한 발현 수준의 변화의 정확성을 조사하고, 다형성의 효과는 154 개의 림프 모세포 세포주 및 CAGE 전사 결과의 유전자형으로부터 추정 된 다형성의 효과를 추정했다 () 데이터 먼저, 우리는 돌연변이 효과 크기가 m바카라 커뮤니티 및 번역되지 않은 바카라 커뮤니티 둘 다에 대해 증가함에 따라, 돌연변이 효과 크기는 올바른 데이터에서 다형성의 영향과 일치한다는 것을 발견했다 이것은 돌연변이 효과 크기의 크기가 예측의 정확성을 나타냅니다

또한 실험에 사용 된 것과 동일한 유형의 세포가 IN Silico Mutagenesis 방법에 사용될 때 돌연변이 효과 크기의 정확성이 최대화되었습니다 이것은 유전자 발현 조절 메커니즘이 세포 유형-특이 적이어야하고 세포-특이 적 발현 패턴을 학습해야한다는 것을 나타낸다 (도 2) 또한 돌연변이 효과 양을 5% 이상 변화시킬 필요가 있음이 밝혀졌으며, 돌연변이 효과량과 올바른 데이터의 90%의 정확도에 도달하기 위해 80%의 정확도에 도달하고 돌연변이 효과량은 90%의 정확도에 도달하기 위해 10% 이상으로 변경되어야한다는 것이 밝혀졌으며, 우리는 미래의 신청에 대응할 수있게되었다

또한 인구 데이터를 사용하지 않고 MENT의 돌연변이 효과 크기체인 불균형[13]실험적 돌연변이 유발 방법의 결과와 잘 일치했으며, 이는 또한 연계 불균형에 의해 영향을받지 않습니다 상기 연구는 MENT가 번역되지 않은 바카라 커뮤니티의 발현에 영향을 미치는 다형성을 정확히 찾아서 예측하는 데 사용될 수 있음을 입증한다

 

그림 2

그림 2 돌연변이 효과 크기 및 정확도
림프 모세포 세포주에서 MENT에 의한 E바카라 커뮤니티의 돌연변이 효과 크기에 대한 임계 값이 변경되었을 때보고되었습니다 (M Garieriet al Nat Commun2017)은 강화제와 관련된 다형성의 효과가 재현 될 수있는 정도를 결정하기 위해 평가되었다 (빨간색 선) 열 맵 색상 (주황색에서 파란색)은 347 세포 유형과 림프 모세포 세포주의 조직 사이의 E바카라 커뮤니티 발현 패턴과 FantOM5 사이의 상관 관계를 보여줍니다 오렌지 색상은 발현 패턴이 세포 유형과 유사하다는 것을 나타냅니다 완전히 다른 E바카라 커뮤니티 발현 패턴을 나타내는 세포 유형 (파란색)은 이전에보고 된 결과와 일치율을 상당히 감소시켰다 다시 말해, 실리코 돌연변이 유발에서 돌연변이 효과를 정확하게 예측하기 위해, 세포 유형-특이 적 발현 패턴의 학습이 필수적이다

다음으로, 우리는 MENT를 사용하여 번역되지 않은 바카라 커뮤니티가 복잡한 인간 특성에 어떻게 기여하는지 조사했습니다 우리는 현재까지 전 세계적으로 수행 된 다양한 복잡한 특성에 대한 GWAS 결과를 수집하고, 실리코 돌연변이 유발에서 MENT를 사용하여 총 41,223 개의 다형성을 분석했으며, 다형성의 17,306 (42%)이 적어도 하나의 전 사체의 발현 수준을 조절하는 데 관여한다는 것을 발견했습니다 (APERSHORCH의 APERSHALD) 다형성의 몇 % 만이이 임계 값에 도달했기 때문에 일반 인구가 보유한 전체 다형성은 상당히 높았다 이 결과는 전 사체 발현을 변경하는 돌연변이가 기존의 잘 알려진 발견과 일치하여 과거 GWAS 결과에서 축적되었음을 의미합니다

이러한 다형성에 의해 영향을받는 전 사체에는 3,548 개의 LNC바카라 커뮤니티 및 7,775 개의 E바카라 커뮤니티s (총 11,323)가 포함되었습니다 이러한 번역되지 않은 바카라 커뮤니티 (특히 E바카라 커뮤니티)의 대다수의 생물학적 기능이 알려지지 않았기 때문에,이 연구 결과 (카탈로그)는 번역되지 않은 바카라 커뮤니티를 GWAS 결과에 기초한 다양한 복잡한 특성과 연결하는 결과가 미래에 중요한 연구 자원이 될 것으로 예상된다

GWAS 결과가 실제로 MENT에서 해석 된 예를 보여줍니다 일부 다형성 (RS17293632)은크론 병[14]천식과 관련하여 (그림 3A),SMAD3유전자 m바카라 커뮤니티의 발현 수준에 영향을 미치는 것으로보고되었다 (도 3B) 그러나, 이러한 게놈 분석은 연계 불균형에 따라 진정한 원인 다형성 이외의 영역에서도 낮은 p- 값이 관찰되기 때문에 원인의 다형성을 좁히기가 어려웠다 다른 한편으로, MENT는 RS17293632만이 천식과 관련된 크론 병 및 면역 관련 세포와 관련된 대장 조직에서 근처의 E바카라 커뮤니티의 발현을 낮출 것이라고 예측했다 (도 3C) 실제로이 다형성은입니다SMAD3E바카라 커뮤니티를 통해 RS17293632와 함께 이전 실험에서 유전자 전사 활성에 영향을 미쳤습니다SMAD3유전자 m바카라 커뮤니티의 전사 활성을 조절하는 메커니즘이지지되었다

그림 3

그림 3 MENT에 대한 정확한 예측의 예
(a) GWAS 결과는 연결 불균형 (공개 데이터에서 검색)에 의존합니다
(b) 정량적 특성 유전자좌 (EQTL) 연결 불균형 의존성 유전자 발현 (GTEX 데이터베이스에서 얻은)에 대한 분석 결과
(c) MENT를 사용한 정확한 예측 (이 연구 결과)

15692_15926Wnt7b그것은 유전자 m바카라 커뮤니티의 전사 활성과 관련이 있습니다 (이 e바카라 커뮤니티는 그렇지 않습니다Wnt7b그것은 유전자의 전사 조절 인 것으로 생각됩니다), 신호 변환기 역할을하는 Wnt7b 단백질은 뼈 형성을 촉진합니다 이러한 발견은 다형성이 E바카라 커뮤니티를 통해 균열 밀도에 영향을 미치는 생물학적 해석을 얻기 위해 통합되었다 (도 4A)

또한, 드문 다형성 Rs12722502는 천식 발병 위험을 낮추는 데 효과적 인 것으로보고되었지만 Ment는 특정 백혈구에서 E바카라 커뮤니티의 발현을 감소시킬 것으로 예측했습니다 이전 연구 에서이 e바카라 커뮤니티는입니다IL2RA유전자 m바카라 커뮤니티의 전사 활성과 상관 관계가있는 것으로 알려져 있으며 IL2RA 단백질을 표적으로하는 것이 흥미 롭습니다모노클로 날 항체 (Daclizumab)[15]폐 기능과 천식을 향상시킵니다 (그림 4B) 위에서 언급 한 바와 같이, MENT를 활용함으로써, 드문 다형성이 E바카라 커뮤니티를 통한 복잡한 특성을 포함하는 메커니즘을 해석 할 수 있음이 밝혀졌다

그림 4

그림 4 복잡한 특성과 관련된 희귀 다형성의 멘트 해석의 예
빨간색 : 멘트에 의한 예측 블루 : GWAS에서 얻은 유전자 연관성 정상 화살표는 +의 효과의 관계 (증가)를 나타내고, T 자형 화살표는 -의 효과의 관계 (감소, 억제)를 나타냅니다

 

미래를위한 희망

GWAS에서 얻은 다형성과 질병 사이의 인과 관계를 보여주는 데이터는 매일 축적되고 있지만, GWAS 관련 영역의 대부분을 고려하여 질병 발병 위험을 증가 시키거나 감소시키는 번역되지 않은 영역에서 다형성이 제한된 수의 생물학적 메커니즘 만 있습니다 DNA 서열 단독에 기초하여 번역되지 않은 RNA의 세포 유형-특이 적 발현을 예측하는 새로운 바카라 커뮤니티 기술인 MENT를 사용하여, 다형성으로 인한 변형되지 않은 RNA의 발현 수준의 증가 또는 감소를 높은 정확도로 예측하여 약물 발견 표적을 검색하는데 유용한 생물학적 해석을 허용한다 현재 일본을 포함하여 전 세계 국가에는 수만에서 수십만 명의 사람들이있는 대규모 사람들이 있습니다전체 게놈 서열 분석[16]현재 진행 중이며 복잡한 특성과 관련된 많은 희귀 다형성이 GWAS에서 번역되지 않은 지역에서 계속 드러날 것으로 예상됩니다 따라서 약물 발견 연구 및 바이오 마커 검색에서 맨의 중요성이 더욱 증가 할 것으로 예상됩니다 이 프레젠테이션 외에도 Ment는 이미 여러 연구를 통해 새로운 결과를 발견하는 데 기여했습니다참고 1-3)앞으로 추가로 사용할 수 있습니다

동시에, "MENT는 왜 DNA 서열 단독으로부터 번역되지 않은 바카라 커뮤니티의 발현을 예측할 수 있습니까?" 이 연구 과정에서 등장한 새로운 질문입니다 이 연구에서, 본 발명자들은 전사 기원과는 거리가 멀다는 후성 유전 적 상태가 복잡한 (비선형) 조합으로 결합되어 번역되지 않은 바카라 커뮤니티의 발현을 결정한다는 것을 발견했다 미래에, 우리가 세포 유형-특이 적 방식으로 MENT의 훈련 된 기계 학습 모델을 정확하게 분석함으로써 번역되지 않은 바카라 커뮤니티의 발현 메커니즘을 설명 할 수 있다면, 분자 세포 유기체에 대한 새로운 지식이 만들어지기를 희망 할 수 있습니다

이 연구에 주로 사용 된 데이터는 2014 년 및 기타 영역에서 Fantom5에서 발표 한 연구 결과이지만, 거의 8 년이 지난 후에도 약물 발견에 유용한 새로운 결과를 얻을 수 있습니다 과거에 축적 된 MENT 및 재분석 데이터와 같은 바카라 커뮤니티 기술을 완전히 활용함으로써 새로운 지식을 만들어 줄 추가 연구를 기대할 수 있습니다

Ment는 공개 저장소 Github에 게시되었습니다참고 4),이 연구에서 구성된 카탈로그참고 5)와 함께 전 세계 누구든지 사용할 수 있습니다

참고 1) Mishraet al자연(2022)
참고 2) 보도 자료 2021 년 6 월 9 일 "아토피 성 피부염의 발병에 대한 새로운 유전자 요인"참고 3) 보도 자료 2021 년 8 월 19 일 "일본인의 사타구니 탈장 (분리)과 관련된 유전자 유전자좌 식별"참고 4) MENT (NC바카라 커뮤니티 전사에 대한 돌연변이 효과 예측)참고 5) MENT 결과 뷰어
 

종이 정보

<title>
Prediction of the cell-type-specific transcription of non-coding 바카라 커뮤니티s from genome sequences via machine learning
<저자 이름>
Masaru Koido, Chung-Chau Hon, Satoshi Koyama, Hideya Kawaji, Yasuhiro Murakawa, Kazuyoshi Ishigaki, Kaoru Ito, Jun Sese, Nicholas F Parrish, Yoicho kamatani, Piero Carninci, Chiki Thero ^ Chiki Tero re
<magazine>
Nature Biomedical Engineering
<doi>
101038/S41551-022-00961-8


추가 설명

[1] 번역되지 않은 바카라 커뮤니티, 긴 가닥 비 코딩 바카라 커뮤니티 (LNC바카라 커뮤니티)
Among the 바카라 커뮤니티s transcribed from DNA, messenger 바카라 커뮤니티s (m바카라 커뮤니티s) are translated into proteins The general term for 바카라 커뮤니티 that is not translated into proteins is called untranslated 바카라 커뮤니티, relative to m바카라 커뮤니티 that is translated into proteins 조직 및 세포 유형과 같은 인간 발달 및 항상성에 특이 적으로 작용하는 다양한 유형의 번역되지 않은 바카라 커뮤니티가 있다고보고되었다 이들 중에서, 주요 표적은 향수제 바카라 커뮤니티 ([7]) 였는데, 이는 아가씨로부터 유전자 발현을 제어하는 강화제가 200 염기의 장기 비 코딩 바카라 커뮤니티 (LNC바카라 커뮤니티)를 활성화 할 때 인핸서 영역의 양쪽 끝에서 동시에 전사되는 향상된 바카라 커뮤니티 ([7])였다 lnc바카라 커뮤니티 stands for long non-coding 바카라 커뮤니티[참조로 돌아 가기]
[2] 바카라 커뮤니티
인공 지능의 약어 이 연구에서 이것은 데이터와 학습 규칙을 지정하여 변수 간의 복잡한 관계와 규칙을 가르치는 기술인 기계 학습을 말합니다[참조로 돌아 가기]
[3] 다형성
게놈의 DNA 서열이 개체마다 다른 위치는 특정 집단 내의 특정 빈도로 존재한다 전형적인 예는 단일 뉴클레오티드 다형성 (SNP)을 포함하며, 여기서 한 염기는 다른 염기로 대체된다[참조로 돌아 가기]
[4] 서열 모티프, 전사 인자
특정 기능적 역할을 가진 DNA 서열 패턴 예를 들어, 전사 인자 (특정 DNA 서열에 결합하고 제어 유전자 발현에 결합하는 단백질)가 결합하지만 결합 부위에서 DNA 서열 패턴을 비교할 때 유사한 서열이 종종 나타난 게놈에 많은 위치가있다 예를 들어, 2019 년 의학 생리학 상으로 인기있는 저산소증 유발 요인은 ACGTG 및 GCGTG와 같은 5 개의 문자 모티프가있는 지역에 결합하는 것으로 알려져 있습니다 시퀀스 모티프는 자주 발생하는 패턴의 가장 작은 단위로 사용되었지만,이 연구에서는 인간이 발견 할 수없는 길고 복잡한 서열 패턴을 포함하여 바카라 커뮤니티 기술을 사용하여 검색하려고 시도했습니다[참조로 돌아 가기]
[5] Fantom Consortium
Inte바카라 커뮤니티tional Research Consortium hosted by RIKEN (https : //fantomgscrikenjp/jp/) 이 연구에서, 5 단계 (FantOM5)에서 공개 된 다양한 인간 세포 및 조직에서 측정 된 케이지 전 사체 데이터를 재분석하여 사용 하였다[참조로 돌아 가기]
[6] 게놈 전체 연관 분석 (GWAS)
다 인성 질병 및 인체 측정과 같은 다양한 복잡한 특성에 대한 유전자 다형성과의 연관성을 명확히하기 위해 성과 분석 기술 GWAS는 게놈 전체 연관 연구의 약자입니다[참조로 돌아 가기]
[7] Enhancer 바카라 커뮤니티 (E바카라 커뮤니티)
인핸서는 전사 시작점에서 멀리 떨어져 있고 전사 효율을 증가시키는 데 중요하는 유전자 발현을 조절하는 기능적 부위입니다 다른 세포 유형은 또한 동일한 m바카라 커뮤니티에 대해 기능한다 특히, 번역되지 않은 바카라 커뮤니티는 활성화 된 강화제의 양쪽 끝에서 전사되는 것으로 알려져 있으며,이를 향상된 바카라 커뮤니티 (E바카라 커뮤니티)라고한다 65,000 개의 E바카라 커뮤니티s는 Fantom Consortium Phase 5 (Fantom5)에 의해 확인되었으며, 주변의 다 인성 질병과 관련된 많은 관련 다형성이 있다고보고되었습니다[참조로 돌아 가기]
[8] 딥 러닝
딥 러닝으로도 알려진 기계 학습 방법의 유형 신경망이라고하는 살아있는 유기체의 신경 회로를 모방하는 여러 층의 기계 학습 모델을 반복함으로써 다양한 기능을 만들고 성공적인 학습을 보장하기 위해 다양한 노력을 기울이고 매우 정확한 예측이 달성됩니다 특히,이 연구는 이미지 인식에 사용 된 심층 컨볼 루션 신경망을 사용합니다 DNA 서열의 경우, 새로운 특징을 생성하기 위해 가중치의 국부 정보 (예 : 3 개의 연속 염기)가 계산되고 전체 DNA 서열에 대해 "컨볼 루션"이 수행된다 이 컨볼 루션을 포함한 반복 처리를 포함하는 딥 러닝 모델을 깊은 컨볼 루션 신경망이라고합니다[참조로 돌아 가기]
[9] CAGE transcriptome data, NET-CAGE
케이지 (CAP 분석 유전자 발현)는 Riken이 전 사체의 5 '끝에서 기본 서열을 결정하기 위해 개발 한 방법입니다 전 사체는 표적 세포, 기관 등에 존재하는 모든 전 사체의 수집 및 총입니다 즉, 케이지 전 사체 데이터는 케이지에 의해 측정 된 전체 전 사체의 데이터를 나타냅니다 Net-Cage (기본 연장 전사 케이지)는 미래에 고순도로 합성되는 신생아 바카라 커뮤니티를 빠르게 정화하는 생화학 기술을 사용하는 케이지입니다[Return to reference]
[10] 후성 조건부 금액
DNA 메틸화 및 히스톤 변형과 같은 획득 된 화학적 변형은 유전자 발현 조절에 관여하는 것으로 생각되며, 화학적 변형의 활성화 (후성 유전 학적 상태)를 참조한다 각 기관 및 세포 유형은 독특한 패턴을 나타내는 것으로 널리 알려져 있습니다 이 연구에서, 우리는 깊은 컨볼 루션 신경 네트워크로부터의 세포-특이 적 히스톤 메틸화 출력 및 전사 인자의 결합을 포함하여 2,002 개의 상태를 사용했다 [참조로 돌아 가기]
[11] 그라디언트 부스트 결정 트리
기계 학습 방법이며 종종 딥 러닝과 함께 데이터 분석 경쟁에서 사용됩니다 기초는 의사 결정 트리라고하는 간단한 기계 학습 방법으로, 데이터의 비선형 특징을 고려하여 예측을 할 수 있습니다[참조로 돌아 가기]
[12] ROC 곡선 아래의 영역
ROC (수신기 작동 특성) 곡선은 특정 분류가 수행 될 때 및 예측 인덱스의 임계 값이 변경 될 때 민감도와 특이성이 변경되는 관계를 보여줍니다 x 축에 대한 1- 특이성 및 y 축의 감도 예측 정확도가 높을수록 곡선이 왼쪽 상단 모서리에 높아 지므로 곡선 아래의 영역은 예측 정확도의 지표로 사용됩니다 예측 가능성이 높을수록 ROC 곡선 아래의 영역은 1에 접근하며, 임의 예측 지수 인 경우 ROC 곡선 아래의 영역은 05가됩니다[참조로 돌아 가기]
[13] 연결 불균형
인구에서, 두 가지 다형성의 유전자형에 초점을 맞출 때, 두 사람은 무작위로 관련이 없다 연결 불균형은 종종 근처 다형성에서 관찰되므로, 그림 3에서 A 및 B와 같은 원인 다형성 이외의 경우에도 연관성 (낮은 p- 값)을 얻을 수 있습니다 MENT는 모집단 분석을 사용하지 않기 때문에 결합 불균형에 의존하지 않는 다형성의 영향을 예측할 수 있습니다[참조로 돌아 가기]
[14] 크론 병
One of the incurable diseases of inflammatory bowel disease Inflammation or ulcers are prone to the large or small intestine[참조로 돌아 가기]
[15] Monoclonal Antibody (Daclizumab)
활성화 된 T 세포에서 발현 된 인간 IL2 수용체 알파 서브 유닛 (CD25)에 대한 항체 제형[참조로 돌아 가기]
[16] 전체 게놈 서열 분석
차세대 시퀀서를 사용하여 전체 게놈 DNA의 서열을 내려갑니다[참조로 돌아 가기]
 

공동 연구 그룹

Riken Research Institute
Life and Medical Science Research Center
게놈 분석 응용 연구 팀
팀 리더 Terao Tomokashi (Terao Chikashi)
특별 연구원 (연구 당시) Koido D바카라 커뮤니티 (Koid Masaru)
(현재 도쿄 대학교, 새로운 지역 제작 과학 대학원 복잡한 특성 게놈 분석 부교수, 방문 연구원, 조교수)
전액 연구원 Kamatani Yoichiro (Kamatani Yoichiro)
(도쿄 대학의 의료 정보 및 생명 과학 대학원, 새로운 지역 창조 과학 대학원, 복잡한 특성 게놈 분석 교수
연구원 (연구 당시) 이시가키 카즈 요시
(Currently the Team Leader of Human Immunological Genetics Research Team)
센터의 부사장 (연구 당시) Piero Carninci
(Transcriptome Research Team Leader)
게놈 분석 응용 연구 팀
팀 리더 Chung-Chau Hon
심혈관 유전체학 및 정보 연구 팀
팀장 Ito Kaoru
특별 연구원 (연구 당시) Koyama Satoshi
(현재 MIT 및 하버드 리서치 연구소)
Riken-Ifom Cancer Genomics Collaborative Research Team
팀 리더 Murakawa Yasuhiro
(교토 대학교의 인간 생물학 고급 연구 센터, 교토 대학교, 교토 대학교 선진 연구소의 고급 연구 센터)
예방 의학 및 유전체학 응용 프로그램 개발 부서 (연구 당시)
개발 부대 리더 (연구 당시) Kawaji Hideya
(현재 방문 연구원, 대용량 데이터 기술 연구 팀 생활 및 의료 과학 팀)
Riken Immunobilisation Research Team
Nicholas F Parrish, Riken Hakubei 연구팀의 리더
바카라 커뮤니티ST 정보 및 인체 공학 연구 센터
방문한 연구원 Sese Jun
(Humanome Research Institute, Inc의 사장 겸 CEO)
 

Research Support

이 연구는 일본 과학 홍보를위한 일본 사회 (JSPS) 젊은 연구원 "다 인성 질병의 전도 효과를 식별하기위한 게놈 서열에 대한 딥 러닝 전략"(20K15773, Investigator : Oido D바카라 커뮤니티) 및 기본 연구 (a) "면역 질환 분석에 의한 면역 분석"을 기반으로합니다 (JP20H00462, Investigator : Terao (지식의 역사), 일본 류마티스 학회 (JCR) 차세대 기본 연구 촉진 프로그램 연구 보조금 "척추 관절염 분석을위한 실용적 연구를위한 실용적 연구를위한 실용적 연구 프로젝트"의 실용성 기반 (Amed)의 실용적 연구 프로젝트 "를위한 일본의 의료 연구 기관"을위한 일본인을위한 일본인을위한 일본인을위한 일본인을위한 제작 및 인핸서 맵 " 단일 세포 통합 유전체학 분석을 통한 풀림 "(JP21KK0305013, Research and Development Certorative : Terao Tomohisa) 및 게놈 의학의 실현 및 고급 게놈 연구 및 개발 프로젝트의 실현을 촉진하기위한 고급 게놈 연구 및 개발 프로젝트"Congenisity/Acquired Sprestural Polymorphisms "에 대한 면역학/정신 질환 병리에 대한 연구 및 개발 프로젝트"의 실현을 촉진하기위한 고급 게놈 연구 및 개발 프로젝트 " (JP21TM0424220, 연구 및 개발 담당자 : Terao이 프로젝트는 암 의학의 실질적인 사용을위한 혁신적인 연구 프로젝트, 암 발달 및 예후 요인으로서 체세포 모자이크의 중요성을 밝히는 개발의 발달 "(JP21CK0106642, 연구 및 개발 대표자)를 통해 얻어졌다 바카라 커뮤니티 Bridge Cloud



문의

연락처 양식