게시 및 게시 날짜 : 2018/08/29

두 가지 라이트닝 바카라 방법을 결합하여 약물-단백질 상호 작용 예측

-상호 작용 사이트를 식별하고 시각화하여 고속 고속, 고정밀 예측 및 검증-

포인트

  • 약물-단백질 상호 작용을 예측하는 새로운 라이트닝 바카라 방법 개발
  • 라이트닝 바카라과 단백질 사이의 상호 작용 부위를 식별하고 시각화 할 수있어 예측 된 결과의 유효성을 확인할 수 있습니다
  • 라이트닝 바카라 후보를 좁히어 신약 개발 가속화


요약

National Research and Development Corporation, 바카라 커뮤니티 [Nakabachi Ryoji 회장] (이하 "AIST")인공 지능 연구 센터[Research Center Director Tsujii Jun] 기계 학습 연구 팀, AIST 인 Tsubaki Masafumi 감독은 두 가지 유형의 심층 신경망을 결합하여 라이트닝 바카라과 단백질 간의 상호 작용을 예측하는 방법을 개발했으며 대규모 데이터를 사용한 실험 실험이 고지사의 상호 작용 및 고정적 예측을 예측하는 데 사용될 수 있음을 보여주었습니다

최근 몇 년 동안, 인공 지능 기술을 라이트닝 바카라 발견 분야에 적용함으로써 신약 개발이 가속화되기를 희망하며, 혁신적인 신약이 실현 될 것입니다 그러나, 표적화 된 라이트닝 바카라과 단백질은 다른 유형의 구조물이기 때문에, 고속 및 높은 정확도로 질병을 치료하는데 효과적인 라이트닝 바카라과 단백질의 조합을 예측하기가 어려웠다 따라서 화학 및 생물학에 대한 지식을 바탕으로 특성이 다릅니다라이트닝 바카라이 방법은 라이트닝 바카라 및 단백질에 대한 빠르고 정확한 상호 작용 예측 방법을 개발하기 위해 결합되었습니다 또한, 라이트닝 바카라 또는 단백질의 3 차원 구조를 사용하지 않는 기존의 방법은 상호 작용 부위가 예측 결과에서 식별 될 수 없으며 결과의 해석에 문제가 있지만이 시간에 개발 된 방법은 상호 작용 사이트를 식별하고 시각화 할 수 있다고 제안되었다 이 기술은 많은 후보자들로부터 신약을 좁히는 일을 가속화 할 것으로 예상됩니다 또한 잠재적 인 라이트닝 바카라에 대한 대규모 컴퓨터 기반 검색은 인간의 지식과 경험만으로도 도달 할 수없는 혁신적인 신약의 개발로 이어질 것입니다 이번에 개발 된 방법의 세부 사항은 2018 년 7 월 6 일에 발표 될 예정입니다Bioinformatics에 게시

요약 다이어그램
이 방법을 사용하여 예측 된 라이트닝 바카라과 단백질 사이의 상호 작용 부위의 시각화 예

개발의 사회적 배경

최근 몇 년 동안 머신 러닝 기술로서 큰 성공을 거둔 라이트닝 바카라은 약물 발견을 포함한 화학 및 생물학 분야에 적용될 것으로 예상됩니다 예를 들어, 라이트닝 바카라을 통해 고속과 높은 정확도로 약물 단백질 상호 작용을 예측할 수 있다면, 신약의 발달이 가속화 될뿐만 아니라 인간의 지식과 경험만으로도 도달 할 수없는 혁신적인 약물의 발달로 이어질 것으로 예상됩니다 (예 :자연557, S55-S57 (2018); doi : 101038/d41586-018-05267-x) 그러나 약물과 단백질은 다른 유형의 구조를 가지고 있기 때문에 라이트닝 바카라을 통해 균일하게 데이터를 균일하게 처리하는 방법은 주요 문제가되었습니다 또한 라이트닝 바카라은 예측 결과를 해석하기가 어려워졌으며 화학 및 생물학 분야에 적용하는 데 장애가되었습니다

연구 기록

AIST는 이미지 및 언어와 같은 데이터뿐만 아니라 화학 및 생물학 데이터에 기계 학습을 적용하는 것을 목표로합니다 특히 최근 몇 년 동안 우리는 라이트닝 바카라 기술을 약물 발견에 적용하는 작업을 해왔습니다

이 연구 및 개발은 NEDO (New Energy and Industrial Intective Development Organization) "차세대 인공 지능 및 로봇 핵심 기술 개발/차세대 인공 지능 기술 분야/연구 및 인간과 상호 이해 될 수있는 차세대 인공 지능 기술의 개발 (JS Promotion of the Promotion of the Promotion of the Promotion) (JSPS), JP15H01717, JP17H07392, 일본 의료 연구 개발 기관 (AMED) 라이트닝 바카라 발견 생명 과학 연구는 기본 플랫폼 (BINTS), "단백질의 고차 구조 정보를 사용한 연구, 라이트닝 바카라 발견 등"및 일본 기관 (JST), CREST 및 JPMJCR169를 사용하는 이중 정보 연구를 지원합니다

연구 컨텐츠

라이트닝 바카라은 원자와 결합 할 수 있습니다그래프 구조 데이터| 단백질에는 아미노산의 서열이 있습니다배열 구조 데이터로 표현할 수 있습니다 그러나 지금 까지이 두 가지 유형의 데이터에 공통적 인 라이트닝 바카라 방법은 없었습니다 이번에 개발 된 방법은 각 약물의 데이터에 적합한 라이트닝 바카라 방법입니다그래프 신경망단백질 데이터에 적합한 라이트닝 바카라 방법Convolutional Neural Net각 데이터에 각 라이트닝 바카라 및 단백질의 특성을 올바르게 포착하기 위해기능 벡터이 기능 벡터를 학습하기 위해 대규모 라이트닝 바카라 및 단백질 데이터를 사용함으로써, 우리는 상호 작용이 있을지 여부를 예측합니다 (그림 1) 35,000 개 이상의 라이트닝 바카라 단백질 상호 작용에 대한 데이터를 사용한 데모평가 실험이전에 사용 된 것보다 차원 (약 10 치수)을 가진 기능 벡터를 사용하더라도 상호 작용이 있을지 여부를 올바르게 예측할 수 있습니다 저 차원 특징 벡터가 사용되기 때문에 계산량이 감소하고 고속 예측이 달성 될 수 있습니다 정확도도 존재합니다도킹 시뮬레이션그리고 최근 몇 년 동안 개발 된 다른 라이트닝 바카라 방법은 더 높은 예측 정확도 (기존 방법에 비해 3% 내지 10%의 개선)를 보여 주었다 (도 2) 또한, 이러한 시뮬레이션 및 기타 라이트닝 바카라 방법은 약물 및 단백질의 3 차원 구조 데이터를 입력해야하므로 3 차원 구조 데이터 자체를 얻기가 어렵고 대규모 계산으로 계산 비용이 많이 듭니다 한편, 현재의 방법은 약물 그래프 및 단백질 서열 정보로만 예측 될 수 있으며, 아직 3 차원 구조가 아직 알려지지 않은 수많은 수의 단백질에도 적용될 수있다

그림 1
그림 1 : 이번에 개발 된 라이트닝 바카라과 단백질 사이의 상호 작용 예측

그림 2
그림 2 : 이번에 개발 된 기존 방법과 방법 사이의 예측 정확도 비교

라이트닝 바카라을 통해 고속 및 고밀도 예측을 허용하지만 예측 결과를 해석하기는 어렵습니다 화학 및 생물학 데이터를 다룰 때는 자동 컴퓨터 예측 결과를 인간이 이미 가지고있는 화학 및 생물학에 대한 지식과 비교하여 결과의 ​​유효성을 결정해야합니다 따라서 결과를 쉽게 해석 할 수있는 기계 학습 기술이 중요합니다 따라서, 상호 작용이 있을지 여부에 대한 대략적인 예측 외에도 ((1))에 대한 대략적인 예측 (도 1)에도, 우리는 두 가지 특징 벡터를 사용하여 상호 작용할 가능성이있는 단백질의 부위 인 더 미세한 정보 ((2)에서 예측을 만들었습니다 예측 된 상호 작용 사이트를 시각화함으로써 화학 및 생물학에 대한 지식과 비교하여 검증이 더 쉬워 질 수 있습니다

미래 계획

이제 우리는 라이트닝 바카라 및 단백질의 3 차원 구조를보다 상세하게 고려하고 다양한 라이트닝 바카라 및 단백질을 사용하여 상호 작용 부위의 3 차원 구조를 포괄적으로 검증하고 예측 결과의 신뢰성을 증가 시키며 새로운 라이트닝 바카라의 발달을 지원함으로써 라이트닝 바카라 발견의 분야에 기여하는 것을 목표로하는 방법을 개발할 것입니다


보도 자료 수정 정보

수정 된 부품
과학 자금 번호 "17H0739" "연구 기록"은 "17H07392"로 개정되었습니다 (편집 날짜 및 시간 : 2018 년 9 월 4 일, 9:00)


터미널 설명

◆ 라이트닝 바카라
이미지, 음성 및 언어 처리에서 성공한 기계 학습 방법 중 하나 여러 층에서 인간 신경 회로를 모방하는 기계 학습 방법 인 신경 네트워크를 쌓아서 데이터의 잠재적 특징과 패턴을 배울 수 있습니다[참조로 돌아 가기]
◆ 그래프 구조 데이터
화합물은 단일 결합 또는 이중 결합을 통해 다양한 방향으로 수소 및 산소 결합과 같은 원자를 가지고 있으며, 이러한 데이터를 그래프 구조 데이터라고합니다 또한 스테이션과 스테이션을 연결하는 철도로 구성된 경로지도와 사람들을 연결하는 소셜 네트워크를 그래프 구조 데이터라고도합니다[참조로 돌아 가기]
◆ 어레이 구조 데이터
단백질은 아미노산이 한 줄로 배열되어 있으며 이러한 데이터는 서열 구조 데이터라고합니다 또한, 단어가 연속으로 배열 된 문장, 유전자 등이있는 문장은 서열 구조 데이터를 나타냅니다[참조로 돌아 가기]
◆ 그래프 신경망
그래프 구조를 가진 데이터를 대상으로하는 라이트닝 바카라 방법 유형 그래프 구조 데이터의 잠재적 특징과 패턴을 추출하고 배울 수 있습니다[참조로 돌아 가기]
◆ Convolutional Neural Network
이미지 데이터에 일반적으로 사용되는 라이트닝 바카라 방법 중 하나 점차 데이터를 압축함으로써 잠재적 인 기능과 패턴을 추출하고 배울 수 있습니다 최근에는 언어에도 적용되었습니다[참조로 돌아 가기]
◆ 기능 벡터
컴퓨터의 데이터의 특성과 속성을 다룰 때 가장 일반적인 기계 학습 형태 일련의 수치 시퀀스 (벡터)의 형태로 표현되기 때문에 기능 벡터라고합니다 [참조로 돌아 가기]
◆ 평가 실험
여기서, 우리는 라이트닝 바카라-단백질 상호 작용의 존재 또는 부재가 드러난 쌍을 사용하여 예측 결과를 조사했습니다[참조로 돌아 가기]
◆ 도킹 시뮬레이션
시뮬레이션을 통해 라이트닝 바카라과 단백질의 입체 결합을 계산하는 방법[참조로 돌아 가기]



문의

연락처 양식