NEDO와 NEDO와 바카라 커뮤니티는 실제 데이터를위한 소프트웨어 모듈 (AI) 기술을 구성하고 오늘날 발표 한 AI (Software Modules) 기술의 일부로 바이오 분야의 자연 언어 텍스트를 이해하기위한 AI 기반 비디오 인식 및 전송 학습의 기초가 될 미리 훈련 된 모델을 만들었습니다
이번에 구축 한 미리 훈련 된 모델에는 많은 양의 실제 비디오 및 텍스트 데이터가 미리 교육을 받으므로 바카라 꽁 머니 개발에이를 사용하면 차세대 바카라 꽁 머니 소프트웨어 모듈을 소량의 교육 데이터와 함께 구축하고 사용할 수 있습니다 이는 소량의 비디오 데이터를 사용한 의료 비디오 진단 지원을위한 바카라 꽁 머니와 같은 실제 데이터를 활용하는 차세대 바카라 꽁 머니 기술의 개발 및 사회적 구현을 촉진 할 수 있습니다
Nedo 및 바카라 꽁 머니ST는 각 원소 기술의 성능을 향상시키기 위해 원소 기술을위한 새로운 모듈을 연구하고 개발하고 원소 기술을위한 새로운 모듈을 개발하고 게시 할 것입니다
 |
그림 1 : 차세대 인공 지능 및 미리 훈련 된 모델의 위치를위한 핵심 기술의 연구 및 개발 개요 |
인터넷에서 다양한 서비스를 통해 수집 된 대규모 데이터에 딥 러닝 기술을 적용하는 기계 학습 기술을 적용하는 고급 인공 지능 (바카라 꽁 머니) 기술은 IoT 및 로봇과 같은 기술과 결합하여 실제 데이터를 사용하여 서비스에 적용될 것으로 예상되며 울트라 스마트 사회를 만들 수 있습니다
NEDO (New Energy and Industrial 및 Industrial Technology Development Organization)는 2015 년 7 월에 "차세대 인공 지능 및 로봇 핵심 기술 개발 프로젝트"를 시작했으며 고급 AI 핵심 기술에 대한 연구 개발을 수행하고 있습니다 이 중 바카라 커뮤니티 (AIST)는 차세대 AI 기술 분야의 핵심 기반입니다연구 및 개발 프로젝트*1를 맡고 있으며, 실제 세계의 인간과 협력하는 바카라 꽁 머니의 원소 기능을 연구하고 개발하고 있으며, 대학 및 회사와 협력하고, 사용하기 쉬운 프로그램으로 개발 한 바카라 꽁 머니의 원소 기능을 구현하는 소프트웨어 모듈을 구축하고 게시했습니다
이 업적의 일환으로 바카라 꽁 머니 기반 비디오 인식 및 자연 언어 텍스트 이해를위한 새로운 방법을 소개 할 것입니다전송 학습*2사전 훈련 된 모델*3| 오늘 건설 및 출시되었습니다
이번에 구축 한 미리 훈련 된 모델에는 많은 양의 실제 비디오 및 텍스트 데이터가 미리 훈련 된 텍스트 데이터를 보유하고 있으므로 바카라 꽁 머니 개발에이를 사용하면 차세대 바카라 꽁 머니 소프트웨어 모듈을 소량의 교육 데이터와 함께 구축하고 사용할 수 있습니다 이 사이트를 사용할 때는 바카라 꽁 머니ST 바카라 꽁 머니 Research Center의 웹 사이트를 방문하십시오 (https : //www바카라 꽁 머니rc바카라 꽁 머니stgojp/achievements/en/)에 게시 된 공개 웹 페이지에서 모델을 다운로드하고 특정 응용 프로그램에 대한 데이터와 함께 추가 학습을 제공하십시오 딥 러닝 지식과 함께 사용할 수 있습니다 (사용 지침 및 라이센스는 각 웹 페이지 참조) 이는 소량의 비디오 데이터를 사용한 의료 비디오 진단 지원을위한 바카라 꽁 머니와 같은 실제 데이터를 활용하는 차세대 바카라 꽁 머니 기술의 개발 및 사회적 구현을 촉진 할 수 있습니다
Nedo와 바카라 꽁 머니ST는 각 원소 기술의 성능을 계속 연구하고 개발하고 새로운 원소 기술 모듈을 개발하여 서로 발표 할 것입니다
[1] 미리 훈련 된 모델의 구성 및 공공 시스템 설립
딥 러닝과 같은 기계 학습 기술로 고성능을 얻으려면 고품질 학습 데이터로 대규모로 훈련해야합니다 그러나 센서를 설치하고 네트워크를 구축하는 데 드는 비용이 있기 때문에 실제 세계에서 데이터를 수집하는 것은 쉽지 않습니다 희귀 질환에 대한 의료 데이터와 같이 절대적으로 작은 데이터도 많이 있습니다
따라서 소량의 데이터를 사용하여 고성능을 달성하는 방법으로서 수집하기 쉬운 일반 데이터를 사용하여 일반 목적 전기 모델을 구성하고 여기에 수집 된 소량의 훈련 데이터를 사용하여 교육하는 것이 중요합니다 (그림 2) 예를 들어 스틸 이미지의 인식을 위해 전송 학습의 기초를 형성하는 사전 치료 된 모델로서 "Imagenet"(http : //wwwimage-netorg/(10561_10615 |)라고 불리는 1,400 만 개가 넘는 이미지의 대형 이미지 데이터 세트 (일부)로 훈련 된 모델이 종종 사용됩니다
 |
그림 2 그것을 사용하여 전송 학습의 사전 상환 모델 및 메커니즘 |
이 사전에 취한 모델을 구축하려면 많은 양의 고품질 교육 데이터와이를 처리하기위한 대규모 계산 자원이 필요합니다 따라서 실제로, 소수의 대규모 IT 회사만이 미리 훈련 된 모델을 구축 할 수 있으며, 대규모 컴퓨팅 리소스가없는 대학 연구원과 같은 사용자를 위해 소량의 데이터를 활용하여 고성능을 달성하기 위해서는 게시 된 기존의 미리 훈련 된 모델을 사용해야합니다
따라서 바카라 꽁 머니 클라우드 컴퓨팅 인프라 "ABCI"를 사용하여 다양한 미리 훈련 된 모델을 대규모로 구축하고 게시 할 수있는 시스템을 설정했습니다 이러한 모델을 전송 학습의 기초로 사용함으로써 의료용 비디오 인식 및 텍스트의 시맨틱 분석과 같은 다양한 개별 문제를 해결하기위한 고성능 모델을 구성하는 소량의 데이터조차도 가능하기를 희망합니다
[2] 비디오 인식 및 자연어 이해를위한 미리 훈련 된 모델
이번에 우리가 구축하고 출시 한 모델은 비디오 및 자연어 이해를위한 미리 훈련 된 모델입니다 (그림 3)
비디오 이해를위한 전송 학습의 기초를 형성하는 미리 훈련 된 모델은 양조 차, 그림, 조깅 등과 같은 400 가지 유형의 일상 활동에 대한 레이블이있는 300,000 개의 짧은 비디오 (Google DeepMind 's Kinetics400 데이터 세트)를 사용하여 교육을받습니다 이 모델을 사용하면 사람들의 일상 생활과 스포츠에서 행동을 식별 할 수 있습니다 또한이 모델을 기본으로 사용하면 전송 학습은 개별 환경에서 수집 된 소량의 학습 데이터를 사용하여 수행되며 공장 및 기타 사이트의 현장 모니터링과 같은 작업을 지원하는 로봇에 적용될 수 있습니다
자연어 이해를위한 미리 훈련 된 모델Bert*4YAErnie*5| 그러나 세계에서 처음으로 우리는 바이오 부문의 대규모 텍스트 데이터를 사용하여 처음부터 매우 까다로운 바이오 부문을 전문으로하는 Bert를 건설하고 게시했습니다 자연 언어 텍스트는 그들이 대표하는 분야와 주제와 분포의 관점에서 다르므로, 이러한 분야 별 사전 관리 모델은 매우 효과적인 것으로 간주되며, 생물권의 과학 및 기술 문헌에서 중요한 사건 (예 : 효소 반응에 대한 정보)에 대한 정보를 추출 할 수있는 성능을 향상시킬 수 있습니다 또한 ABCI에 대한 BERT 학습 프로그램도 제공되며 교육 데이터를 준비하면 현장 별 버트를 쉽게 구축 할 수 있습니다
 |
그림 3 자연 언어 텍스트 처리 및 비디오 처리 및 응용 프로그램에 대한 미리 훈련 된 모델 |
이번에 개발 된 미리 훈련 된 모델 외에도, 혼잡 한 환경에서의 인간 흐름 측정, 객체 유형 및 자세의 동시 인식 및 도구 기능 인식과 같은 고급 원소 기능을 실현하는 40 가지가 넘는 소프트웨어 모듈 및 기계 학습 데이터 세트는 바카라 꽁 머니ST 바카라 꽁 머니 Research Center (https : //www바카라 꽁 머니rc바카라 꽁 머니stgojp/achievements/en/)에 게시 앞으로 우리는 새로운 원소 기술을위한 모듈을 계속 개발하고 각 원소 기술의 성능을 향상시키기위한 연구를 계속 수행 할 것입니다 또한, 우리는 대학 및 민간 회사와의 공동 연구를 통해 개별 요구에 맞게 개발 된 모듈을 조정하고 실질적으로 사용하는 것을 목표로합니다