OTSU Nobuyuki (도쿄 대학의 특수 교수)는 국립 고급 산업 과학 기술 연구소 (Yoshikawa Hiroyuki 회장)의 연구원 (이하 "AIST")의 동료 인 "AST"는 "모니터링 된 이미지에서 자동으로 바카라 규칙하고 보안 카메라 및 보안 카메라 및 기타 보안 카메라를 사용하여 자동으로 바카라 규칙하는 사람들과 그들의 행동을 자동으로 바카라 규칙하는 새로운 방법을 개발했습니다 이것은 지금까지 2D 스틸 이미지를 위해 개발되었습니다고차 로컬 자기 상관 기능 추출 방법 (이하 "HLAC")적응 학습 바카라 규칙 방법3D HLAC (이하 "CHLAC"라고하는 이하)을 기반으로 "대상 운영"의 특성을 추출하고, 매우 다재다능하고 고속 및 높은 정확도를 특징으로합니다 (정보 과학 및 공학 대학원, 도쿄의 대학원과 동일한 지위를 맡고있는 학생 지침과 함께 구현하는 것은 특징입니다
새로운 CHLAC 방법은 비디오 이미지 모니터에서 개인을 식별하고 비정상적인 행동을 즉시 감지 할 수 있습니다 이 방법은 미국에서 사용됩니다HumanId프로그램NIST (National Institute of Standards and Technology)의 국제 컬렉션걸음 걸이 바카라 규칙의 경쟁에 대한 테스트 데이터HumanId Gait Challenge DataSet)에 대한 적용은 기존의 방법을 크게 능가하는 세계 최고의 바카라 규칙 성능으로 입증되었습니다
새로운 CHLAC 방법은 인간의 바카라 규칙뿐만 아니라 비정상적인 행동을 감지하고 사람 식별을 추적하는 모바일 객체를 추적하기 위해 적용될 수 있으므로 지적 보안 카메라와 같은 보안 필드의 자동 (무인) 시스템이므로 매우 까다로울 수 있습니다비디오 감시의 연구 개발에 상당한 기여를 할 것으로 예상됩니다
이제부터 교육부 문화, 스포츠, 과학 기술부 "도시 지역 산업-아카데미아 정부 협력 프로모션 프로젝트(고급 비디오 감시) ","과학 기술 촉진 조정 요금 ・중요한 문제를 해결하는 데있어 연구 홍보(교통 사고 예방 기술) "및"21 세기 COE 프로그램(정보 과학 및 기술 전략 핵심 (정보 과학 기술 대학원, 도쿄 대학교의 관리 테마))))이 방법, 대화 시스템, 로봇 등의 실제 적용을 목표로하는 연구 및 개발을 포함합니다실제 정보 시스템"의 분야의 시각적 응용 프로그램에 적용 할 계획입니다
이 연구 결과에 대한 자세한 내용은 MVA2005 (기계 비전 응용 프로그램에 관한 IAPR 회의(2005 년 5 월 16-18 일, Tsukuba City, Ibaraki 현)) 및 ICCV2005 (10 번째 IEEE 컴퓨터 비전에 관한 국제 회의(2005 년 10 월 15-21 일, 중국 베이징)에서 발표 될 예정입니다
|
그림 : 인간의 비정상 행동 감지의 예 (여기서는 걷기, 떨어지는 것이 정상적이지만 비정상적입니다)
|
범죄와 테러가 증가함에 따라 감시 카메라를 사용한 비디오 감시에 대한 연구가 점점 인기를 얻고 있습니다 특히, 감시 카메라의 지능적인 특성을 위해, 비디오에서 사람과 행동을 자동으로 바카라 규칙하고 비정상적인 행동을 감지하는 기술이 중요하며, 실질적인 사용이 매우 높습니다 그러나 기존의 방법은 실제 바카라 규칙 성능을 달성하지 못했습니다
대부분의 기존 방법은 먼저 비디오에서 개별 이동 객체를 잘라낸 다음 미리 준비된 모델에 비추어 대상 사람의 바카라 규칙 및 모션 특성을 추출합니다 정확도에는 한계가 있으며 계산량은 엄청납니다 또한 인간 행동의 특성을 추출하는 방법으로광학 흐름방법은 주류이지만 가장 엄격한 가정과 소음의 약점으로 인해 실제 사용되지 않았습니다
이에 대해, 오츠와 다른 사람들은 지금까지 "통계 기능 추출"의 이론적 관점에서, 고도로 일반화 된 고차 고도의 로컬 자기 상관 기능 추출 방법 (HLAC)은 2 차원 스틸 이미지에 적용되어 학습 적응 기능을 갖춘 이미지 바카라 규칙 시스템을 개발하여 1991 년에 과학 및 기술 기관이 50 번째 주목할만한 발명으로 선정되었습니다
이번에는 3D HLAC를 기반으로하는 "대상 조작"의 특성을 추출하는 기술 (CHLAC)을 성공적으로 개발하여 비디오 이미지로 확장합니다 (특허 응용 프로그램이 제출되었습니다)
움직이는 이미지는 3 차원 (3D) 수치 데이터이며, 여기서 2 차원 스틸 이미지가 시간에 따라 배열됩니다 이러한 데이터에서 걷는 사람과 같은 특정 물체를 바카라 규칙하고 측정하기 위해 걷는 사람의 공간의 위치 정보에 의존하지 않는 기능을 추출하는 것이 바람직합니다 이것을 위치 불변이라고합니다 3 차원 객체 내에 여러 개체가있는 경우, 전체 기능 값이 개별 객체의 특징 값의 각 합인 경우 후속 처리가 더 쉬워지고 바카라 규칙 정확도가 향상됩니다 또한 기능 추출 방법으로서 소량의 계산 및 실시간 처리가 가능한 것이 바람직하다
HLAC 및 CHLAC를 사용한 기능 추출 방법은 이러한 모든 요구 사항을 충족하는 기본 및 일반 목적 기능 추출 방법이며,이 추출 된 데이터를 통계 정보 통합 방법과 결합하여 비디오 이미지의 적응 형 학습 유형의 일반 목적 바카라 규칙 방법을 얻을 수 있습니다
이 CHLAC 바카라 규칙 성능은 미국입니다HumanId프로그램의 일환으로 NIST (National Institute of Standards and Technology)가 편집Gait인정의 국제 경쟁에 대한 테스트 데이터 (HumanId Gait Challenge DataSet: 71 Gait에서 식별 된 사람들), 그리고 그것은 기존의 방법을 크게 능가하는 세계 최고의 성능으로 입증되었습니다 [0011]는 AIST의 CHLAC가 기존의 방법, 특히 어려운 문제에 비해 뛰어난 바카라 규칙 속도를 가지고 있음을 보여줍니다
|
그림 1 국제 경쟁Gait바카라 규칙 테스트 데이터의 기존 방법과 비교 AIST의 CHLAC는 특히 어려운 문제에 대한 뛰어난 바카라 규칙 속도를 가지고 있음을 알 수 있습니다
|
이번에는 방법이 개발되면 비디오 이미지에서 즉시 비정상적인 행동을 감지 할 수 있습니다 이 방법에서 이미지에 여러 개의 객체가있을 때 각 객체의 특징의 합에는 전체 기능인 부가 특성이 있으므로 정상 (정상) 작업의 기능 벡터는 특징 공간 (251 치수)의 서브 스페이스 (정상 작동 하위 공간)에 분산됩니다 그러므로,변칙적 행동정상 작동을 지속적으로 학습함으로써 얻은 "정상 작동 하위 공간"에서 나온 것입니다편차(거리를 정량화하면 값입니다) 즉시 빠르고 정확하게탐지/바카라 규칙(여러 사람이 있더라도 비정상적인 값 감지 전력은 동일합니다) [그림 2]
다시 말하지만, 미리 준비 할 모델이나 지식이 필요하지 않으며 계산량은 일정하고 작아 실시간 처리를 수행 할 수 있으며 자동 (무인) 비디오 감시에서 이상 감지와 관련된 다양한 문제에 적용될 수 있습니다
|
그림 2 : 비정상 감지의 적용 (여기서는 걷기가 정상, 떨어지는 것은 비정상)
|
또한 이번에 개발 된 바카라 규칙 기술을 통해 화면을 분할하고 HLAC의 부가 적 특성을 활용하여 모바일 객체를 자동으로 추적 할 수 있습니다 대상 모양 정보 외에도 색상 정보는 추적에 중요한 요소이므로 HLAC 기능이 컬러 이미지를 수용하도록 확장되었습니다 대부분의 기존 방법에는 이미지 레벨 매칭 (템플릿 매칭)이 포함되므로 대상 컷 아웃 오류 (위치 편차 포함) 및 대상 동작의 변화로 인해 잘못 추적이 발생할 수 있습니다 또한, 한 번 숨겨져 있거나 다른 물체와 교차하는 물체를 추적 할 수없는 것과 같은 문제가 있습니다 대조적으로,이 방법은 움직이는 물체의 "피처 레벨"에서 식별 및 바카라 규칙을 기반으로 매우 강력합니다 (견고한)는 안정적인 추적 방법이며 계산이 거의 필요하지 않으므로 실시간으로 추적 할 수 있습니다 [그림 3 참조]
|
그림 3 : 모바일 객체의 강력하고 안정적인 자동 추적에 대한 응용 프로그램
|
앞으로, 우리는 이것을 교육, 문화, 스포츠, 과학 및 기술의 "도시 지역 산업-아카데미아 정부 협력 (정보 및 커뮤니케이션 : 도시 생활의 안전 및 보안을위한 유비쿼터스 비디오 정보 감시) 및"과학 및 기술 홍보 연구 홍보 등의 추진 및 실수에 대한 연구 및 피할 수있는 기술의 이해와 피할 수있는 기술의 개발에 대한 과학 및 기술 홍보 조정 요금을위한 교육 및 기술 홍보 조정 요금에 대한 교육, 문화, 스포츠, 과학 및 기술부에 적용 할 계획입니다 상태와 의도) "이 법률 시스템의 실질적인 사용을 준비하기 위해 연구 개발을 수행합니다 또한, 사역의 21 세기 COE 프로그램 (정보 과학 및 기술 전략 핵심 (도쿄 대학교 대학원 정보 과학 기술 대학원 주제)) 도이 방법을 대화 시스템 및 로봇과 같은 "실제 정보 시스템"의 분야에서 시각 시스템의 연구 및 개발에 적용 할 것입니다
이 방법은 매우 효율적이고 다재다능하기 때문에 보안 및 재해 예방 (감시 카메라 시스템, 보안 시스템, 재난 예방 감시 시스템 등)과 같은 비디오 감시와 관련된 애플리케이션 필드와 같이 컴퓨터 비전과 널리 관련된 분야에 적용될 것으로 예상됩니다 자동 비디오 인덱싱 (인덱스 생성, 자동 감지 및 장면 변경), 의료 및 스포츠 수지, 용도 및 Welfields 시스템 등), 심지어 대화 시스템 및 로봇 비전