게시 및 게시 날짜 : 2005/05/24

인간과 움직임 바카라 규칙을 통해 세계 최고 성능을 달성

-컴퓨터 비전을 사용한 무인 모니터링 및 바카라 규칙 기술의 실질적인 적용에있어서-

포인트

  • 범죄와 테러가 증가함에 따라 비디오 감시 (비디오 감시 및 자동 바카라 규칙 기술)가 점점 더 대중화되고 있지만 이전 방법은 "사람과 그들의 행동"의 실질적인 바카라 규칙 성능을 달성하지 못했습니다
  • 모니터링 된 비디오 이미지에서 개인을 식별하고 비정상적인 행동을 즉시 감지하기위한 세계 최고 성능 방법을 개발했습니다
  • 사람들 식별 및 로봇 비전을 자동으로 추적하는 지적 보안 카메라를 포함하여 컴퓨터 비전의 실제 적용 수행

요약

OTSU Nobuyuki (도쿄 대학의 특수 교수)는 국립 고급 산업 과학 기술 연구소 (Yoshikawa Hiroyuki 회장)의 연구원 (이하 "AIST")의 동료 인 "AST"는 "모니터링 된 이미지에서 자동으로 바카라 규칙하고 보안 카메라 및 보안 카메라 및 기타 보안 카메라를 사용하여 자동으로 바카라 규칙하는 사람들과 그들의 행동을 자동으로 바카라 규칙하는 새로운 방법을 개발했습니다 이것은 지금까지 2D 스틸 이미지를 위해 개발되었습니다고차 로컬 자기 상관 기능 추출 방법 (이하 "HLAC")적응 학습 바카라 규칙 방법3D HLAC (이하 "CHLAC"라고하는 이하)을 기반으로 "대상 운영"의 특성을 추출하고, 매우 다재다능하고 고속 및 높은 정확도를 특징으로합니다 (정보 과학 및 공학 대학원, 도쿄의 대학원과 동일한 지위를 맡고있는 학생 지침과 함께 구현하는 것은 특징입니다

새로운 CHLAC 방법은 비디오 이미지 모니터에서 개인을 식별하고 비정상적인 행동을 즉시 감지 할 수 있습니다 이 방법은 미국에서 사용됩니다HumanId프로그램NIST (National Institute of Standards and Technology)의 국제 컬렉션걸음 걸이 바카라 규칙의 경쟁에 대한 테스트 데이터HumanId Gait Challenge DataSet)에 대한 적용은 기존의 방법을 크게 능가하는 세계 최고의 바카라 규칙 성능으로 입증되었습니다

새로운 CHLAC 방법은 인간의 바카라 규칙뿐만 아니라 비정상적인 행동을 감지하고 사람 식별을 추적하는 모바일 객체를 추적하기 위해 적용될 수 있으므로 지적 보안 카메라와 같은 보안 필드의 자동 (무인) 시스템이므로 매우 까다로울 수 있습니다비디오 감시의 연구 개발에 상당한 기여를 할 것으로 예상됩니다

이제부터 교육부 문화, 스포츠, 과학 기술부 "도시 지역 산업-아카데미아 정부 협력 프로모션 프로젝트(고급 비디오 감시) ","과학 기술 촉진 조정 요금 ・중요한 문제를 해결하는 데있어 연구 홍보(교통 사고 예방 기술) "및"21 세기 COE 프로그램(정보 과학 및 기술 전략 핵심 (정보 과학 기술 대학원, 도쿄 대학교의 관리 테마))))이 방법, 대화 시스템, 로봇 등의 실제 적용을 목표로하는 연구 및 개발을 포함합니다실제 정보 시스템"의 분야의 시각적 응용 프로그램에 적용 할 계획입니다

이 연구 결과에 대한 자세한 내용은 MVA2005 (기계 비전 응용 프로그램에 관한 IAPR 회의(2005 년 5 월 16-18 일, Tsukuba City, Ibaraki 현)) 및 ICCV2005 (10 번째 IEEE 컴퓨터 비전에 관한 국제 회의(2005 년 10 월 15-21 일, 중국 베이징)에서 발표 될 예정입니다

인간의 비정상 행동의 예의 검출 이미지
그림 : 인간의 비정상 행동 감지의 예 (여기서는 걷기, 떨어지는 것이 정상적이지만 비정상적입니다)


연구 배경

범죄와 테러가 증가함에 따라 감시 카메라를 사용한 비디오 감시에 대한 연구가 점점 인기를 얻고 있습니다 특히, 감시 카메라의 지능적인 특성을 위해, 비디오에서 사람과 행동을 자동으로 바카라 규칙하고 비정상적인 행동을 감지하는 기술이 중요하며, 실질적인 사용이 매우 높습니다 그러나 기존의 방법은 실제 바카라 규칙 성능을 달성하지 못했습니다

대부분의 기존 방법은 먼저 비디오에서 개별 이동 객체를 잘라낸 다음 미리 준비된 모델에 비추어 대상 사람의 바카라 규칙 및 모션 특성을 추출합니다 정확도에는 한계가 있으며 계산량은 엄청납니다 또한 인간 행동의 특성을 추출하는 방법으로광학 흐름방법은 주류이지만 가장 엄격한 가정과 소음의 약점으로 인해 실제 사용되지 않았습니다

연구 기록

이에 대해, 오츠와 다른 사람들은 지금까지 "통계 기능 추출"의 이론적 관점에서, 고도로 일반화 된 고차 고도의 로컬 자기 상관 기능 추출 방법 (HLAC)은 2 차원 스틸 이미지에 적용되어 학습 적응 기능을 갖춘 이미지 바카라 규칙 시스템을 개발하여 1991 년에 과학 및 기술 기관이 50 번째 주목할만한 발명으로 선정되었습니다

이번에는 3D HLAC를 기반으로하는 "대상 조작"의 특성을 추출하는 기술 (CHLAC)을 성공적으로 개발하여 비디오 이미지로 확장합니다 (특허 응용 프로그램이 제출되었습니다)

연구 컨텐츠

움직이는 이미지는 3 차원 (3D) 수치 데이터이며, 여기서 2 차원 스틸 이미지가 시간에 따라 배열됩니다 이러한 데이터에서 걷는 사람과 같은 특정 물체를 바카라 규칙하고 측정하기 위해 걷는 사람의 공간의 위치 정보에 의존하지 않는 기능을 추출하는 것이 바람직합니다 이것을 위치 불변이라고합니다 3 차원 객체 내에 여러 개체가있는 경우, 전체 기능 값이 개별 객체의 특징 값의 각 합인 경우 후속 처리가 더 쉬워지고 바카라 규칙 정확도가 향상됩니다 또한 기능 추출 방법으로서 소량의 계산 및 실시간 처리가 가능한 것이 바람직하다

HLAC 및 CHLAC를 사용한 기능 추출 방법은 이러한 모든 요구 사항을 충족하는 기본 및 일반 목적 기능 추출 방법이며,이 추출 된 데이터를 통계 정보 통합 방법과 결합하여 비디오 이미지의 적응 형 학습 유형의 일반 목적 바카라 규칙 방법을 얻을 수 있습니다

이 CHLAC 바카라 규칙 성능은 미국입니다HumanId프로그램의 일환으로 NIST (National Institute of Standards and Technology)가 편집Gait인정의 국제 경쟁에 대한 테스트 데이터 (HumanId Gait Challenge DataSet: 71 Gait에서 식별 된 사람들), 그리고 그것은 기존의 방법을 크게 능가하는 세계 최고의 성능으로 입증되었습니다 [0011]는 AIST의 CHLAC가 기존의 방법, 특히 어려운 문제에 비해 뛰어난 바카라 규칙 속도를 가지고 있음을 보여줍니다

이전 방법과 국제 경쟁 보행 바카라 규칙 테스트 데이터 비교
그림 1 국제 경쟁Gait바카라 규칙 테스트 데이터의 기존 방법과 비교
AIST의 CHLAC는 특히 어려운 문제에 대한 뛰어난 바카라 규칙 속도를 가지고 있음을 알 수 있습니다

이번에는 방법이 개발되면 비디오 이미지에서 즉시 비정상적인 행동을 감지 할 수 있습니다 이 방법에서 이미지에 여러 개의 객체가있을 때 각 객체의 특징의 합에는 전체 기능인 부가 특성이 있으므로 정상 (정상) 작업의 기능 벡터는 특징 공간 (251 치수)의 서브 스페이스 (정상 작동 하위 공간)에 분산됩니다 그러므로,변칙적 행동정상 작동을 지속적으로 학습함으로써 얻은 "정상 작동 하위 공간"에서 나온 것입니다편차(거리를 정량화하면 값입니다) 즉시 빠르고 정확하게탐지/바카라 규칙(여러 사람이 있더라도 비정상적인 값 감지 전력은 동일합니다) [그림 2]

다시 말하지만, 미리 준비 할 모델이나 지식이 필요하지 않으며 계산량은 일정하고 작아 실시간 처리를 수행 할 수 있으며 자동 (무인) 비디오 감시에서 이상 감지와 관련된 다양한 문제에 적용될 수 있습니다

이상 탐지의 응용 프로그램 예
그림 2 : 비정상 감지의 적용 (여기서는 걷기가 정상, 떨어지는 것은 비정상)

또한 이번에 개발 된 바카라 규칙 기술을 통해 화면을 분할하고 HLAC의 부가 적 특성을 활용하여 모바일 객체를 자동으로 추적 할 수 있습니다 대상 모양 정보 외에도 색상 정보는 추적에 중요한 요소이므로 HLAC 기능이 컬러 이미지를 수용하도록 확장되었습니다 대부분의 기존 방법에는 이미지 레벨 매칭 (템플릿 매칭)이 포함되므로 대상 컷 아웃 오류 (위치 편차 포함) 및 대상 동작의 변화로 인해 잘못 추적이 발생할 수 있습니다 또한, 한 번 숨겨져 있거나 다른 물체와 교차하는 물체를 추적 할 수없는 것과 같은 문제가 있습니다 대조적으로,이 방법은 움직이는 물체의 "피처 레벨"에서 식별 및 바카라 규칙을 기반으로 매우 강력합니다 (견고한)는 안정적인 추적 방법이며 계산이 거의 필요하지 않으므로 실시간으로 추적 할 수 있습니다 [그림 3 참조]

모바일 객체의 강력하고 안정적인 자동 추적에 대한 응용 프로그램 이미지
그림 3 : 모바일 객체의 강력하고 안정적인 자동 추적에 대한 응용 프로그램

 

4 미래 계획

앞으로, 우리는 이것을 교육, 문화, 스포츠, 과학 및 기술의 "도시 지역 산업-아카데미아 정부 협력 (정보 및 커뮤니케이션 : 도시 생활의 안전 및 보안을위한 유비쿼터스 비디오 정보 감시) 및"과학 및 기술 홍보 연구 홍보 등의 추진 및 실수에 대한 연구 및 피할 수있는 기술의 이해와 피할 수있는 기술의 개발에 대한 과학 및 기술 홍보 조정 요금을위한 교육 및 기술 홍보 조정 요금에 대한 교육, 문화, 스포츠, 과학 및 기술부에 적용 할 계획입니다 상태와 의도) "이 법률 시스템의 실질적인 사용을 준비하기 위해 연구 개발을 수행합니다 또한, 사역의 21 세기 COE 프로그램 (정보 과학 및 기술 전략 핵심 (도쿄 대학교 대학원 정보 과학 기술 대학원 주제)) 도이 방법을 대화 시스템 및 로봇과 같은 "실제 정보 시스템"의 분야에서 시각 시스템의 연구 및 개발에 적용 할 것입니다

이 방법은 매우 효율적이고 다재다능하기 때문에 보안 및 재해 예방 (감시 카메라 시스템, 보안 시스템, 재난 예방 감시 시스템 등)과 같은 비디오 감시와 관련된 애플리케이션 필드와 같이 컴퓨터 비전과 널리 관련된 분야에 적용될 것으로 예상됩니다 자동 비디오 인덱싱 (인덱스 생성, 자동 감지 및 장면 변경), 의료 및 스포츠 수지, 용도 및 Welfields 시스템 등), 심지어 대화 시스템 및 로봇 비전



터미널 설명

◆ 고차 로컬 자기 상관 기능 추출 방법 (HLAC)
이것은 OTSU에서 개발 한 이미지 바카라 규칙을위한 기능 추출 방법입니다 이미지의 그늘을 나타내는 함수는 g (x, y)이고, 정상 자기 상관은 x와 y와 관련하여 g (x, y) g (x+a, y+b)의 생성물의 합이지만 HLAC는 이것을 고차 (n- 주문) g (x, y) g (x+a1, y+b1) ‥ g (x+an, y+bn)로 확장되고 변위 ai, bi위치 지점 (예 : 기준점 (X, Y)을 중심으로하는 3 × 3 픽셀 근처에 제한되어 있습니다 3 점 관계 (n = 2)로 제한되면, 35 차원의 값을 이미지에서 얻을 수있어 35 차원 특징 벡터 (흑백 이진 이미지의 경우 25 차원)위치 불변(바카라 규칙 목표의 위치에 의존하지 않음),additiveness(두 개의 객체가있는 경우 각 기능 벡터의 합)은 이미지 바카라 규칙에 유리한 속성을 가지고 있으며대상 컷 아웃 없음(세분화 프리) 일반 목적 이미지 바카라 규칙 기술로 널리 사용됩니다 (1991 년 문제에 50 번째) 시간을 포함하여 컬러 이미지, 최근에는 3D (X, Y, T) 비디오 이미지로 확장되었으며 효과적으로 사용됩니다[참조로 돌아 가기]
◆ 적응 학습 바카라 규칙 방법
정상 바카라 규칙 방법은 작업에 맞게 조정 된 처리 절차를 순차적으로 실행하는 직접적인 방법입니다 따라서 솔루션이 미리 알려진 문제에 대해 효율적이지만 명백하지 않은 문제 (예 : 얼굴 바카라 규칙)에는 적용하기가 어렵고 전제의 일부조차 유지하지 않으면 실패하는 취약점이 있습니다 또한 시스템은 작업을 위해 특별히 설계되었으므로 다재다능하지 않습니다 대조적으로, 적응 학습 유형 바카라 규칙 방법은 인간 뇌를 모델로 한 신경망을 사용한 바카라 규칙 방법과 예를 들어 매개 변수가 예제로부터 학습을 통해 통계적으로 적응 적으로 최적화되는 바카라 규칙 방법과 같은 매개 변수를 갖춘 유연하고 일반적인 모델이다 예는 다변량 분석 기술을 포함합니다[참조로 돌아 가기]
Humanid (거리에서의 인간 식별)프로그램
얼굴 및 신체 이미지에 대한 시공간 정보를 사용한 개별 식별을위한 프로젝트 계획, 2000 년 2 월 미국 국방부 고급 연구 프로젝트 기관 (DARPA)에 의해 출판되었습니다 특히, 장거리 감시 카메라 영상에서 사람들 (테러리스트 등)을 바카라 규칙하고 식별하는 기술 개발을 장려합니다 생체 바카라 규칙 (지문, 음성 프린트, 아이리스 등)을 사용하여 개인 인증 기술 개발의 일환으로 미국의 대학과 회사는 연구 및 개발을 수행하고 수행하기 위해 경쟁합니다[참조로 돌아 가기]
Gait인정
Gait| 사람의 걷기 스타일이며 걷는 스타일이나 걷기 스타일로 번역됩니다 다른 사람과 약간 다르다Gait다르며,이 습관은 무의식에 의해 숨겨 질 수 없다고합니다 따라서 감시 카메라에서 본 사람Gait16969_17019 |에서 개인 (식별)을 바카라 규칙 할 수 있으며, 위장하기 쉬운 얼굴에 의한 개인의 바카라 규칙보다 더 유리한 것으로 간주됩니다HumanId그러나 중요한 문제로 등장했으며 적극적으로 연구되고 있습니다 NIST (National Institute of Standards and Technology)가이를 홍보하고 있습니다Gait바카라 규칙 경쟁을위한 데이터 세트 (HumanId Gait Challenge DataSet: 71 명으로 구성된 456 개의 비디오로 구성됨) 및 인정 요금 순위를 발표하고 있습니다 이 테스트는 또한 데이터를 사용하여 수행되었습니다[참조로 돌아 가기]
◆ 비디오 감시
감시 (감시)는 지속적인 조사를 통한 상황 결과에 대한 엄격한 모니터링을 말하며, 최근에는 비디오 감시 (또는 비디오 감시)로 알려진 카메라 기반 비디오 감시 기술이 안전하고 안전하다는 점에서 주목을 끌고 있습니다 감시 작업의 정보 수집 기능을 개선하기 위해 더 넓은 카메라 시스템을 구축해야하지만 네트워크 연결 카메라가 확산되면 더 넓은 카메라 시스템을 구축 할 수 있습니다 노동을 더욱 줄이기 위해 기술이 컴퓨터 기반 비디오 바카라 규칙 및 기술 이해를 사용하여 객체를 감지하고 바카라 규칙하거나 이상을 감지하고 자동으로 모니터링 센터로 전송할 수 있기를 희망합니다[참조로 돌아 가기]
◆ 도시 지역의 홍보 산업-아카데미아 정부 협력
2002 년부터 교육, 문화, 스포츠, 과학 및 기술부가 구현해온 프로젝트이 지역의 개성을 강조하고 대학 및 기타 조직의 "지혜"를 사용하여 새로운 기술 종자를 창출하고 새로운 사업을 창출하는 등의 연구 개발 기반 지역 산업을 개발하는 것입니다 이바라키 현에서, 츠쿠바 리서치 아카데미 도시 지역은 2002 년 "도시 생활에 대한 지능형 정보 기술 지원 (H14-16)의 일환으로 선정되었으며, 추가 개발로서"안전하고 안전한 도시 생활을위한 유비쿼터스 비디오 정보 감시 (H17-19) "(H17-19) (H17-19) (H17-19)는 2005 년에 선정되었습니다 (Tsuka, Tsuba, Ag, Ag, Agititation in Institute, ANIST) 생물학적 특이 적 산업 기술)[참조로 돌아 가기]
◆ 중요한 문제 등을 해결하는 연구 홍보
교육, 문화, 스포츠, 과학 기술의 홍보 및 조정 기금의 주요 프로젝트 중 하나 "상황과 의도를 이해함으로써 위험을 발견하고 피하는 위험 (H16-18)"프로젝트가 채택되었으며,이 프로젝트는이 프로젝트에 참여한 토지, 인프라, 교통 및 관광부의 토지 부, AIST 및 연구 기관이 참여했습니다 자동차 사고가 급격히 감소하기 위해이 회사는 상황과 의도에 따라 운전 지원을 제공하는 예방 안전 기술을 창출하는 것을 목표로합니다[참조로 돌아 가기]
◆ 21 세기 COE 프로그램
교육, 문화, 스포츠, 과학 및 기술의 21 세기 COE 프로그램은 일본 대학에서 세계 최고 수준의 연구 및 교육 센터의 연구 및 교육 센터를 구성하여 연구 표준을 개선하고 세계를 이끄는 창의적인 인적 자원을 개발하기위한 주요 지원을 제공하는 것을 목표로합니다 정보 과학 및 기술 전략 코어 (H14-18) 프로젝트는 프로그램의 정보 분야, 전기 및 전자 장치에서 채택되었습니다[참조로 돌아 가기]
◆ 실제 정보 시스템
정보 과학 및 기술 전략 핵심의 세 가지 프로젝트 (실제 정보 시스템, 글로벌 신뢰할 수있는 정보 인프라 및 초고속 계산 원칙) 중 하나는 위의 도쿄 대학에서 교육, 문화, 스포츠, 과학 및 기술의 21 세기 COE 프로그램에 채택되었습니다 우리는 인간 중심 정보 시스템의 실현을 통해 실제 정보학을 개발하는 것을 목표로합니다 이 회사는 인간, 휴머노이드, 에이전트 및 유비쿼터스 가전 제품이 함께 살고 로봇 공학, 가상 현실, 음성 음향 처리, 센서 및 액추에이터 기술 등의 연구 및 개발을 수행하는 실제 정보 환경을 만들 것입니다 (참조 : "컴퓨터 및 로봇 공학은 사람들과 공존합니다 : 실제 정보 시스템, OHM에 의해 출판)[참조로 돌아 가기]
◆ 광학 흐름
객체가 밝기가 변하지 않는 단단한 몸체라는 가정에 근거하여 분화에 의해 결정되는 움직이는 이미지에서 움직이는 물체의 속도 필드 이것을 감지함으로써, 물체의 각 지점의 방향과 속도가 알려져 있습니다 이미지의 각 지점에서 화살표의 방향은 물체의 움직임 방향을 나타내고 화살표의 길이는 명백한 움직임 속도를 나타냅니다 그러나 인간과 실제 소음과 같은 연질 구조에 대해서는 약합니다[참조로 돌아 가기]
◆ 통계 기능 추출
광학 흐름과 같은 국부적 인 미분 값은 통계적 특징 추출이 이미지 전체에 특정 속성의 로컬 특징이 얼마나 자주 존재하는지와 같은 특징으로 통계적 값을 추출하는 반면, 통합 값으로 표현됩니다 부분 오류와 노이즈에 저항합니다[참조로 돌아 가기]

관련 기사


문의

연락처 양식