게시 및 게시 날짜 : 2005/06/02

휴머바카라 사이트 추천드 로봇의 실제 환경에서 음성 인식 달성

-일상적인 소음에서도 음성 명령을 핀

포인트

  • 음원의 위치는 로봇 헤드에 설치된 여러 마이크를 사용하여 실시간으로 추정
  • 카메라를 통한 사람의 위치에 대한 정보와 함께 로봇은 텔레비전과 같은 소음 소스가있는 곳에서도 소리 만 추출하는 청각 기능을 깨닫습니다
  • 생활 환경에서 인간과 휴머바카라 사이트 추천드 로봇 사이의 자연적인 의사 소통을 실현하기를 바랍니다

요약

독립 행정 기관, 국립 선진 산업 과학 기술 연구소 [Yoshikawa Hiroyuki 회장] (이하 "바카라 사이트 추천") 정보 기술 연구 부서 [Sakagami Katsuhiko 회장] 미디어 상호 작용 그룹 [그룹 관리자 Asano Tai] 및지능형 시스템 연구 부서[Hirai Seiki 감독] Humanoid Research Group [그룹 디렉터 Hirukawa Hirohisa] IS마이크 배열생활 환경에서 발달 된 음성 인식 기능과 휴머바카라 사이트 추천드 로봇HRP-2 Promethetic(이후 "HRP-2"라고 함)는 지각 기능을 성공적으로 확장했습니다 마이크 배열은 로봇 헤드 주위에 설치된 8 개의 전 방향 마이크 (그림 1 참조)로 구성됩니다 사운드 소스 위치는 사운드가 각 마이크에 도달하는 시간의 차이에 따라 추정되며 동시에 로봇 헤드 카메라는 사람을 발견하고 추적하고 추적하고 감지합니다 마이크 배열과 카메라에서 얻은이 정보는 바카라 사이트 추천즈를 분리하고 제거하기 위해 결합되어 안정적인 음성 인식을 수행 할 수 있습니다 또한이 바카라 사이트 추천즈 제거를 실시간으로 수행하고 로봇 내부에 통합 할 수있는 하드웨어를 개발함으로써 사람들이 오디오를 통해 로봇에 명령을 내리거나 로봇을 통해 텔레비전과 같은 정보 가전 제품을 작동 할 수있게되었습니다

이러한 유형의 로봇 청각 기능은 생활 환경에서 인간과 휴머바카라 사이트 추천드 로봇 사이의 자연적인 의사 소통을 가능하게 할 것으로 예상됩니다

이 연구는 바카라 사이트 추천 프로젝트의 일환으로 "휴머노이드 로봇 유형 인텔리전스 부스터 플랫폼 (2003-2005) 개발

마이크 배열이 설치된 휴머노이드 로봇의 헤드 사진
 
멀티 채널 신호 처리 하드웨어 사진
그림 1 왼쪽 : 마이크 배열이 설치된 휴머바카라 사이트 추천드 로봇의 헤드 화살표는 마이크 위치를 나타냅니다 오른쪽 : 로봇에 내장 된 다 채널 신호 처리 하드웨어

연구 배경

Honda Motor Co, Ltd는 1996 년 Humanoid Robot P2를 발표 한 이후 일본과 전 세계에서 휴머바카라 사이트 추천드 로봇의 연구 및 개발이 적극적으로 수행되었습니다 또한 로봇 공학 분야는 경제 무역 및 산업부에 의해 공식화되었습니다기술 전략지도|에 표시된 바와 같이, 2025 년에 살아있는 환경에서 인간을 지원하는 로봇은 2025 년에 집안의 집안일, 노인의 독립성에 대한 지원, 지원 및 간병과 같은 실질적으로 사용될 것으로 예상됩니다

반면, 휴머바카라 사이트 추천드 로봇과 관련된 이전 기술은 주로 로봇 비전 (시각적 기능)뿐만 아니라 로봇의 안전하고 안정적인 걷기 및 움직임과 관련된 기능에 대해 개발되었습니다 그러나 로봇의 청각 기능과 관련된 기술을 개발하기위한 심각한 노력은 거의 없었으며, 이는 인간과 로봇 사이의 자연 커뮤니케이션을 달성하는 데 중요한 기능입니다

차세대 로봇이 실질적으로 사용될 것으로 예상되는 생활 환경에서, 인간이 음성을 통해 로봇과 직접 의사 소통 할 수있는 능력은 로봇의 중요한 지각 기능 중 하나가되었습니다

연구 이력

바카라 사이트 추천는 고성능 정보 및 커뮤니케이션 환경을 활용하여 필요한 정보와 지식을 자유롭게 만들고, 배포하고, 공유 할 수있는 정교하고 안전한 정보 및 커뮤니케이션 사회를 실현하는 것을 목표로합니다 이 중에서, 기계와 인간 사이의 자연 커뮤니케이션을 실현하는 인간 인터페이스 기술의 개발은 중요한 홍보 테마 중 하나이며, 가정을 포함한 다양한 실제 환경에서 인간과 안전하게 협력 할 수있는 휴머노이드 로봇은 인간 인터페이스 기술의 실현 형태 중 하나입니다 따라서 바카라 사이트 추천는 2003 년에 "Humanoid Robot-Type Intelligence Booster Platform Development"프로젝트를 시작했으며 다양한 환경에서 안전하고 안정적으로 작동하며 인간과 자연스럽게 의사 소통 할 수있는 휴머노이드 로봇의 개발을 촉진하고 있습니다 이 연구는이 연구 프로젝트의 일부로 수행되었습니다

연구 컨텐츠

가까운 장래에는 텔레비전을 포함한 다양한 유형의 건전한 소스가 살아있는 환경에서 차세대 로봇의 활발한 환경이 될 것으로 예상됩니다 이러한 상황에서 인간과 로봇이 음성을 사용하여 자연스럽게 의사 소통 할 수있는 능력은 생활 환경에서 일하는 로봇의 중요한 기능 중 하나입니다 이 연구는 많은 음원이있는 환경에서도 사용할 수있는 휴머바카라 사이트 추천드 로봇입니다 이번에는 휴머바카라 사이트 추천드 로봇이 HRP-2 Promethete가 사용했습니다

이 연구에서 개발 된 음성 인터페이스는

  • HRP-2의 헤드 주위에 내장 된 8 개의 전 방향 마이크로 구성된 마이크 배열 시스템
  • HRP-2 HRP-2 헤드를위한 HRP-2 넓은 필드 카메라 이미지에서 사람의 위치를 ​​감지
  • 사운드가 마이크 배열에서 각 마이크에 도달하는 시간의 차이에서 음원의 위치를 ​​추정하여 카메라에서 얻은 사람의 위치에 대한 정보와 결합됩니다말하기 섹션탐지 및음원 분리를 수행하는 소프트웨어 사람의 목소리 이외의 소음을 분리하고 제거하려면
  • 위의 소프트웨어를 실시간으로 실행할 수있는 소형 멀티 채널 신호 처리 하드웨어 [그림 1의 오른쪽 참조]

로 구성됩니다

11532_11562음성 인식 소프트웨어줄리안를 제공함으로써 인간은 헤드셋과 같은 장치를 사용하지 않고 로봇의 청력 기능을 달성하지 않고도 음성을 안정적으로 인식 할 수 있습니다

또한 로봇이 인식 된 음성 명령을 사용하여 작동 할 수있는 소프트웨어를 개발했으며 로봇의 네트워크를 통해 텔레비전과 같은 정보 어플라이언스를 작동시킬 수 있으며 음성 인터페이스의 효과를 확인했습니다


미래 계획

이번에 실현 된 로봇의 청각 기능 (음성 인터페이스 및 음성 인식)은 한 사람이 한 번에 말할 수 있다는 가정에 근거하지만, 미래에는 시각적 기능과의 협력을 강화하여 소음이 분리되고 로봇에 대한 음성 명령은 여러 사람이 제대로 인식 될 수 있습니다 또한 다양한 로봇 운동과의 협력이 강화되고 시청각 기능을 갖춘 휴머바카라 사이트 추천드 로봇의 기능이 더욱 개선되며 실제 환경에서 작동 할 수 있습니다

용어 설명

◆ 마이크 배열
다중 마이크가 다른 위치에 배치되었습니다 데이터 처리는 각 마이크와 사운드가 각 마이크에 도달하는 시간 사이의 위치 관계의 차이를 기반으로 수행되고, 음원의 위치를 ​​추정 할 수 있으며, 특정 방향의 감도가 증가 또는 감소 될 수 있습니다[참조로 돌아 가기]
◆ HRP-2 Promethetic
경제 무역 및 산업부는 그것이 "인간 협력 및 공존하는 로봇 시스템의 연구 및 개발 (Humanoid Robotics Project, 이하 "HRP"라고 불리는)가 승진되었습니다 HRP는 바카라 사이트 추천와 협력하여 새로운 에너지 및 산업 기술 개발 기관이 의뢰 한 재단 인 제조 과학 기술 센터와 공동으로 수행되었습니다 HRP-2 Promete는 HRP 연구 개발의 일환으로 Kawada Kogyo Co, Ltd가 주로 개발 한 휴머노이드 로봇 (Humanoid Bipedal Robot)입니다 두 개의 허리 축을 포함하여 높이가 154cm, 무게가 58kg, 자유도 (조인트 및 작동 지점)의 로봇으로 가벼우면서도 많은 관절과 작동 지점이있어 인간과 가까이 이동할 수있는 로봇이됩니다[참조로 돌아 가기]
◆ 기술 전략지도
이것은 새로운 산업을 창출하는 데 필요한 제품 및 서비스에 대한 수요를 창출하기위한 기술적 목표와 조치를 창출하기위한 경제 무역 및 산업 제안의 사역입니다 20 개 영역을 개발했습니다 (URL :http : //wwwmetigojp/report/data/g50330bjhtml[참조로 돌아 가기]
◆ 말하기 섹션
인간의 발성의 시작부터 끝까지 시간[참조로 돌아 가기]
◆ 음원 분리
마이크에 기록 된 음파를 각 음원으로 분리하는 기술 여기서, 적응 형 빔 포밍 기술은 사람이 존재하는 방향의 감도를 자동으로 증가시키고, 바카라 사이트 추천즈가있는 방향의 감도를 줄이고, 인간 음성 만 신호를 포함하는 소음과 분리하는 데 사용됩니다[참조로 돌아 가기]
◆ 음성 인식 소프트웨어줄리안
2000 년부터 2002 년까지 활성화 된 "연속적인 음성 인식 컨소시엄"에 의해 개발되고 배포 된 고성능 음성 인식 소프트웨어 음성 대화 시스템의 적용 범위에 따라 인식 가능한 문장의 문법을 설명하고 수천 개의 단어로 구성된 문장의 음성 인식을 수행 할 수 있습니다 현재 오픈 소스 개발이 계속되고 있습니다 (URL :http : //juliussourceforgejp/ )[참조로 돌아 가기]

관련 기사


문의

연락처 양식